연결 강의: MIT 18.06 Linear Algebra - Lecture 28: Similar Matrices and Jordan Form
1. 이번 강의의 위치
이번 강의의 핵심 주제는 similar matrices이다.
similar matrix는 같은 선형변환을 서로 다른 basis에서 표현한 행렬이라고 볼 수 있다. 그래서 diagonalization도 사실 similar matrix의 특별한 경우이다.
이 강의는 두 흐름을 이어 준다.
- 앞부분에서는 positive definite matrix가 어디서 나오는지 조금 더 보충한다.
- 본론에서는 similar matrix의 정의와 Jordan form을 다룬다.
특히 Jordan form은 diagonalization이 실패하는 경우를 다루기 위한 확장된 형태이다.
2. Positive Definite Matrix 보충
positive definite matrix는 대칭행렬 에 대해 다음 조건을 만족하는 행렬이다.
이를 판별하는 방법은 여러 가지이다.
- 모든 eigenvalue가 양수이다.
- 모든 pivot이 양수이다.
- 모든 leading principal minor가 양수이다.
- 모든 에 대해 이다.
이전 강의에서는 이 네 관점이 서로 연결된다는 것을 봤다. 이번 강의 앞부분에서는 positive definite matrix의 성질 몇 가지를 더 확인한다.
3. Positive Definite Matrix의 역행렬
가 positive definite라고 하자.
그러면 는 대칭행렬이고, 모든 고유값이 양수이다.
의 고유값은 의 고유값의 역수이다.
이면 양변에 을 곱해서 다음을 얻는다.
따라서 의 고유값은 다음이다.
가 모두 양수이면 도 모두 양수이다.
또 가 대칭행렬이면 도 대칭행렬이다.
따라서 도 positive definite이다.
4. Positive Definite Matrix의 합
와 가 모두 positive definite라고 하자.
그러면 모든 에 대해 다음이 성립한다.
이제 에 대해 보자.
오른쪽 두 항이 모두 양수이므로,
이다.
따라서 도 positive definite이다.
이 성질은 eigenvalue 관점에서는 바로 보이지 않는다. 일반적으로 의 고유값은 의 고유값과 의 고유값을 단순히 더한 것이 아니기 때문이다.
하지만 quadratic form 관점에서는 아주 간단하게 보인다.
5. Least Squares에서 나오는
positive definite matrix는 least squares에서도 자연스럽게 등장한다.
least squares에서 핵심 행렬은 다음이었다.
여기서 는 보통 직사각행렬이다.
직사각행렬 자체는 positive definite일 수 없다. positive definite matrix는 정사각 대칭행렬이어야 하기 때문이다.
하지만 는 정사각행렬이다.
또 대칭행렬이다.
이제 가 positive definite인지 보자.
positive definite인지 확인하려면 다음 quadratic form을 보면 된다.
괄호를 잘 묶으면,
이다.
따라서,
이다.
길이의 제곱은 항상 0 이상이다.
그러므로 는 항상 positive semidefinite이다.
6. 가 Positive Definite가 되는 조건
가 positive definite가 되려면 다음이 필요하다.
그런데,
이므로, 이 값이 0이 되는 경우는 인 경우뿐이다.
따라서 가 positive definite가 되려면 의 해가 0벡터뿐이어야 한다.
즉 의 null space가 없어야 한다.
이는 의 열벡터들이 독립이라는 뜻이다.
따라서 결론은 다음이다.
least squares에서 normal equation
가 잘 풀리려면 가 invertible이어야 한다. 이것은 의 열벡터들이 독립이어야 한다는 조건과 같다.
positive definite matrix는 수치적으로도 좋은 행렬이다. pivot이 양수로 잘 나오므로 row exchange 없이 안정적으로 elimination을 진행할 수 있다.
7. Similar Matrix의 정의
이제 본론인 similar matrix로 넘어간다.
두 정사각행렬 , 가 있다고 하자. 두 행렬은 모두 행렬이다.
와 가 similar하다는 것은 어떤 가역행렬 이 존재해서 다음이 성립한다는 뜻이다.
이때 은 invertible matrix여야 한다.
이 식은 단순히 임의로 만든 형태가 아니다. 이미 diagonalization에서 본 식이다.
행렬 가 대각화 가능하면,
이고, 이를 바꿔 쓰면,
이다.
즉 는 diagonal matrix 와 similar하다.
diagonalization은 similar matrix의 가장 좋은 경우이다. 같은 family 안에서 가장 단순한 대표가 diagonal matrix인 것이다.
8. Similar Matrix의 직관
similar matrix는 같은 선형변환을 다른 coordinate system, 다른 basis에서 본 표현이다.
행렬 은 basis를 바꾸는 역할을 한다.
이 식은 다음 순서로 볼 수 있다.
- 으로 좌표를 기존 basis에서 원래 공간으로 보낸다.
- 를 적용한다.
- 으로 다시 새 basis의 좌표로 되돌린다.
따라서 와 는 겉모습은 다르지만, 본질적으로 같은 선형변환을 나타낸다.
이 때문에 와 는 중요한 성질을 공유한다.
가장 중요한 공유 성질은 eigenvalue이다.
9. Similar Matrix의 핵심 성질
similar matrix는 같은 eigenvalue를 가진다.
이를 직접 확인해 보자.
의 고유값과 고유벡터가 다음을 만족한다고 하자.
이라고 하자.
이때 라고 두면, 이다.
고유값 방정식에 를 넣으면,
양변에 을 곱하면,
즉,
이다.
따라서 는 의 고유값이기도 하다.
고유벡터는 그대로 유지되지 않는다. 의 고유벡터가 이면, 의 고유벡터는 다음이다.
즉 similar matrix는 eigenvalue는 같지만 eigenvector는 basis 변화에 따라 달라진다.
10. 예시: Diagonal Matrix와 Similar Matrix
다음 행렬을 생각하자.
이 행렬의 고유값은 다음이다.
따라서 는 다음 diagonal matrix와 similar하다.
즉 어떤 eigenvector matrix 에 대해,
가 된다.
이것이 diagonalization이다.
그런데 와 similar한 행렬은 만 있는 것이 아니다. 임의의 invertible matrix 을 잡으면,
도 와 similar하다.
예를 들어,
이면,
이다.
그러면,
은 다음과 같다.
겉으로 보면 와 매우 다르게 생겼지만, 의 고유값도 과 이다.
trace를 확인하면,
이고,
이다.
determinant도 확인하면,
이고,
이다.
trace와 determinant가 고유값의 합과 곱을 반영한다는 점에서도 같은 eigenvalue를 가진다는 사실을 확인할 수 있다.
11. Similar Matrix는 하나의 Family를 이룬다
similar matrix들은 하나의 family를 이룬다.
예를 들어 고유값이 , 인 모든 행렬은 서로 similar하다.
대표적인 행렬은 diagonal matrix이다.
하지만 다음과 같은 행렬들도 같은 family에 속한다.
이들은 모두 고유값 , 을 가진다.
고유값이 서로 다른 경우에는 대각화가 가능하므로, family의 가장 좋은 대표는 diagonal matrix이다.
12. 반복 고유값이 있을 때의 문제
문제는 eigenvalue가 반복될 때 생긴다.
예를 들어 고유값이 둘 다 인 행렬을 생각하자.
가장 단순한 행렬은 다음이다.
이 행렬은 혼자만의 family를 이룬다.
왜냐하면 어떤 invertible matrix 에 대해서도,
이기 때문이다.
즉 와 similar한 행렬은 자기 자신뿐이다.
하지만 고유값이 , 인 행렬이 모두 와 similar한 것은 아니다.
예를 들어 다음 행렬을 보자.
이 행렬의 고유값은 둘 다 이다.
하지만 는 와 similar하지 않다.
이유는 eigenvector의 개수가 다르기 때문이다.
는 모든 벡터가 고유벡터이므로 독립인 고유벡터가 2개 있다.
반면 는 독립인 고유벡터가 1개뿐이다.
13. Jordan Block
다음 행렬을 Jordan block이라고 한다.
대각선에는 같은 고유값 가 반복되고, 바로 위 대각선에는 1이 들어간다.
Jordan block 하나는 고유벡터를 하나만 가진다.
예를 들어,
은 고유값 를 두 번 가지지만, 독립인 고유벡터는 하나뿐이다.
즉 diagonalization이 불가능하다.
Jordan form은 이런 diagonalization 실패 상황에서 diagonal matrix에 최대한 가까운 형태를 잡아 주는 방법이다.
14. 같은 고유값을 가진 다른 행렬들
다음 행렬들도 고유값이 , 이다.
trace는 다음이다.
고유값의 합도 다음이다.
determinant는 다음이다.
고유값의 곱도 다음이다.
또 다음 행렬도 고유값이 , 이다.
이 행렬은 대각성분이 모두 인 triangular matrix이므로 고유값은 바로 , 이다.
이런 행렬들은 와는 similar하지 않지만, Jordan block
과는 similar하다.
즉 고유값이 같다고 해서 항상 같은 family인 것은 아니다. 반복 고유값이 있을 때는 eigenvector 구조까지 봐야 한다.
15. Jordan Form의 필요성
고유값이 모두 다르면 행렬은 보통 대각화 가능하다.
이 경우에는 diagonal matrix 가 similar family의 가장 좋은 대표이다.
하지만 고유값이 반복되면 대각화가 실패할 수 있다.
그때 diagonal matrix 대신 Jordan matrix를 사용한다.
Jordan form은 가능한 한 diagonal matrix에 가까운 형태이다.
복소수까지 허용하면 모든 정사각행렬은 어떤 Jordan matrix와 similar하다.
또는,
이다.
여기서 는 Jordan blocks를 대각선 방향으로 모아 놓은 block diagonal matrix이다.
각 는 하나의 Jordan block이다.
16. Jordan Block과 고유벡터 개수
Jordan form에서 block의 개수는 독립인 eigenvector의 개수와 연결된다.
Jordan block 하나는 eigenvector를 하나 만든다.
따라서 Jordan blocks의 개수는 독립인 eigenvector의 개수이다.
예를 들어 행렬에서 고유값이 모두 0이라고 하자.
다음 행렬을 보자.
이 행렬은 두 개의 Jordan block을 가진 형태이다.
rank는 2이고, nullity도 2이다. 따라서 독립인 고유벡터는 2개이다.
이번에는 다음 행렬을 보자.
이 행렬은 Jordan block 하나와 Jordan block 하나를 가진 형태이다.
이 행렬도 rank는 2이고 nullity는 2이다. 따라서 독립인 고유벡터 수만 보면 과 같다.
하지만 두 행렬은 similar하지 않다.
왜냐하면 Jordan block의 크기 구조가 다르기 때문이다.
즉 repeated eigenvalue 상황에서는 단순히 고유값과 고유벡터 개수만으로는 similar family를 완전히 구분할 수 없다. Jordan block structure까지 봐야 한다.
17. Similar Matrix에서 보존되는 것
similar matrix는 다음 성질을 보존한다.
- eigenvalue
- characteristic polynomial
- determinant
- trace
- rank of
- 각 고유값에 대한 eigenspace dimension
- Jordan block structure
특히 determinant와 trace가 보존되는 이유는 eigenvalue가 보존되기 때문이다.
또 직접 계산으로도 볼 수 있다.
determinant는 다음과 같다.
trace도 similar transformation에서 보존된다.
따라서 similar matrix는 겉모습은 달라도 같은 핵심 구조를 가진다.
18. Jordan Form의 의미와 한계
Jordan form은 대각화가 실패하는 경우까지 포함해서 모든 정사각행렬을 정리하려는 시도이다.
고유값이 모두 다르면 Jordan form은 그냥 diagonal matrix이다.
하지만 고유값이 반복되고 고유벡터가 부족하면 Jordan block이 등장한다.
이 1은 부족한 고유벡터를 표시하는 자리라고 볼 수 있다.
다만 Jordan form은 수치계산에서는 조심해야 한다.
고유값이 정확히 반복되는지, rank가 정확히 얼마인지에 매우 민감하기 때문이다. 작은 오차만 있어도 Jordan block structure가 바뀔 수 있다.
그래서 현대 선형대수의 계산 관점에서는 Jordan form보다 SVD 같은 분해가 훨씬 안정적이고 중요하게 쓰인다.
이 강의 마지막에서 다음 강의 주제로 SVD가 강조되는 이유도 여기에 있다.
19. 핵심 정리
similar matrix는 다음 관계를 만족하는 행렬이다.
이는 같은 선형변환을 다른 basis에서 표현한 것이다.
diagonalization은 similar matrix의 특별한 경우이다.
similar matrix는 같은 eigenvalue를 가진다.
고유값이 모두 다르면 행렬은 대각화 가능하고, similar family의 가장 좋은 대표는 diagonal matrix이다.
하지만 고유값이 반복되면 대각화가 실패할 수 있다.
그때 Jordan form이 등장한다.
Jordan form은 diagonal matrix에 최대한 가까운 표준형이다.
각 Jordan block은 다음 형태이다.
결국 이 강의의 흐름은 다음이다.
- positive definite matrix는 inverse, sum, 에서도 자연스럽게 나타난다.
- similar matrix는 basis change로 연결된 행렬이다.
- similar matrix는 같은 eigenvalue를 가진다.
- diagonalization은 similar matrix의 좋은 경우이다.
- repeated eigenvalue에서 diagonalization이 실패하면 Jordan form이 필요하다.
- Jordan form은 이론적으로 중요하지만, 실제 수치계산에서는 민감하므로 SVD가 더 안정적으로 쓰인다.