5.3. Cramer's Rule, Inverses, and Volumes
선형대수학 글 목록
연결 강의: MIT 18.06 Linear Algebra - Lecture 20: Cramer’s rule, inverse matrix, and volume
행렬식의 응용: 역행렬 공식, 크래머 공식, 넓이와 부피
이번 내용은 행렬식의 마지막 응용에 관한 내용이다. 앞에서는 행렬식의 성질과 계산 공식을 배웠다. 이제는 그 행렬식이 실제로 어디에 쓰이는지를 본다.
행렬식은 행렬 안에 들어 있는 정보를 하나의 수로 압축한 값이다. 그런데 이 하나의 수가 역행렬, 연립방정식의 해, 그리고 도형의 넓이와 부피를 설명하는 데 쓰인다.
핵심 응용은 다음 세 가지이다.
- 역행렬 공식
- 크래머 공식
- 행렬식과 넓이·부피의 관계
1. 역행렬 공식
가장 먼저 볼 것은 역행렬 공식이다.
2×2 행렬의 역행렬 공식은 이미 익숙하다.
A=(acbd)
일 때,
A−1=ad−bc1(d−c−ba)
이다.
여기서 분모의 ad−bc는 행렬식이다.
detA=ad−bc
즉 역행렬 공식에는 항상 detA1가 등장한다. 이것은 매우 자연스럽다. 왜냐하면 행렬 A가 역행렬을 가지려면 detA=0이어야 하기 때문이다. 만약 detA=0이면 분모가 0이 되므로 역행렬 공식 자체가 성립할 수 없다.
2. 2×2 역행렬 공식과 여인수
위 공식에서
(d−c−ba)
가 어디서 나오는지 보자.
이 행렬은 그냥 외운 결과처럼 보이지만, 사실 여인수와 관련이 있다.
행렬
A=(acbd)
에서 각 원소의 여인수를 보자.
a의 여인수
a는 (1,1) 위치에 있다. a가 있는 1행과 1열을 지우면 d만 남는다.
따라서 a의 여인수는
C11=d
이다.
b의 여인수
b는 (1,2) 위치에 있다. b가 있는 1행과 2열을 지우면 c가 남는다.
그런데 부호는 (−1)1+2이므로 음수이다.
따라서
C12=−c
이다.
c의 여인수
c는 (2,1) 위치에 있다. c가 있는 2행과 1열을 지우면 b가 남는다.
부호는 (−1)2+1이므로 음수이다.
따라서
C21=−b
이다.
d의 여인수
d는 (2,2) 위치에 있다. d가 있는 2행과 2열을 지우면 a가 남는다.
부호는 (−1)2+2이므로 양수이다.
따라서
C22=a
이다.
따라서 여인수 행렬은
C=(d−b−ca)
이다.
그런데 역행렬 공식에 들어가는 행렬은
(d−c−ba)
이다.
이는 여인수 행렬 C를 전치한 것이다.
CT=(d−c−ba)
따라서 2×2 역행렬 공식은 다음처럼 쓸 수 있다.
A−1=detA1CT
이 공식은 2×2에서만 성립하는 것이 아니라 일반적인 n×n 행렬에서도 성립한다.
3. 일반적인 역행렬 공식
n×n 행렬 A에 대해 여인수 행렬을 C라고 하자.
즉 Cij는 aij의 여인수이다.
그러면 역행렬은 다음과 같다.
A−1=detA1CT
여기서 CT를 수반행렬 또는 adjugate matrix라고도 한다.
adj(A)=CT
따라서 보통 다음처럼 쓰기도 한다.
A−1=detA1adj(A)
이 공식이 성립하려면 당연히 detA=0이어야 한다.
4. 3×3 행렬에서 여인수의 형태
예를 들어
A=adgbehcfi
라고 하자.
detA는 세 개의 원소를 곱한 항들의 합과 차로 이루어진다. 예를 들어 aei, bfg, cdh 같은 항들이 등장한다.
반면 여인수는 하나의 행과 하나의 열을 지운 뒤 남는 2×2 행렬의 행렬식이다. 따라서 여인수에는 두 개의 원소를 곱한 항들이 나온다.
예를 들어 a의 여인수는
C11=ehfi=ei−fh
이다.
즉 n×n 행렬에서
- detA는 원소 n개를 곱한 항들로 이루어진다.
- 여인수는 원소 n−1개를 곱한 항들로 이루어진다.
가우스-조르당 소거법으로 역행렬을 구할 때는 이런 대수적 구조가 잘 보이지 않는다. 하지만 여인수 공식을 보면 역행렬의 각 원소가 행렬 원소들의 다항식 형태로 표현된다는 것을 볼 수 있다.
5. 왜 A−1=detA1CT인가
이제 이 공식이 왜 맞는지 확인해보자.
역행렬 공식이 맞으려면 다음이 성립해야 한다.
AA−1=I
여기에
A−1=detA1CT
를 대입하면,
A(detA1CT)=I
이다.
양변에 detA를 곱하면 다음과 같다.
ACT=(detA)I
따라서 핵심은 다음 항등식이다.
ACT=(detA)I
이 식이 성립하면 역행렬 공식도 바로 따라온다.
6. 대각 성분이 detA가 되는 이유
행렬 A의 첫 번째 행을
(a11,a12,⋯,a1n)
이라고 하자.
CT의 첫 번째 열은 원래 여인수 행렬 C의 첫 번째 행이다. 즉 다음과 같다.
C11C12⋮C1n
그러면 ACT의 (1,1) 성분은 첫 번째 행과 첫 번째 열의 내적이다.
a11C11+a12C12+⋯+a1nC1n
그런데 이것은 정확히 1행에 대한 여인수 전개이다.
따라서
a11C11+a12C12+⋯+a1nC1n=detA
이다.
마찬가지로 2행과 2행의 여인수들을 곱하면 detA가 나오고, n행과 n행의 여인수들을 곱해도 detA가 나온다.
즉 ACT의 대각 성분은 모두 detA이다.
7. 비대각 성분이 0이 되는 이유
남은 문제는 비대각 성분이다.
예를 들어 ACT의 (1,2) 성분은 A의 1행과 CT의 2열의 내적이다. 이는 곧 A의 1행과 A의 2행에 대한 여인수들을 곱하는 것이다.
즉 같은 행의 원소와 같은 행의 여인수를 곱하는 것이 아니라, 다른 행의 원소와 여인수를 곱하는 상황이다.
이 값은 왜 0이 될까?
직관은 다음과 같다.
다른 행의 여인수와 곱한다는 것은, 어떤 행렬의 행렬식을 계산하는 것과 같다. 그런데 그 행렬은 두 행이 서로 같은 행렬이다. 두 행이 같은 행렬의 행렬식은 0이다.
2×2 예시
다시
A=(acbd)
를 보자.
2행의 여인수들은
C21=−b,C22=a
이다.
1행의 원소와 2행의 여인수들을 곱하면
aC21+bC22=a(−b)+b(a)=−ab+ab=0
이다.
이것은 우연이 아니다. 다음 행렬을 생각해보자.
(aabb)
이 행렬은 두 행이 같으므로 행렬식이 0이다.
실제로 계산하면
aabb=ab−ba=0
이다.
따라서 원래 행렬의 한 행과 다른 행의 여인수를 곱하면, 두 행이 같은 행렬의 행렬식을 계산하는 꼴이 되므로 0이 된다.
이 때문에
ACT=(detA)I
가 성립한다.
따라서
A−1=detA1CT
이다.
8. 역행렬 공식의 의미
이 공식은 계산용으로 항상 좋은 공식은 아니다. 실제로 큰 행렬의 역행렬을 구할 때는 보통 소거법을 사용한다.
하지만 이 공식은 중요한 대수적 의미를 가진다.
예를 들어 행렬 A의 (1,1) 성분을 조금 바꾸면 역행렬은 어떻게 변할까?
여인수 공식으로 보면, 역행렬은
A−1=detA1CT
이므로 변화는 두 부분에서 일어난다.
- detA가 변한다.
- 여인수 행렬 C가 변한다.
즉 역행렬의 변화는 행렬식과 여인수들의 변화로 추적할 수 있다. 수치 계산에서는 소거법이 더 실용적이지만, 문자식으로 행렬의 구조를 분석할 때는 이 공식이 의미가 있다.
9. 연립방정식 Ax=b와 크래머 공식
이제 두 번째 응용은 연립방정식이다.
연립방정식
Ax=b
의 해는
x=A−1b
이다.
앞에서 구한 역행렬 공식을 대입하면
x=detA1CTb
이다.
즉 해 x의 각 성분도 행렬식과 여인수를 이용해 표현할 수 있다. 이것이 크래머 공식이다.
10. 크래머 공식
A가 가역행렬이고 detA=0이라고 하자.
연립방정식
Ax=b
의 해를
x=x1x2⋮xn
라고 하자.
그러면 각 성분 xj는 다음과 같이 구할 수 있다.
xj=detAdetBj
여기서 Bj는 행렬 A의 j번째 열을 오른쪽 벡터 b로 바꾼 행렬이다.
즉
Bj=∣a1∣∣a2∣⋯∣b∣⋯∣an∣
이다.
여기서 a1,a2,⋯,an은 A의 각 열벡터이다.
11. x1에 대한 크래머 공식
특히 첫 번째 성분 x1은 다음과 같다.
x1=detAdetB1
여기서 B1은 A의 첫 번째 열을 b로 바꾼 행렬이다.
예를 들어 A가
A=a11a21⋮an1a12a22⋮an2⋯⋯⋱⋯a1na2n⋮ann
이고
b=b1b2⋮bn
라면,
B1=b1b2⋮bna12a22⋮an2⋯⋯⋱⋯a1na2n⋮ann
이다.
이 행렬의 행렬식을 1열에 대해 여인수 전개하면
detB1=b1C11+b2C21+⋯+bnCn1
이 된다.
이 값은 CTb의 첫 번째 성분과 같다. 따라서
x1=detAdetB1
가 된다.
12. 크래머 공식은 계산용으로 좋은가
크래머 공식은 매우 깔끔한 공식이다.
연립방정식의 해를 각 성분별로 행렬식의 비율로 표현한다.
xj=detAdetBj
하지만 실제 계산에는 좋은 방법이 아니다.
n개의 미지수를 가진 연립방정식을 풀려면 detA와 detB1,detB2,⋯,detBn을 계산해야 한다. 즉 총 n+1개의 행렬식을 계산해야 한다.
행렬식 계산은 큰 행렬에서 매우 비싸다. 반면 소거법은 훨씬 효율적이다.
따라서 크래머 공식은 실전 수치 계산용이라기보다는 이론적·대수적 의미가 큰 공식이다.
정리하면 다음과 같다.
- 소거법은 계산에 좋다.
- 크래머 공식은 해의 구조를 문자식으로 보여주는 데 좋다.
- 큰 행렬을 실제로 풀 때는 크래머 공식을 쓰지 않는다.
13. 행렬식의 세 번째 응용: 넓이와 부피
세 번째 응용은 행렬식이 넓이와 부피를 나타낸다는 사실이다.
정확히 말하면 행렬식의 절댓값은 어떤 평행사변형, 평행육면체, 또는 고차원 평행체의 넓이와 부피를 나타낸다.
행렬 A의 행벡터 또는 열벡터를 도형의 변으로 생각하면, 그 도형의 부피는 다음과 같다.
volume=∣detA∣
행렬식 자체는 부호를 가질 수 있다. 따라서 기하학적 부피만 생각하면 절댓값을 취해야 한다.
volume=∣detA∣
행렬식의 부호는 방향을 나타낸다. 예를 들어 3차원에서는 오른손 방향인지 왼손 방향인지와 관련이 있다. 두 변의 순서를 바꾸면 부피의 크기는 변하지 않지만 행렬식의 부호는 바뀐다.
14. 3×3 행렬과 평행육면체
3×3 행렬
A=a11a21a31a12a22a32a13a23a33
를 생각하자.
각 행을 3차원 공간의 벡터로 본다.
첫 번째 행벡터는
r1=(a11,a12,a13)
이다.
두 번째 행벡터는
r2=(a21,a22,a23)
이다.
세 번째 행벡터는
r3=(a31,a32,a33)
이다.
이 세 벡터를 원점에서 출발하는 세 변으로 생각하면 하나의 평행육면체가 만들어진다.
이 평행육면체의 부피는
∣detA∣
이다.
즉 행렬식은 세 벡터가 만드는 공간의 부피를 나타낸다.
15. 항등행렬의 경우
가장 쉬운 경우는 항등행렬이다.
I=100010001
이 행렬의 세 행벡터는 표준기저벡터이다.
e1=(1,0,0)
e2=(0,1,0)
e3=(0,0,1)
이 세 벡터가 만드는 도형은 한 변의 길이가 1인 정육면체이다.
따라서 부피는 1이다.
또한
detI=1
이다.
따라서
∣detI∣=1
이고, 이는 단위 정육면체의 부피와 일치한다.
16. 직교행렬의 경우
이제 항등행렬보다 조금 더 일반적인 직교행렬을 생각하자.
직교행렬 Q는 다음 조건을 만족하는 행렬이다.
QTQ=I
이는 Q의 열벡터들이 서로 직교하고 길이가 1이라는 뜻이다. 즉 열벡터들이 정규직교기저를 이룬다는 뜻이다.
직교행렬이 만드는 도형은 단위 정육면체를 회전하거나 반사한 것이다. 따라서 부피는 여전히 1이다.
이제 행렬식도 확인해보자.
QTQ=I
양변에 행렬식을 취하면
det(QTQ)=detI
이다.
행렬식의 곱셈 성질에 의해
det(QTQ)=det(QT)det(Q)
이다.
또한 전치행렬의 행렬식은 원래 행렬식과 같다.
det(QT)=det(Q)
따라서
det(Q)2=1
이다.
그러므로
det(Q)=1ordet(Q)=−1
이다.
즉 직교행렬의 행렬식은 항상 1 또는 −1이다.
절댓값을 취하면
∣detQ∣=1
이므로 직교행렬이 만드는 도형의 부피와 일치한다.
17. 한 변을 두 배로 늘리면
단위 정육면체에서 한 변을 두 배로 늘리면 부피도 두 배가 된다.
행렬에서도 같은 일이 일어난다.
어떤 행렬 A의 한 행을 두 배로 만들면 행렬식도 두 배가 된다.
예를 들어 첫 번째 행을 두 배로 만들면
det2a11a21a312a12a22a322a13a23a33=2deta11a21a31a12a22a32a13a23a33
이다.
이는 행렬식이 각 행에 대해 선형적이라는 성질과 연결된다.
기하학적으로는 한 변의 길이를 두 배로 늘렸으므로 부피가 두 배가 되는 것이다.
18. 행렬식과 넓이: 2×2의 경우
2차원에서는 행렬식이 평행사변형의 넓이를 준다.
두 벡터
(a,b)
와
(c,d)
를 생각하자.
이 두 벡터를 원점에서 출발하는 두 변으로 보면 평행사변형이 만들어진다.
그 평행사변형의 넓이는
acbd=∣ad−bc∣
이다.
만약 방향까지 고려한 부호 있는 넓이를 쓰면
acbd=ad−bc
이다.
19. 왜 이 공식이 좋은가
평행사변형의 넓이는 원래 다음처럼 배운다.
area=base×height
하지만 좌표만 주어졌을 때 밑변과 높이를 직접 구하려면 제곱근과 삼각함수 또는 투영 계산이 섞여서 복잡해진다.
예를 들어 (a,b)의 길이는
a2+b2
이다.
높이를 구하려면 다른 벡터를 이 방향에 수직으로 내린 길이를 계산해야 한다. 이 과정은 생각보다 번거롭다.
반면 행렬식을 쓰면 넓이는 바로 나온다.
area=∣ad−bc∣
즉 좌표만 알고 있으면 길이, 각도, 높이를 따로 구하지 않아도 된다.
이것이 행렬식 공식의 큰 장점이다.
20. 삼각형의 넓이
평행사변형을 대각선으로 자르면 삼각형 두 개가 된다.
따라서 원점과 두 점 (a,b), (c,d)가 만드는 삼각형의 넓이는 평행사변형 넓이의 절반이다.
triangle area=21∣ad−bc∣
부호 있는 넓이로 쓰면 다음과 같다.
21(ad−bc)
이다.
기하학적 넓이는 항상 양수이므로 보통은 절댓값을 쓴다.
triangle area=21∣ad−bc∣
21. 원점에서 시작하지 않는 삼각형의 넓이
이제 삼각형의 한 꼭짓점이 원점이 아닌 경우를 보자.
세 점이 다음과 같다고 하자.
(x1,y1),(x2,y2),(x3,y3)
이 세 점이 만드는 삼각형의 넓이는 다음 공식으로 구할 수 있다.
area=21x1x2x3y1y2y3111
이 공식은 처음 보면 갑자기 1이 붙어서 이상해 보일 수 있다. 하지만 의미는 간단하다.
세 점 중 하나를 원점으로 옮긴 뒤, 나머지 두 점과의 차이 벡터로 평행사변형을 만들면 된다.
예를 들어 (x1,y1)을 기준점으로 잡으면 두 벡터는
(x2−x1,y2−y1)
와
(x3−x1,y3−y1)
이다.
따라서 삼각형의 넓이는
area=21x2−x1x3−x1y2−y1y3−y1
이다.
이 식을 정리하면 위의 3×3 행렬식 공식과 같다.
즉
21x1x2x3y1y2y3111
은 세 점이 어디에 있든 삼각형의 넓이를 바로 구해주는 공식이다.
22. 행렬식의 성질과 부피의 성질
행렬식이 부피와 같다는 사실은 행렬식의 기본 성질들과도 잘 맞는다.
행렬식의 중요한 성질은 다음과 같다.
1. 항등행렬의 행렬식은 1이다
detI=1
이는 단위 정육면체의 부피가 1이라는 사실과 대응된다.
2. 두 행을 바꾸면 행렬식의 부호가 바뀐다
두 행을 바꾸면 도형의 방향이 바뀐다. 부피의 크기는 그대로이지만 방향, 즉 orientation이 바뀐다.
따라서 절댓값으로 본 부피는 그대로이고, 행렬식의 부호만 바뀐다.
3. 한 행에 배수를 곱하면 행렬식도 그 배수만큼 변한다
한 행이 나타내는 벡터를 t배 하면 그 방향의 길이가 t배가 된다. 따라서 부피도 t배가 된다.
수식으로는 다음과 같다.
dettr1r2⋮rn=tdetr1r2⋮rn
이다.
4. 한 행에 대해 선형적이다
행렬식은 한 행에 대해서만 선형적이다.
예를 들어 2×2에서
a+a′cb+b′d=acbd+a′cb′d
이다.
이 성질은 넓이와 부피의 분해와 연결된다.
23. 중요한 주의점: 행렬식은 행렬 전체에 대해 선형이 아니다
행렬식은 각 행에 대해 따로 선형적이다. 이를 multilinearity라고 한다.
하지만 행렬 전체에 대해 선형인 것은 아니다.
즉 일반적으로
det(A+B)=detA+detB
이다.
행렬식의 선형성은 “한 행만 바꾸고 나머지 행은 고정했을 때” 성립하는 성질이다.
예를 들어
a+a′cb+b′d=acbd+a′cb′d
는 맞다.
하지만
det(A+B)=detA+detB
는 일반적으로 틀리다.
24. 전체 정리
이번 내용의 핵심은 행렬식이 단순한 계산 도구가 아니라는 점이다.
행렬식은 다음 세 가지 중요한 의미를 가진다.
첫째, 역행렬을 표현한다.
A−1=detA1CT
여기서 C는 여인수 행렬이다.
둘째, 연립방정식의 해를 표현한다.
xj=detAdetBj
여기서 Bj는 A의 j번째 열을 b로 바꾼 행렬이다.
셋째, 넓이와 부피를 표현한다.
volume=∣detA∣
2차원에서는 평행사변형의 넓이이고, 3차원에서는 평행육면체의 부피이다.
행렬식은 하나의 수이지만, 그 안에는 행렬의 가역성, 연립방정식의 해, 기하학적 부피 정보가 모두 들어 있다. 그래서 행렬식은 단순히 계산하는 대상이 아니라, 행렬이 공간을 어떻게 변형하는지를 보여주는 핵심 개념이다.