4.1. Orthogonality of the Four Subspaces

1. 강의 주제

이번 강의의 핵심 주제는 직교성(orthogonality) 이다.
직교성은 벡터끼리, 부분공간끼리, 기저끼리 정의할 수 있으며, 기본적으로 서로 90도를 이룬다는 뜻이다.

이 강의에서는 다음 내용을 다룬다.

  • 두 벡터가 직교한다는 뜻
  • 부분공간 이 직교한다는 뜻
  • 행공간(row space)과 영공간(null space)의 직교 관계
  • 네 개의 기본 부분공간(four fundamental subspaces)의 기하학적 구조
  • 이후 최소제곱법으로 이어지기 위한 ATAA^T A의 성질

2. 벡터의 직교

2.1 정의

두 벡터 x,yx, y가 직교한다는 것은
두 벡터가 서로 수직(perpendicular) 이라는 뜻이다.

즉, nn차원 공간에서도 두 벡터의 각이 9090^\circ이면 직교라고 한다.

2.2 판정법

두 벡터 x,yx, y가 직교할 필요충분조건은

xTy=0x^T y = 0

이다.

여기서 xTyx^T y점곱(dot product) 이다.
즉,

xTy=x1y1+x2y2++xnynx^T y = x_1 y_1 + x_2 y_2 + \cdots + x_n y_n

이다.

따라서 직교 여부는 점곱이 0인지 확인하면 된다는 것이 핵심이다.


3. 피타고라스 정리와 직교 조건

벡터 x,yx, y가 직교하면, x+yx+y를 빗변으로 하는 직각삼각형이 만들어진다.
이때 피타고라스 정리에 의해

x2+y2=x+y2\|x\|^2 + \|y\|^2 = \|x+y\|^2

가 성립한다.

여기서 벡터의 길이 제곱은

x2=xTx\|x\|^2 = x^T x

로 표현된다.

이를 이용하면,

xTx+yTy=(x+y)T(x+y)x^T x + y^T y = (x+y)^T(x+y)

이고 우변을 전개하면

(x+y)T(x+y)=xTx+xTy+yTx+yTy(x+y)^T(x+y) = x^T x + x^T y + y^T x + y^T y

이다.

양변에서 xTxx^T x, yTyy^T y를 지우면

xTy+yTx=0x^T y + y^T x = 0

을 얻는다.

실수 벡터에서는 xTy=yTxx^T y = y^T x 이므로

2xTy=02x^T y = 0

즉,

xTy=0x^T y = 0

이 된다.

따라서 직각삼각형 조건과 점곱이 0이라는 조건은 서로 같은 말이다.


4. 벡터 길이와 예시

벡터의 길이 제곱은

x2=xTx=x12+x22++xn2\|x\|^2 = x^T x = x_1^2 + x_2^2 + \cdots + x_n^2

이다.

예를 들어,

x=[123]x = \begin{bmatrix}1 \\ 2 \\ 3\end{bmatrix}

이면

x2=12+22+32=14\|x\|^2 = 1^2 + 2^2 + 3^2 = 14

이다.

즉, xTxx^T x는 항상 0 이상이며,
x=0x=0일 때만 0이다.


5. 영벡터와 직교

영벡터 00는 모든 벡터와 직교한다.

왜냐하면 어떤 벡터 yy에 대해서도

0Ty=00^T y = 0

이기 때문이다.

즉, 규칙대로 계산하면 영벡터는 누구와 점곱해도 0이므로
영벡터는 모든 벡터와 직교한다.


6. 부분공간의 직교

6.1 정의

부분공간 SSTT가 직교한다는 뜻은

SS 안의 모든 벡터가 TT 안의 모든 벡터와 직교한다는 뜻이다.

즉,

ST    sS, tT, sTt=0S \perp T \iff \forall s \in S,\ \forall t \in T,\ s^T t = 0

이다.

6.2 중요한 점

부분공간끼리 직교하려면 단순히 교집합이 작다고 되는 것이 아니다.
서로 만나는 벡터가 0벡터밖에 없어야 할 뿐 아니라,
모든 벡터쌍이 서로 직교해야 한다.

예를 들어, R3\mathbb{R}^3에서 두 평면이 만나면 그 교선 위의 벡터는 두 평면에 동시에 속한다.
그 벡터는 자기 자신과 직교하지 않으므로(영벡터가 아니라면)
그 두 평면은 직교 부분공간이 될 수 없다.

ST    sS, tT, sTt=0S \perp T \iff \forall s \in S,\ \forall t \in T,\ s^T t = 0

STST={0}S \perp T \Rightarrow S \cap T = \{0\}

vST, v0vS, vTv \in S \cap T,\ v \neq 0 \Rightarrow v \in S,\ v \in T

STvTv=0S \perp T \Rightarrow v^T v = 0

vTv=v2v^T v = \|v\|^2

v0v2>0v \neq 0 \Rightarrow \|v\|^2 > 0

 v0 인 vST 가 존재하면 ST 는 불가능\therefore\ v \neq 0 \text{ 인 } v \in S \cap T \text{ 가 존재하면 } S \perp T \text{ 는 불가능}

ST={0}⇏STS \cap T = \{0\} \not\Rightarrow S \perp T

S=span{(1,0)},T=span{(1,1)}S = \operatorname{span}\{(1,0)\},\quad T = \operatorname{span}\{(1,1)\}

ST={0}S \cap T = \{0\}

(1,0)T(1,1)=10(1,0)^T(1,1) = 1 \neq 0

 ST={0} 이어도 ST 는 아닐 수 있다\therefore\ S \cap T = \{0\} \text{ 이어도 } S \perp T \text{ 는 아닐 수 있다}

 ST 이려면 단순히 교집합이 {0} 인 것만으로는 부족하고, sS, tT, sTt=0 이어야 한다\therefore\ S \perp T \text{ 이려면 단순히 교집합이 } \{0\} \text{ 인 것만으로는 부족하고, } \forall s \in S,\ \forall t \in T,\ s^T t = 0 \text{ 이어야 한다}


7. R2\mathbb{R}^2에서의 직교 부분공간

평면 R2\mathbb{R}^2의 부분공간은 다음 셋뿐이다.

  • 영공간 {0}\{0\}
  • 원점을 지나는 직선
  • 전체 평면 R2\mathbb{R}^2

이때 직교가 가능한 대표적 경우는 다음과 같다.

  • 직선과 영공간은 항상 직교이다.
  • 원점을 지나는 두 직선은 서로 90도일 때 직교이다.
  • 직선과 전체 평면은 직교일 수 없다.

즉, 평면에서는 우리가 익숙하게 보는
서로 수직인 두 직선이 부분공간의 직교의 대표 예시이다.


8. 행공간과 영공간의 직교

이 강의의 가장 중요한 내용 중 하나는 다음이다.

행공간(row space)은 영공간(null space)과 직교한다.

즉,

Row(A)N(A)\text{Row}(A) \perp \mathcal{N}(A)

이다.

8.1 이유

xN(A)x \in \mathcal{N}(A) 라고 하자.
그러면 정의에 의해

Ax=0Ax = 0

이다.

행렬 AA의 각 행을 r1,r2,,rmr_1, r_2, \dots, r_m이라 하면

Ax=[r1r2rm]xAx =\begin{bmatrix}r_1 \\r_2 \\ \vdots \\r_m\end{bmatrix}x

=[r1xr2xrmx]=\begin{bmatrix} r_1 x \\r_2 x \\\vdots \\r_m x\end{bmatrix} =0=0

이다.

즉 각 행에 대해

rix=0r_i x = 0

가 성립한다.

여기서 rixr_i x는 사실상 행벡터와 열벡터의 점곱이므로
xx모든 행벡터와 직교한다.

행공간은 행들의 모든 선형결합으로 이루어지므로,
xx는 행공간의 임의의 벡터와도 직교한다.

따라서

xN(A)xRow(A)x \in \mathcal{N}(A) \Rightarrow x \perp \text{Row}(A)

이고 결국

Row(A)N(A)\text{Row}(A) \perp \mathcal{N}(A)

가 된다.


9. 열공간과 좌영공간의 직교

위의 명제를 ATA^T에 대해 똑같이 적용하면

Col(A)N(AT)\text{Col}(A) \perp \mathcal{N}(A^T)

를 얻는다.

즉, 열공간(column space)과 왼쪽 영공간(left null space)은 직교한다.


10. 네 개의 기본 부분공간의 구조

행렬 AAm×nm \times n 행렬이고 rank가 rr이라면,

  • dim(Row(A))=r\dim(\text{Row}(A)) = r
  • dim(N(A))=nr\dim(\mathcal{N}(A)) = n-r
  • dim(Col(A))=r\dim(\text{Col}(A)) = r
  • dim(N(AT))=mr\dim(\mathcal{N}(A^T)) = m-r

이다.

그리고 직교 관계는 다음과 같다.

  • Row(A)N(A)\text{Row}(A) \perp \mathcal{N}(A)
  • Col(A)N(AT)\text{Col}(A) \perp \mathcal{N}(A^T)

즉, nn차원 공간은

Row(A)\text{Row}(A)N(A)\mathcal{N}(A)

로 나뉘고, 이 둘은 서로 직교한다.

mm차원 공간은

Col(A)\text{Col}(A)N(AT)\mathcal{N}(A^T)

로 나뉘고, 이 둘도 서로 직교한다.

이것이 선형대수의 네 기본 부분공간의 아름다운 기하학적 구조이다.


11. Orthogonal Complement(직교여공간)

강의에서는 단순히 “직교한다”를 넘어서
orthogonal complement라는 개념을 강조한다.

예를 들어 null space는 row space에 수직인 벡터 몇 개만 모아둔 것이 아니라,

row space에 수직인 모든 벡터 전체

를 담고 있다.

즉,

N(A)=Row(A)\mathcal{N}(A) = \text{Row}(A)^\perp

이다.

마찬가지로

N(AT)=Col(A)\mathcal{N}(A^T) = \text{Col}(A)^\perp

이다.

여기서 \perp는 “직교여공간”을 뜻한다.

즉, 서로 직교할 뿐 아니라 차원까지 정확히 맞아서
공간 전체를 빈틈없이 채운다는 점이 중요하다.


12. 예시: rank 1인 경우의 기하학

R3\mathbb{R}^3에서 행공간이 1차원이라고 하자.
예를 들어 행렬이 사실상 하나의 독립적인 행만 가지면, 행공간은 한 직선이 된다.

이때 n=3n=3, r=1r=1 이므로

dim(N(A))=31=2\dim(\mathcal{N}(A)) = 3-1 = 2

이다.

즉, 영공간은 평면이다.

그리고 그 평면은 행공간의 방향벡터에 수직인 평면이다.

예를 들어 방정식

x1+2x2+5x3=0x_1 + 2x_2 + 5x_3 = 0

R3\mathbb{R}^3에서 하나의 평면을 나타낸다.
이 평면의 법선벡터(normal vector)는

[125]\begin{bmatrix}1 \\ 2 \\ 5\end{bmatrix}

이다.

즉, 이 벡터가 row space의 방향을 나타내고,
그에 수직인 모든 벡터들이 null space를 이룬다.


13. 이 강의의 큰 의미

이 강의는 네 기본 부분공간에 대해 단순히 차원만 아는 단계에서 한 걸음 더 나아간다.

이전까지는

  • 각 부분공간이 무엇인지
  • 차원이 몇인지
  • 기저를 어떻게 구하는지

를 배웠다면,

이번에는

  • 그 부분공간들이 서로 어떻게 놓여 있는지
  • 즉, 서로 수직인지
  • 공간을 어떻게 직교 분해하는지

를 이해하게 된다.

즉, 이번 강의는 선형대수의 기하학을 훨씬 더 깊게 보여주는 장이다.


14. 다음 주제로의 연결: 해가 없는 Ax=bAx=b

강의 후반부에서는 다음 문제를 제시한다.

해가 없는 연립방정식 Ax=bAx=b를 어떻게 “가장 잘” 풀 것인가?

즉,

bCol(A)b\notin \text{Col}(A)

라면 정확한 해는 존재하지 않는다.

이 상황은 실제 응용에서 매우 흔하다.
예를 들어 측정 데이터가 많고 잡음(noise)이 섞여 있으면,
방정식은 보통 정확히 맞지 않는다.

예시는 다음과 같다.

  • 위성 위치 측정을 여러 번 한 경우
  • 저항값, 맥박수 등을 반복 측정한 경우
  • 설문, 통계, 실험 데이터가 많은 경우

이때 식은 많고 미지수는 적으며,
오른쪽 항 bb에는 측정오차가 들어 있다.

따라서 목표는 정확한 해가 아니라
가장 좋은 근사해(best solution) 를 찾는 것이다.


15. 핵심 행렬 ATAA^T A

이 문제를 해결하는 중심 행렬은

ATAA^T A

이다.

15.1 기본 성질

AAm×nm \times n 행렬이면

  • ATA^Tn×mn \times m 행렬
  • 따라서 ATAA^T An×nn \times n 행렬

이다.

즉, ATAA^T A정사각행렬이다.

또한,

(ATA)T=AT(AT)T=ATA(A^T A)^T = A^T (A^T)^T = A^T A

이므로
ATAA^T A대칭행렬(symmetric matrix) 이다.


16. Normal Equation(정규방정식)

정확한 해 Ax=bAx=b가 없을 때, 가장 좋은 근사해 x^\hat{x}는 보통 다음 식을 만족한다.

ATAx^=ATbA^T A \hat{x} = A^T b

이 식을 정규방정식(normal equation) 이라고 한다.

이 식이 이후 최소제곱법의 중심이 된다.

즉, 원래는 풀 수 없던 Ax=bAx=b 대신
새로운 정사각 시스템

ATAx^=ATbA^T A \hat{x} = A^T b

를 푸는 방향으로 간다.


17. ATAA^T A의 가역성

중요한 사실은 다음이다.

N(ATA)=N(A)\mathcal{N}(A^T A) = \mathcal{N}(A)

즉, ATAA^T A의 영공간은 AA의 영공간과 같다.

따라서 rank도 같아진다.

rank(ATA)=rank(A)\text{rank}(A^T A) = \text{rank}(A)

그러므로

ATAA^T A가 가역(invertible)일 필요충분조건은
AA의 열들이 선형독립인 것이다.

즉,

ATAA^T A is invertible     \iff columns of AA are independent

이다.

이를 한국어로 쓰면,

ATAA^T AAA의 열벡터들이 선형독립일 때에만, 그리고 그때에 한해 가역이다.


18. 왜 이것이 중요한가

정규방정식

ATAx^=ATbA^T A \hat{x} = A^T b

를 풀려면 ATAA^T A가 가역이면 매우 편하다.

그때는

x^=(ATA)1ATb\hat{x} = (A^T A)^{-1}A^T b

로 쓸 수 있다.

따라서 최소제곱해를 구하려면
ATAA^T A의 성질, 특히

  • 대칭성
  • 정사각형 구조
  • null space
  • invertibility

를 이해하는 것이 필수적이다.


19. 핵심 정리 요약

19.1 벡터의 직교

두 벡터 x,yx, y가 직교할 필요충분조건은

xTy=0x^T y = 0

이다.


19.2 길이 제곱

벡터의 길이 제곱은

x2=xTx\|x\|^2 = x^T x

이다.


19.3 부분공간의 직교

두 부분공간 S,TS, T가 직교한다는 것은

모든 sSs \in S, 모든 tTt \in T에 대해

sTt=0s^T t = 0

이라는 뜻이다.


19.4 네 기본 부분공간의 직교 관계

  • Row(A)N(A)\text{Row}(A) \perp \mathcal{N}(A)
  • Col(A)N(AT)\text{Col}(A) \perp \mathcal{N}(A^T)

이다.


19.5 직교여공간

  • N(A)=Row(A)\mathcal{N}(A) = \text{Row}(A)^\perp
  • N(AT)=Col(A)\mathcal{N}(A^T) = \text{Col}(A)^\perp

이다.


19.6 차원 관계

  • dim(Row(A))=r\dim(\text{Row}(A)) = r
  • dim(N(A))=nr\dim(\mathcal{N}(A)) = n-r
  • dim(Col(A))=r\dim(\text{Col}(A)) = r
  • dim(N(AT))=mr\dim(\mathcal{N}(A^T)) = m-r

이다.


19.7 정규방정식

정확한 해가 없는 Ax=bAx=b에 대해, 좋은 근사해 x^\hat{x}

ATAx^=ATbA^T A \hat{x} = A^T b

를 만족한다.


19.8 ATAA^T A의 가역 조건

ATAA^T A가 가역일 필요충분조건은
AA의 열들이 선형독립인 것이다.

즉,

ATAA^T A is invertible     \iff columns of AA are independent

이다.


20. 정리

이번 강의의 핵심은 다음과 같다.

선형대수의 네 기본 부분공간은 단순히 차원만 맞는 것이 아니라, 서로 정확히 직교하는 구조를 가지며, 이 직교성이 이후 최소제곱법과 정규방정식 ATAx^=ATbA^T A\hat{x}=A^T b의 출발점이 된다.