선형대수학 정의, 정리집...

 

 

정의 1. 두 행렬 A,B가 모든 i,j에 대하여 aij=bij를 만족하면 서로 같다(equal)고 하고 A=B 로 나타낸다.  

top3.gif

       


    

정의 2. 두 행렬 A=[aij]m×n , B=[bij]m×n 와 실수 k 에 대하여 A와 B의 합(sum) A+B 와 A의 스칼라배(scalar multiple) kA 를 다음과 같이 정의한다.

                                             A+B=[aij + bij ]m×n , kA=[kaij]m×n    top3.gif


 

정의 3. 두 행렬 A=[aij]m×p , B=[bij]p×n 에 대하여 A와 B의 곱(product) AB를 다음과 같이 정의한다.

 

AB=[cij]m×n  여기서,cij = ai1b1j + ai2b2j + … +aipbpj= ∑ aik bkj (1 ≤ i ≤ m , 1 ≤ j ≤n)


정의 4. A가 n차의 정사각행렬일 때, A의 거듭제곱을 다음과 같이 정의한다.

           A0 = In , Ak = A ... A (k 개)


정의 5. 행렬 A=[aij ]m×n 에 대하여 A의 전치행렬(transpose of A)을 AT로 나타낸다.top3.gif


정의 6. 정사각행렬 A가 AT = A 를 만족하면 A를 대칭행렬(symmetric matrix)이라 하고, AT =-A 를 만족하면 반대칭행렬(skew symmetric matrix)이라고 한다.


정의 7.  REF ,RREF

mxn 행렬 E 가 다음 성질을 만족할 때, 행 사다리꼴(row echelon form)이라고 한다.

(i) 성분이 모두 0인 행이 존재하면 그 행은 행렬의 맨 아래에 위치한다.

(ii) 각 행에서 처음으로 나타나는 0이 아닌 성분은 1이다. 이때, 이 1을 그 행의 선행 성분(leading entry)이라고 한다.

(iii) i 행과 i+1 행 모두에 선행성분이 존재하면 (i+1) 행의 선행성분은 i 행의 선행 성분보다 오른쪽에 위치한다.

또, 행렬 E 가 행사다리꼴이고 다음 성질을 만족하면 E를 기약 행 사다리꼴 (reduced row echelon form)이라고 한다.

(iv) 어떤 행의 선행성분을 포함하는 열의 다른 성분은 모두 0이다.

 

* 앞으로 행 사다리꼴은 간단히 REF로, 기약 행 사다리꼴은 RREF로 나타내기로 한다.top3.gif


정의 8. mxn 행렬 A에 관한 다음 연산을 기본행연산(elementary row operation)이라고 한다.

E1 : A의 두 행 i 행과 j 행을 서로 바꾼다.

E2 : A의 i 행에 0 이 아닌 상수 k 를 곱한다.

E3 : A의 i 행을 k 배하여 j 행에 더한다.

 

앞으로 기본행연산을 다음과 같이 기호로 나타내기로 한다.

( [예제 1] 참조 )

E1 : Ri <--> Rj

E2 : k Ri

E3 : k Ri + Rj    top3.gif


정의 9. 행동치

행렬 A에 기본행연산을 시행하여 얻어지는 행렬을 B라 하면 A와 B는 행동치(row equivalent)라고 한다.


정의 10. n차의 정사각행렬 A에 대하여 다음을 만족하는 행렬 B가 존재하면 A는 가역(invertible)이라고 한다.

AB = In = BA

이때, B를 A의 역행렬(inverse matrix)이라고 하며, 이러한 B가 존재하지 않으면 A는 비가역(noninvertible)이라고 한다.


 

정의 11 치환 (permutation,순열) 

자연수의 집합 S={1,2,.........n}의 치환(permutation, 순열)이란 S에서 S로의 일대일 대응 함수 σ이다. 함수

 

 

을 간단히 (i1, i2, ... ,in)으로 쓰기로 한다.

[ 주의: 이것은 치환군에서 흔히 쓰는 순회치환 부호와는 다른의미이다.   top3.gif 


정의 12.일대일 대응함수 sgn σ

함수 sgn:Sn → {-1, +1}을 다음과 같이 정의한다.

 


정의 13. 행렬 A=[aij]가 n차의 정사각행렬일 때, A의 행렬식(determinant)을 det(A) 또는 |A|로 나타내고 다음과 같이 정의한다.

 


정의 14. 상삼각행렬(upper triangular matrix), 하삼각행렬(lower triangular matrix),삼각행렬(triangular matrix) 주대각선성분 아래의 성분이 모두 0인 정사각행렬을 상삼각행렬(upper triangular matrix), 위쪽의 성분이 모두 0인 정사각행렬을 하삼각행렬(lower triangular matrix)이라고 한다. 상삼각행렬과 하삼각행렬을 통틀어 삼각행렬(triangular matrix)이라고 한다.

 top3.gif 


 

정의 15.   소행렬식, 여인자

정사각행렬 A=[aij]의 i행과 j열을 제거하여 만든 부분행렬을 A(i|j)라 하고 그 의 행렬식 |A(i|j)|를 aij소행렬식(minor)이라 한다. 또,

Aij = (-1)i+j | A (i|j) |

 Aij 의 여인자(cofactor)라고 한다.


정의 16. n차의 정사각행렬 A=[aij]의 성분 aij의 여인자를 Aij라 할 때, 행렬 [Aij]T를 A의 수반행렬(adjoint matrix)이라 하고, adjA로 나타낸다. 즉,

  

top3.gif  


참고  *Cramer 공식 (Cramer's rule)

  

연립일차방정식의 해에 대한 공식을 만들면 실제의 계산은 복잡하더라도 해의 성질을 조사할 때는 매우 유용하다. 다음에 n개의 미지수를 가지는 n개의 일차방정식으로 이루어진 연립방정식의 해를 구하는 공식을 소개한다.

 

이 공식을   크래머 공식(Cramer's rule)이 라이라 하면, 이 연립방정식은 AX=B로 나타낼 수 있다. 이때,|A|≠0이면 이 연 립방정식은

유일한 해

을 갖는다. 여기서 Mj (j=1, 2,........,n)는 A의 j열을 B로 바꾼 행렬이다.   top3.gif


정의 17. 두 벡터 x, y와 스칼라 k에 대하여 두 벡터의 합 x+y와 k에 의한 x의 스칼라배 kx를 다음과 같이 정의한다.

(i) x+y는 x, y에 의하여 결정되는 평행사변형의 대각선으로 표시되는 벡터이다

 

(그림 3.2 (a)).

(ii) kx는 k>0 이면 x와 방향이 같으면서 길이는 k배 하여 얻어지 는 벡터이고, k<0 이면 x와 방향이 반대이면서 길이는 |k| 배 하 여 얻어지는 벡터이다 (그림 3.2 (b)). 또한 k 가 0이면 kx는 길이가 0 인 벡터이다.

그림 3.2

 

  top3.gif  


정의 18.세 실수들의 순서조 (x1, x2, x3)를 공간벡터(vector in space)라 하고

 

로 나타낸다. 이때 실수 x1, x2, x3공간벡터 x의 성분(component)이 라고 한다.

 


정의 19. R3 의 벡터

 

 

에 대하여 x1=y1, x2=y2, x3=y3 이면 x=y라 한다.

P(x1, x2, x3), Q(y1,y2,y3)인 유향선분 PQ→를 y1-x1, y2-x2, y3-x3를 성분으로 갖는 벡터라 한다.

따라서 PQ→는 처음점이 원점 O 이고 끝점이 Q'(y1-x1,y2-x2,y3-x3)인 벡터로 나타낼 수 있다 (그림 3.4). 즉,

  top3.gif 


정의 20. R3의 벡터 x=(x1, x2, x3), y=(y1,y2,y3)와 스칼라 k에 대하여, 두 벡터의 합(vector sum) x+y와, k에 의한 x의 스칼라배(scalar multiple) kx를 다음과 같이 정의한다.

(i) x+y=(x1+y1, x2+y2, x3+y3)

(ii) kx=(kx1, kx2, kx3)   top3.gif 


정의 21.  내적

 R3의 두 벡터 x=(x1, x2, x3), y=(y1,y2,y3)에 대하여 실수

x1y1 + x2y2 + x3y3

를 x와 y의 내적(inner product 또는 scalar product) 이라 하고 x·y로 나타낸다. 즉,

x·y = x1y1 + x2y2 + x3y3


정의 22.  외적

R3의 벡터 x=(x1, x2, x3), y=(y1,y2,y3)에 대하여 x, y의 외적 (cross product 또는 vector product)을 x×y로 나타내며 다음과 같이 정 의한다.

x×y=(x2y3-x3y2)i+(x3y1-x1y3)j+(x1y2-x2y1)k   top3.gif


정의 23. n개의 실수의 순서조 (x1, x2, ... ,xn)을 n-차원벡터(n-dimensionalvector)라 하고

 

 

으로 나타낸다. 이때 실수 x1, x2, ... ,xn을 x의 성분이라 한다.

모든 n-차원벡터 전체의 집합을 Rn으로 나타낸다. 즉,Rn={(x1, x2, ... ,xn)|xi∈R, i=1, 2,.......,n}

혼동할 염려가 없을 때는 Rn의 원소를 간단히 벡터라 한다. 특히 n=1일 때, R1은 실수 전체의 집합과 일치하므로 R1을 간단히 R로 나타낸다.


정의 24. Rn의 벡터

 

에 대하여 xi=yi(i=1,2,.......,n)이면 x=y라고 한다.top3.gif


정의 25. Rn의 벡터

 

 

와 스칼라 k에 대하여, 두 벡터의 합 x+y와 k에 의한 x의 스칼라 배 kx를 각각 다음과 같이 정의한다.

 

또한, Rn 에서 모든 성분이 0인 벡터를 영벡터라 하고 0으로 나타낸다. 그러면 임의의 벡터 x∈R에 대하여     x+0=x, x+(-1)x=0

이 성립함을 쉽게 알 수 있다. 여기서 (-1)x=-x로 정의하며 -x를 x의 음벡터라 한다.


정의 26. Rn의 벡터x=(x1, x2, ... ,xn)에 대하여

||x||=sqrt(x12, x22, ... ,xn2)

을 x의 크기(norm)라 한다.

위의 정의에서 ||x||는 원점에서 점 P(x1, x2, ... ,xn)에 이르는 거리로 정의됨을 의미한다.

따라서 R^n의 두 벡터 x=(x1, x2, ... ,xn) y=(y1, y2, ... ,yn)에 대하여||x-y||는 두 점 P(x1, x2, ... ,xn)와 Q(y1, y2, ... ,yn) 사이의 거리로 정의 한다. 즉,

||x-y||=sqrt((x1-y1)2+ ... +(xn-yn)2)  top3.gif  


정의 27. Rn의 벡터 x=(x1, x2, ... ,xn), y=(y1, y2, ... ,yn)에 대하여 실수 x1y1+x2y2+ ... +xnyn 을 x와 y의 내적이라 하고 x·y로 나타낸다. 즉, x·y=x1y1+x2y2+ ... +xnyn

내적의 정의로 부터 Rn의 벡터 x에 대하여 다음을 얻는다.

x·x=||x||2


정의 28. Rn의 벡터 x, y에 대하여

x·y=||x||||y||cosθ,0≤θ≤π

인 θ를 x와 y가 이루는 각(angle)이라 한다.


정의 29. (벡터공간)

V는 집합이고, V에는 벡터합(vector addition)(또는 벡터 덧셈)이라고 부르는 연산 즉, V의 두 원소 u, v에 V의 원소 u+v를 대응시키는 연산과 스칼라에 의한 곱(multiplication by scalars)이라고 부르는 연산 즉, V의 원소 u와 수(이를 보통 스칼라(scalar)라고 부름) a에 V의 원소 au를 대응시키는 연산이 정의되어 있다고 하자. 이 두 가지 연산이 다음 8가지 조건을 만족할 때 V를 벡터공간(vector space)이라 하고, V의 원소를 벡터라고 한다.

 

(i) V의 모든 원소 u, v에 대하여 u + v = v + u.

 

(ii) V의 모든 원소 u, v, w에 대하여 (u + v) + w = u + (v + w).

 

(iii) V의 모든 원소 u에 대하여 u + O = u = O + u 를 만족하는 O가 V안에 존재한다.

 

(iv) V의 각 원소 u에 대하여 V의 원소 u'이 존재하여 u + u' = O = u' + u 가 성립한다.

 

(v) 모든 스칼라 a, b와 V의 모든 원소 u에 대하여 (a + b)u = au + bu.

 

(vi) 모든 스칼라 a와 V의 모든 원소 u, v에 대하여 a(u + v) = au + av.

 

(vii) 모든 스칼라 a, b와 V의 모든 원소 u에 대하여 (ab)u = a(bu).

 

(viii) V의 모든 원소 u에 대하여 1u = u.   top3.gif  


참고

정의 1의 조건 (iii)에서 O를 V의 영벡터(zero vector)라고 한다. 또 조건 (iv)에서 u'을 u의 덧셈에 관한 역원이라고 하며, 보통 기호 -u로 나타낸다. 조건 (i), 조건 (ii)를 각각 벡터 덧셈의 교환법칙(commutative law), 벡터 덧셈의 결합법칙(associative law)이라고 한다. 특히 (ii)에 의하여 벡터공간안의 세 벡터 u, v, w의 합을 괄호 없이 u + v + w로 나타내기도 한다.


정의 30.(부분공간)

v1, ... , vn이 W가 V의 부분집합이라 하자. 다음 세 조건이 성립할 때 W를 V의 부분공간(subspace)이라고 한다.

(i) V의 영벡터 O가 W에 속한다.

(ii) W의 모든 원소 u, v에 대하여 u+v가 W에 속한다.

(iii) 모든 스칼라 a와 W의 모든 원소 u에 대하여 au가 W에 속한다.


참고

정의 2에서 조건 (ii)를 보통 W는 벡터 덧셈에 관해 닫혀 있다고 하며, 조건 (iii)을 보통 W는 스칼라에 의한 곱셈에 관해 닫혀 있다고 한다.


정의 31. (일차결합)

v1, ... , vn이 V의 벡터들이고, a1, ... , an이 스칼라들일 때 합 a1v1 + ... + anvn을 벡터 v1, ... , vn 일차결합(linear combination)이라고 한다. top3.gif   


정의 32. (일차독립, 일차종속)

벡터 v1, ... , vn의 a1v1 + ... + anvn가 와 같아지는 경우가 오직 a1 = ... = an = 0 인 경우 뿐일 때 벡터 v1, ... , vn일차독립(linearly independent)이라고 한다. 그렇지 않을 때 즉, 스칼라 a1, ... , an중에 0이 아닌 것이 있는데도 불구하고 일차결합 a1v1 + ... + anvn가 영벡터와 같아지는 경우가 생길 때 벡터 v1, ... , vn일차종속(linearly dependent)이라고 한다.


정의 33.  span(생성한다)

W가 V의 이라고 하자. W안의 임의의 벡터 u가 벡터 v1, ... , vn의 으로 표시되고, 또 역으로 벡터 v1, ... , vn의 으로 표시되는 모든 벡터가 W에 속할 때 벡터 v1, ... , vn은 W를 생성한다(span)고 한다.


정의 34. basis(기저)

V안의 벡터 v1, ... , vn이 다음 두 가지 조건을 만족할 때 집합 {v1, ... , vn}을 V의 기저(basis)라고 한다.

 

(i) 벡터 v1, ... , vn은 이다.

(ii) 벡터 v1, ... , vn은 V를 한다.    top3.gif 


정의 35. (차원)

V안의 가 n개의 벡터로 이루어져 있을 때 V의 차원(dimension)은 n이라 하고, 기호 dim V = n 으로 나타낸다. 모든 자연수 k에 대하여

V안에서 인 벡터 v1, ... , vk 가 존재할 때 V를 무한차원 벡터공간이라 하고, 기호 dim V = ∞ 로 나타낸다.


참고

만일 V의 두 가 서로 다른 개수의 벡터들로 이루어져 있다면, 정의 7에서의 정의는 잘 못된 것이다. 그러나 에 의하여 두 기저는 같은 개수의 벡터들로 이루어져 있으므로 정의 7에서 의 정의는 잘 정의된 것이다.


정의 36. (기저에 관한 좌표)

집합 B = {v1, ... , vn} 이 V의 라고 하자. V안의 벡터 v가 일차결합 c1v1 + ... + cnvn 으로 표현될 때 스칼라 c1, ... , cn 들의 n-tuple (c1, ... , cn) 을 벡터 v의 주어진 기저B에 관한 좌표라고 한다.


정의 37 . V, W가 벡터공간이고 L:V→W이 선형변환일 때, L에 의한 상이 0이 되는 V의 벡터 전체의 집합을 L의 (kernel)이라 하고 kerL로 나타낸다.


정의 38. 정사각행렬 A, B에 대하여 다음을 만족하는 가역행렬 P가 존재할 때 B는 A와 닮은(similar)행렬이라고 한다.

B=P-1AP top3.gif    


정의 39. 고유공간

λ가 n차의 정사각행렬 A의 고유값일 때, 동차연립방정식 (λIn -A)x=0의 해공간을 λ에 대응하는 A의 고유공간(eigenspace)이라고 한다.

  

위 정의에 의하여 λ에 대응하는 A의 고유공간은 λ에 대응하는 A의 고유벡터 전체와 영벡터로 이루어진 집합이며, 이는 벡터공간 Rn부분공간이다.


정의 40. A가 어떤 대각행렬과 닮은행렬일 때 즉, 적당한 가역행렬 P가 존재하여 P-1AP 가 대각행렬일 때 A를 대각화가능한(diagonalizable) 행렬이라 하며 행렬 P는 A 를 대각화하는 행렬이라고 한다.


정의 41. 정사각행렬 A에 대하여 A-1=AT이면 A를 직교행렬(orthogonal matrix)이라고 한다.

 

위 정의로부터 다음은 서로 동치임을 쉽게 알 수 있다. 이것의 증명은 연습문제로 남긴다.

 

(1) A가 직교행렬이다.

 

(2) ATA=In=AAT

 

(3) A의 열(행)벡터들은 정규직교집합을 이룬다. top3.gif


정의 42. 정사각행렬 A에 대하여 A를 대각화하는 직교행렬 P가 존재할 때 즉, P-1AP=D 또는 PTAP=D인 직교행렬 P와 대각행렬 D가 존재할 때 A는 직교대각화가능(orthogonally diagonalizable)하다고 하며 P는 A를 직교대각화하는 행렬이라 한다.

 


*참 고

위의 행렬 A를 다항식의 동반행렬 (Companion matrix) 이라 한다. 행렬 A의 특성 방정식은 바로 p(x)이다. 또, 위의 다항식 같이 최고차항의 계수가 1인 다항식을 모닉(monic)다항식이라고 한다.


정 의 실수 a, b와 i=sqrt(-1)에 대하여 z=a+bi를 복소수(complex number)라 한다.

위와 같이 정의된 복소수 z=a+bi에 대하여 a를 이 복소수의 실수부분, b를 허수부분이라 하며 복소수 전체의 집합을 C로 나타낸다. 즉,

C= {a+bi: a, b∈R} 복소수 z=a+bi에서 b=0이면 z=a+0i이므로 임의의 실수는 허수부분이 0인 복소수이다. 또한, a=0이면 z=0+bi=bi이다. 이와같이 실수부분이 0인 복소수를 순허수(pure imaginary number)라 한다.


정 의43. 두 복소수 z1=a1+b1i, z2=a2+b2i 에 대하여 a1=b1, a2=b2이면,z1=z2 한다.top3.gif


* 켤레복소수(conjugate), 절대값(modulus)

복소수 z=a+bi에 대하여 복소수 a-bi를 z의 켤레복소수(conjugate)라 하고 z-로 나타낸다. 즉,z-=a-bi 또한, 복소수 z=a+bi의 절대값(modulus) |z|를 다음과 같이 정의한다.

|z|=sqrt(a2+b2)


정 의 44 . 노름(norm) 

Cn의 두 벡터 u=(u1, u2, ... ,un), v=(v1, v2, ... ,vn)의 유클리드 내적 u·v, u의 유클리드 노름 ||u||, u 와 v 사이의 유클리드거리 d(u, v)를 각각 다음과 같이 정의한다.

 

top3.gif


정 의45.복소벡터공간 V의 임의의 벡터u, v, w와 스칼라 c∈C에 대하여 다음 조건을 만족하는 V×V에서 C로의 함수 < , >를 V의 내적 (또는 Hermitian 내적)이라 한다.

내적을 갖는 복소벡터공간을 복소내적공간(complex inner product space)또는유니타리공간(unitary space)이라 한다. 또한, 영아닌 복소벡터 u, v에 대하여, <u, v>=0이면 u 와 v는 직교한다(orthogonal)고 한다.

내적공간의 정의로 부터 다음 성질을 바로 얻을 수 있다.


정 의46. 복소내적공간 V에서 벡터 u의 노름(norm)과, V의두 벡터 u, v사이의 거리(distance)를 각각 다음과 같이정의한다.


* Cn 에서의 Cauchy-Schwarz 부등식, 삼각부등식 유클리드 내적이 정의되어 있는 복소내적공간 Cn의 두 벡터

 

이다. 이것을 각각 Cn 에서의 Cauchy-Schwarz 부등식, 삼각부등식이라고 한다.top3.gif


정 의47. 복소행렬 A 가 A=A* 이면, A 를 Hermitian행렬이라 한다.


정 의 48.복소행렬 A 가 A=-A* 이면 A를 반-Hermitian(skew-Hermitian) 행렬이라 한다.


정 의 49 .행렬 U∈Mn(C)가 U*U=In이면 U를 유니타리(unitary)행렬이라고 한다.

정의에 의하여 U가 유니타리행렬이면 U*=U-1이다. 또한, U 의 j번째 열벡터를uj라 하면

이므로 U가 유니타리행렬일 필요충분조건은 U의 열들이 정규직교집합을 이룬다.


* Jordan 표준형

모든 행렬이 대각화가능한 것은 아니지만 Schur정리를 이용하면 대각화가능하지 않은 행렬 A도 대각행렬과 유사한 행렬 JA와 닮음(similar)이 되게 할 수 있다. 이러한 행렬 JA를 A의 Jordan 표준형이라 한다. Jordan표준형을 이용하면 모든 행렬을 대각행렬과 유사한 행렬 JA로 바꾸어 행렬 A에 관한 계산및 이론을 전개 할 수 있다. 이러한 Jordan 표준형을 구하는 방법 등은 7장 5절을 참조하기 바란다.


정 의50 .

을 이차방정식 (1)에 관한 이차형식이라고 한다. top3.gif


정 의 51. A=[aij]가 n차의 실대칭행렬이고, n개의 변수 x1,x2 , ... , xn 을 성분으로 갖는

Rn상의 이차형식이라한다.

 


* Hessian행렬

임계점(critical point) : f의 일계편도함수는 a에서 모두 0.

f의 Hessian행렬 :x=a에서 f의 이계 편도함수를 성분으로 가지는 다음과 같은 n차의 대칭행렬 H

 

x=a 에서 함수 f의 이차형식은 q(x)=xTAx 로 정의한다. 여기서 H는 (3)과 같은 Hessian 행렬이다.


*참고   안장점

정리 8.6 함수 f:Rn →R가 임계점 x=a에서 연속인 3계편도함수를 갖고, 이 점에서 f의 이차형식을 q(x)=xTHx 라고 할 때, 다음이 성립한다.

(1) q가 양의 정부호이면 f(a)는 극소값이다.

(2) q가 음의 정부호이면 f(a)는 극대값이다.

(3) q가 부정부호이면, f(a)는 극대값도 아니고 극소값도 아니다.

이때, x=a 를 안장점(saddle point)이라고 한다.


*참고 극대극소판정법

정리 8.6 에서 n=2 일때 f 가 이변수함수가 되고 f의 Hessian행렬이 (4)와 같으므로 정리 8.5 와 8.6 에 의하여 미적분학에서 배운 이변수함수의 극대극소판정법을 얻는다.top3.gif