Linear Algebra with Sage

<Quadratic Form>


Made by SKKU Linear Algebra Lab (2011)



Quadratic Form Example : @@3x^{2}+2xy+3y^{2}@@


Def

@@\begin{bmatrix}x & y\end{bmatrix}\begin{bmatrix}a & b \\ b & c\end{bmatrix}\begin{bmatrix}x \\ y\end{bmatrix}=ax^{2}+2bxy+cy^{2}@@                             

is a quadratic form of  @@ax^{2}+2bxy+cy^{2}+dx+ey+f=0@@. 


Example

 @@2x^{2}+6xy+y^{2},  x^{2}+y^{2}@@ are Quadratic Forms, @@3x^{2}-6xy+y^{2}-3x+1@@ is not.        


 Sketch a graph@@3x^{2}+2xy+3y^{2}=8@@.

(함수 @@3x^{2}+2xy+3y^{2}=8@@의 implicit 그래프를 그린다.)

implicit_plot(3*x^2+2*x*y+3*y^2==8, (x,-3,3), (y,-3,3)).show(aspect_ratio=1)


Quadratic Form을 분석하기 위하여 고유값과 고유벡터를 이용한다. 즉,
 

@@q(\textbf{x})=\textbf{x}^{T}A\textbf{x}=ax^{2}+2bxy+cy^{2}@@ 일 때 @@\textbf{x}=P\textbf{x}'@@로 치환하면,

 

@@q(\textbf{x})=\textbf{x}^{T}A\textbf{x}=(P\textbf{x}')^{T}A(P\textbf{x}')=(\textbf{x}')^{T}(P^{T}AP)\textbf{x}'@@

 

                           @@=\begin{bmatrix}x' & y'\end{bmatrix}\begin{bmatrix}\lambda_1 & 0 \\ 0 & \lambda_2\end{bmatrix}\begin{bmatrix}x' \\ y'\end{bmatrix}=\lambda_{1}(x')^2+\lambda_{2}(y)^2@@

                        

이와같이 주어진 행렬 @@A@@를 대각화하면 graph 가 단순해 진다. 따라서 분석이 쉬워진다.


Define a matrix @@A@@and @@X@@. (행렬 @@A@@와 행렬 @@X@@를 정의한다.)

var('x,y');

A=matrix([[3,1],[1,3]]);

X=matrix([x,y]);


Find eigenvectors of @@A@@. (@@A@@의 고유벡터를 구한다.)

ev=A.eigenvectors_right();

ev


Find a matrix @@Q@@ and its inverse.
(행렬 @@A@@를 직교대각화하는 행렬 @@Q@@를 구하고 그 역행렬을 구한다.)

P=matrix([ev[0][1][0],ev[1][1][0]]).transpose();

Q=P/(norm(P));

QI=Q.inverse();

Q, QI


Diagonalize matrix @@A@@. (행렬 @@A@@를 대각화한다.)

D=QI*A*Q;

D


@@A@@와 닮음인 대각선행렬을 구하는 과정은 완전제곱식과 축이동의 과정을 포함한다.

이 과정을 통하여 그래프의 본질에 대한 이해를 쉽게 할 수 있는 것이다.


Sketch a graph @@\lambda_{1}x^{2}+\lambda_{2}y^{2}=8@@.
(함수 @@\lambda_{1}x^{2}+\lambda_{2}y^{2}=8@@의
implicit
그래프를 그린다.)

implicit_plot(2*x^2+4*y^2==8, (x,-3,3), (y,-3,3)).show(aspect_ratio=1)


 행렬 @@A@@를 대각화하거나 또는 고유값만 구하여 분석하여도, 원래 그래프의 모양이 쌍곡선이나, 포물선이 아닌 타원임을 쉽게 알 수 있다.


[보충설명]   ***************************************************


정  의

@@A=\begin{bmatrix}a_{ij}\end{bmatrix}@@가@@n@@차의 대칭행렬이고, @@n@@개의 변수 @@x_1, x_2, \cdots, x_n@@을 성분으로 갖는 @@R^n@@의 벡터 @@\textbf{x}=\begin{bmatrix}x_1\\x_2\\\vdots\\x_n\end{bmatrix}@@ 에 대하여 이차다항식

@@q(\textbf{x})=(\left\langle A\textbf{x},\textbf{x} \right\rangle=) \textbf{x}^{T}A\textbf{x}=\sum_{i,j=1}^n a_{ij}x_{i}x_{j}@@ 을 @@R^{n}@@상의 이차형식이라 한다. 


이제, 두 변수 @@x, y@@를 갖는 이차방정식 (1)의 그래프는 원뿔곡선(conic section)임을 보이자. 원뿔곡선이란 용어는  평면이 원뿔과 교차될 때 생기는 곡선에서 유래된 말이다. 방정식 (1)을 만족하는 점 @@(x, y)\in\mathbb{R}^2@@ 가 없을 때는 식  (1)을 허 원뿔곡선(imaginary conic)의 방정식이라 한다. 또한, 방정식 (1)의 그래프가 한 점, 한 직선, 또는 한 쌍의 직선으로 이루어지거나 존재하지 않을 때, 이 그래프를 퇴화 원뿔곡선(degenerate conic)이라고 한다. 이 경우는 단순하므로 우리가 좀더 관심을 갖는 경우는 퇴화되지 않는 정상적인 경우이다. 정상적인 원뿔곡선(nondegenerate conic section)의 그래프는 타원, 쌍곡선 또는 포물선이 된다.


                

                                        <그림 8.3>

 

원뿔곡선의 방정식이 다음의 식 (3), (4), (5)로 표현되면 이 원뿔곡선은 표준위치(standard position)에 있다고 한다.


                       @@\frac{x^{2}}{a^{2}}+\frac{y^{2}}{b^{2}}=1@@     (타원)               (3)

 

                        

                                <그림 8.4> : 타원

 

 

                       @@\frac{x^{2}}{a^{2}}-\frac{y^{2}}{b^{2}}=1@@ 또는 @@\frac{x^{2}}{a^{2}}-\frac{y^{2}}{b^{2}}=-1@@     (쌍곡선)               (4)

 

                        

                                <그림 8.5> : 쌍곡선

 

 

                        @@y^{2}=ax@@ 또는 @@x^{2}=ay@@     (포물선)               (5)

 

                        

                                <그림 8.6> : 포물선 (@@a>0@@인 경우)


 

필수학습

이차형식의 대각화

이차방정식에서 @@xy@@항을 교차항이라 한다. 교차항을 갖는 이차방정식의 그래프를 쉽게 그리는 방법은 좌표계를 직교변환에 의해 회전하여 교차항을 제거하는 것이다. 이렇듯 교차항을 제거하기위한 좌표계의 변환과 관계되는 것이 대각화이다.


이차형식

@@q(\textbf{x})=\textbf{x}^{T}A\textbf{x}=ax^{2}+2bxy+cy^{2}@@               (7)

은 @@b\ne0@@ 이라면 교차항을 갖는다.

이제, 행렬 @@A=\begin{bmatrix} a& b\\b&c\end{bmatrix}@@의 고유값 @@\lambda_{1},\lambda_{2}@@에 대응하는 @@A@@의 정규직교인 고유벡터@@\textbf{v}_1,\textbf{v}_2@@에 대하여 @@P=\begin{bmatrix}\textbf{v}_1  :  \textbf{v}_2\end{bmatrix}@@라 하면 @@A@@가 대칭행렬이므로 이러한 @@P@@에 의하여 @@A@@는 대각화 가능하다. 따라서 @@P^{T}AP=\begin{bmatrix}\lambda_1&0\\0&\lambda_2\end{bmatrix}@@이다.

여기서, 고유벡터 @@\textbf{v}_1@@ 과@@\textbf{v}_2@@ 는 @@\lambda_{1}@@과 @@\lambda_{2}@@의 역할을 바꾸어서 교환 할 수 있으므로 일반성을 잃지 않고 @@det(P)=1@@이라 할 수 있고  직교행렬 @@P@@는 @@\begin{bmatrix}cos\theta & -sin\theta \\ sin\theta& cos\theta \end{bmatrix}@@ 꼴의 @@R^2@@의 회전행렬이다. 이러한 행렬 @@P@@에 의하여 얻어진  새로운 좌표계를 @@x'y'-@@좌표계라 하고 @@\textbf{x}'=\begin{bmatrix}x' & y'\end{bmatrix}@@이라 하자.  그러면 @@\textbf{x}=P\textbf{x}'@@ 이고

@@q(\textbf{x})=\textbf{x}^{T}A\textbf{x}=(P\textbf{x}')^{T}A(P\textbf{x}')=(\textbf{x}')^{T}(P^{T}AP)\textbf{x}'@@

 

                           @@=\begin{bmatrix}x' & y'\end{bmatrix}\begin{bmatrix}\lambda_1 & 0 \\ 0 & \lambda_2\end{bmatrix}\begin{bmatrix}x' \\ y'\end{bmatrix}=\lambda_{1}(x')^2+\lambda_{2}(y)^2@@

이므로 이차형식 @@q@@는 새로운 좌표계에서는 교차항이 없이 표현된다. 따라서 다음정리를 얻는다.     


정리 8.4.1

 [@@R^{2}@@의 주축정리]

 대칭행렬 @@A\in{M_2}@@ 의 고유값을 @@\lambda_{1},\lambda_{2}@@라 할 때, 좌표축의 회전에 의하여 이차형식 @@q(\textbf{x})=\textbf{x}^{T}A\textbf{x}@@는 새로운 @@x'y'-@@좌표계에서

@@q(\textbf{x}')=\lambda_{1}(x')^2+\lambda_{2}(y)^2@@               (8)

으로 표현될 수 있다. 이 회전은 행렬식이 1이고 @@A@@ 를 대각화하는 직교행렬을 @@P@@라 할 때  @@\textbf{x}=P\textbf{x}'@@이라는 치환에 의하여 얻어진다.

 

이차형식 (7)을 식 (8)과 같이 제곱항의 합으로만 간단히 나타내는 것을 이차형식의 대각화라고 한다. 항을 갖는 그래프는 다음

예제 5

에서 알 수 있듯이, 표준위치로 부터 회전 이동된 원뿔곡선이다.

 


예제 5

 이차형식의 대각화를 이용하여 다음 방정식이 어떤 이차곡선을 나타내는지를 결정하시오.

                @@3x^{2}+2xy+3y^{2}-8=0@@               (9)

 

풀이

이차방정식  @@3x^{2}+2xy+3y^{2}-8=0@@ 은

@@\textbf{x}^{T}A\textbf{x}=\begin{bmatrix}x & y\end{bmatrix}\begin{bmatrix}3 & 1 \\ 1 & 3\end{bmatrix}\begin{bmatrix}x \\ y\end{bmatrix}=8@@

로 나타낼 수 있고, @@A@@의 특성방정식은

 

@@\left| A-\lambda I \right|=(3-\lambda)^{2}-1=(\lambda-2)(\lambda-4)=0@@

                

 이므로 고유값은 @@\lambda_1=2, \lambda_2=4@@ 이다. 따라서

정리 8.4.1

에 의하여

@@q(\textbf{x})=\textbf{x}^{T}A\textbf{x}=2(x')^2+4(y')^2@@

이다. 따라서 새로운 좌표계에서 이차곡선의 방정식은

 

@@2(x')^2+4(y')^2=8@@

                

이다. 그런데 고유값 @@\lambda_1=2, \lambda_2=4@@에 대응하는 정규직교인 고유벡터들은

@@\textbf{v}_1=\begin{bmatrix}\frac{1}{\sqrt{2}} \\ -\frac{1}{\sqrt{2}}\end{bmatrix},\textbf{v}_2=\begin{bmatrix}\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}}\end{bmatrix}@@

                  

이므로 직교행렬 @@P@@는

 

@@P=\begin{bmatrix}\frac{1}{\sqrt{2}}& \frac{1}{\sqrt{2}} \\ -\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \end{bmatrix}=\begin{bmatrix} cos(-45°) & -sin(-45°)\\ sin(-45°) & cos(-45°) \end{bmatrix}@@


이다. 따라서 @@x'y'-@@축은 @@xy-@@축을 시계 반대 방향으로 -45°만큼 (즉, 시계 방향으로 45°만큼) 회전한 축이고, 식 (9)는 @@x'y'-@@축에서의 타원이다.

                                

                                    <그림 8.7> (수정: @@x'@@ 와 @@y'@@ 축을 주고 @@z@@ 는 2로)     


이제 처음 도입한 이차형식 @@ax^{2}+2bxy+cy^{2}+dx+ey+f=0@@ 을 대각화를 이용하여 어떤 곡선이 되는지 알아보자. @@B=[  d    e  ]@@라 하면 이차방정식 (7)은 @@\textbf{x}^{T}A\textbf{x}+B\textbf{x}+f=0@@로 표현되고,

정리 8.4.1

의 직교행렬 @@P@@를 이용하여   @@\textbf{x}=P\textbf{x}'@@으로 치환하면  다음과 같이 나타낼 수 있다.

@@(\textbf{x}')^{T}(P^{T}AP)\textbf{x}'+BP\textbf{x}'+f=0@@ 

이때,@@[  d'   e' ]=BP=[  d   e  ][  \textbf{v}_{1}   \textbf{v}_{2}  ]@@ 이라 하고, 위의 식을 정리하면 다음을  얻는다 <교차항이 소거된다>.

 

@@\lambda_{1}(x')^2+\lambda_{2}(y')^2+d'x'+e'y'+f=0@@

 

@@\textbf{x}=P\textbf{x}'@@ (또는 @@\textbf{x}'=P^{T}\textbf{x}@@)에서, 변환행렬 @@P@@는 주어진 벡터를 시계반대 방향으로 각 @@\theta@@만큼 회전시키므로 변환행렬의 모양은 다음과 같다.

           (참고로 이다.)

        이 의미는 @@\textbf{x}@@좌표축과 새 좌표축 @@\textbf{x}'@@ 사이에 각 @@\theta@@만큼의 차이가 있다는 의미이고 더 나아가 좌표축의 입장에서 보면 @@\textbf{x}'@@좌표축은 @@\textbf{x}@@좌표축을 각@@\theta@@만큼  시계방향으로 회전하여 얻어진 것으로 생각할 수 있다.

          따라서 이므로 축을 시계방향으로만큼 회전하여 얻어진 좌표축이 축이다.


예제 6

 다음 방정식의 그래프를 그려라.

                                          (10)

풀이

  라 하면 식 (10)의  행렬 표현은

                                                      (11)

        이다.  먼저 회전이동을 하여 교차항을 소거하자. 의 특성 방정식

                 

        으로부터 의 고유값은, 이고, 이에 대응하는 정규직교인 고유벡터는 각각

                 

        이므로      

                

        이다. 의 주축정리에서이므로

                =,

                  =

        이고, 따라서 식 (11) 로 부터 다음을 얻는다.

                 .                                (12)

          이제, 평행이동을 하여 방정식 (12)의 을 소거하자. 식 (12)을 완전제곱꼴로 바꾸면

                

        즉,

                     

        이므로 식 (11)은 좌표축을 축 방향으로 1만큼 평행이동한 축에서 다음과 같이 나타내어지는 타원의 방정식이다.                                                   

                

                                

                                        <그림 8.8>


          이제, 이차형식의 대각화를 이용하여 3차원 곡면에 대하여 알아보자.

          이차형식 (7) 을

                                                      (13)

        라 하고 이것을 대각화하면 회전된 -좌표계에서는

                                                           (14)

        으로 변환 되므로 상에서 식 (13) 의 그래프를 쉽게 알 수 있다.

          식 (14) 에서 , 가 모두 양이라면, 이 그래프는 <그림 8.9(a)> 와 같이 위쪽이 열린 포물면(paraboloid)이다. 또한, , 가 모두  음이라면 <그림                 8.9 (b)>와 같이 아래쪽이 열린 포물면이다. 이러한 포물면의 수평절단면은 타원이므로 타원포물면(elliptic paraboloid)이라고 한다.


                        

                                <그림 8.9> : 타원포물선


          또한 식 (14) 에서, 가 모두 영이 아니고 서로 다른 부호이면, 이 그래프는 <그림 8.10(a)>와 같이 안장 모양의 쌍곡포물면(hyperbolic paraboloid)이 된다. , 중 하나가 영이라면, 그래프는 <그림 8.10(b)>와 같은 포물기둥(parabolic cylinder)이 된다.

                        

                        (a) 쌍곡포물선           (b) 포물기둥

                                      그림 8.10


정  의

행렬 가 대칭행렬일 때, 이차형식  모든  에 대하여 이면 양의 정부호(positive definite), 이면 음의 정부호(negative definite)라 한다.  또한, 어떤 에 대하여는 > 0 이고, 어떤 에 대하여는 < 0 이면 부정부호(indefinite) 라 한다.


정리8.5.1

 [의  주축정리]

          를 대칭행렬 의 이차형식이라 하고 를 직교 대각화하는 직교행렬이라 하자. 그러면 치환 에 의하여              의 고유값이라 할 때 는 다음과 같이 나타낼 수 있다.

                                           (1)


정리8.5.2

 행렬 가 대칭행렬일 때, 의 이차형식 는 다음을  만족한다.

                (1) 의 고유값들이 모두 양이라면

                        는 양의 정부호(positive definite) 이다.

                (2) 의 고유값들이 모두 음이라면

                        는 음의 정부호(negative definite) 이다.

                (3) 가 양의 고유값과 음의 고유값 모두 가지면

                        는 부정부호(indefinite) 이다.


정리8.5.3

 에 대한 이차형식이라 하고                  이라 하자.  그러면 다음이 성립한다.

                (1) 이고 이면 는 양의 정부호 이다.

                (2) 이고 이면 는 음의 정부호 이다.

                (3) 이면 는 부정부호 이다.


 

정리8.5.3

차원으로 자연스럽게 일반화가 가능하다. 대칭행렬                    소행렬식을 각각

                

        이라 할 때, 선행 주 소행렬식(leading principal minors)이라고 한다. 아래는 주 부분행렬을 보여준다.


        

                                                 

                                <그림 8.12>


정리8.5.4

 대칭행렬 의 정상적인 이차형식 에 대하여 다음이 성립한다.

                (1) 가 양의 정부호일 필요충분조건

                        모든 에 대하여 이다.

                (2) 가 음의 정부호일 필요충분조건

                        모든 에 대하여 이다.


이제, 위에서 정의한 양의 정부호등의 성질이 극대, 극소 문제를 푸는데 어떻 게 적용되는지를 알아보자.

          먼저, 에서 두 번 편미분가능한 실변수 함수 를 생각하자.

          가 극소값 또는 극대값이 되려면,  우선임계점(critical                 point) 이어야 한다.  즉, 의 일계편도함수는 에서 모두 이어야 한다. 다   가 극소값 또는 극대값이 되기 위한 충분조건을 얻으려면 임계점  에서 이계 편도함수를 생각해 보아야 한다.  에서 의 이계 편도함수를 성분으로 가지는 다음과 같은차의 대칭행렬 Hessian 행렬이라고 한다.

                                                         (3)

          예를 들어, 만일 =2 이면 의 Hessian 행렬 는 다음과 같다.

                                          (4)

           에서 함수 의 이차형식은 로 정의한다. 여기서 는 (3)과 같은 Hessian 행렬이다.


정리8.5.5

   함수 가 임계점 에서 연속인 2계 편도함수를 갖고, 이 점에서 의 이차형식을 라고 할 때,  다음이 성립한다.

        (1) 가 양의 정부호이면 는 극소값이다.

        (2) 가 음의 정부호이면 는 극대값이다.

        (3) 가 부정부호이면, 는 극대값도 아니고 극소값도 아니다.

          이때, 안장점(saddle point)이라고 한다.


          

정리8.5.5

에서 =2 일때 가 이변수함수가 되고 의 Hessian행렬이 (4)와 같으므로

정리8.5.4

정리8.5.5

에 의하여 미적분학에서 배운 이변수함        수의 극대극소판정법을 얻는다.


예제 6

 함수 의 극값을 구하라.

풀이

            

        이므로 의 임계점은 이다. 또한

                 

        이므로, 에서 의 Hessian행렬은 다음과 같다.

                

          그런데 이므로 가 음의 정부호이고         의 극대값이다.                                                 


예제 7

 다음 함수의 극값을 구하라.

                

풀이

,

        이므로 의 임계점은 이 정수일 때 이다.

        (i) 일 때,  의 Hessian 행렬은

                         

        이고 이므로          에서 양의 정부호이다.  따라서 의 극소값이다.

        (ii) 일 때,의 Hessian 행렬은

                         

                 이고, 이다.

          에서 부정부호이다. 따라서, 의 안장점이다. □