ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 행렬의 기초 - 역행렬
    수리물리 2023. 3. 10. 17:17
    반응형

     

    이전에 행렬(matrix)의 곱셈에 대한 항등원(identity)를 다뤘었다. 이 항등원을 단위 행렬(unit matrix)라고 부르고 대각 성분(diagonal element)가 전부 \(1\)이고 나머지 성분은 \( 0 \)인 행렬이었다.

     

    항등원이 존재하기 때문에 행렬의 곱셈에 대한 역원(inverse)가 존재하는데 문제는 이 역원을 쉽사리 구할 수 없다. 그래서 긴 시간동안 역원을 유도하기 위한 성질들을 다뤘었다.

     

    연산에서 역원이라는 것은 어떤 행렬 \( A \)와 \( A \)의 역원 \( A^{-1} \)이 존재해서 \( A \)와 \( A^{-1}\)을 곱할 경우 단위 행렬이 나와야 하는 행렬을 의미한다.

    $$ A A^{-1} = I \tag{1}$$ 

     

    식 (1)은 행렬 곱셈의 특성상 정사각 행렬(square matrix)에서 가능한 계산이다. 그렇다면 실제로 이러한 행렬이 존재할 수 있는지 그리고 어떻게 구해야 하는지 다뤄보자.

     

     

    먼저 시작은 크레머 법칙(Cramer's rule)에서 했었듯이 어떤 연립 방정식 문제를 행렬을 이용해서 표현해보자.

    $$ A \vec{x} = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{pmatrix} \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix} = \begin{pmatrix} m_1 \\ m_2 \\ \vdots \\ m_n \end{pmatrix} = \vec{m} \tag{2}$$

     

    \( A \)의 역행렬 \( A^{-1} \)이 존재해서 식 (2)의 양변에 이 역행렬을 곱해주자. 그러면 다음과 같이 정리할 수 있다.

    $$A^{-1 }A \vec{x} = I \vec{x} = \vec{x} = A^{-1} \vec{m} \tag{3}$$

     

    아직까지 역행렬이 어떤 행렬인지는 자세히 알 수 없지만 적어도 식 (3)을 만족하기 위해선 \( n \times n\) 행렬이어야 함은 명백하다. 따라서 뭔진 모르지만 다음과 같이 표현해보자.

    $$ \vec{x} = \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix} = \begin{pmatrix} a_{11}^{\prime} & a_{12}^{\prime} & \cdots & a_{1n}^{\prime} \\ a_{21}^{\prime} & a_{22}^{\prime} & \cdots & a_{2n}^{\prime} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1}^{\prime} & a_{n2}^{\prime} & \cdots & a_{nn}^{\prime} \end{pmatrix} \begin{pmatrix} m_1 \\ m_2 \\ \vdots \\ m_n \end{pmatrix} = A^{-1} \vec{m} \tag{4}$$

     

     

    그런데 \( \vec{x} \)의 각 성분들은 크레머 법칙을 이용해서 구할 수 있다. 대표적으로 \( x_1 \)을 생각해보자.

    $$ x_1 = \frac{1}{D} \begin{vmatrix} m_1 & a_{12} & \cdots & a_{1n} \\ m_2 & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ m_n & a_{n2} & \cdots & a_{nn} \end{vmatrix} \tag{5}$$

     

    이번엔 행렬식(determinant) 계산법을 통해서 식 (5)에 있는 행렬식을 전개해보자.

    $$ x_1 = \frac{1}{D} \left[ m_1 \begin{vmatrix} a_{22} & a_{23} & \cdots & a_{2n} \\ a_{32} & a_{33} & \cdots & a_{3n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n2} & a_{n3} & \cdots & a_{nn} \end{vmatrix} - m_2 \begin{vmatrix} a_{12} & a_{13} & \cdots & a_{1n} \\ a_{32} & a_{33} & \cdots & a_{3n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n2} & a_{n3} & \cdots & a_{nn} \end{vmatrix} + \cdots \right] \tag{6}$$

     

    식 (4)와 연계해주면 다음과 같은 식이 만들어진다.

    $$\begin{matrix} x_1 & = & a_{11}^{\prime} m_1 + a_{12}^{\prime} m_2 + \cdots + a_{1n}^{\prime} m_n \\ & = & \frac{1}{D} \left[ m_1 \begin{vmatrix} a_{22} & a_{23} & \cdots & a_{2n} \\ a_{32} & a_{33} & \cdots & a_{3n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n2} & a_{n3} & \cdots & a_{nn} \end{vmatrix} -m_2 \begin{vmatrix} a_{12} & a_{13} & \cdots & a_{1n} \\ a_{32} & a_{33} & \cdots & a_{3n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n2} & a_{n3} & \cdots & a_{nn} \end{vmatrix} + \cdots \right] \end{matrix} \tag{7}$$

     

    식 (7)에서 각각 \( m_k \)에 비례하는 상수가 같아야 한다. 따라서 크레머 법칙에서 나오는 행렬식이 역행렬의 성분이 됨을 알 수 있다. 나머지 \( x_i \)에 대해서도 마찬가지를 생각해줄 수 있다.

     

     

    이제 크레머 법칙으로 돌아가서 역행렬 성분의 특징을 생각해보자. 행렬식을 만들 때 \( x_i \)의 경우 \( i \)열을 행렬식의 성질을 잘 이용해서 \( m_k \)들로 바꿨다.

     

    그다음 \( i \)열을 기준으로 행렬식 전개를 해주면 여인수(cofactor)의 행렬식들이 각각 \(m_k\)의 계수(coefficient)들이 되며 이 값이 역행렬의 성분이 된다. 즉, 역행렬의 성분은 여인수와 관계가 있다.

     

    이를 토대로 생각해보면 역행렬의 \( i \)행 \( k \)열 성분 \( a_{ik}^{\prime} \)는 \( m_k \)의 계수가 되고 이 계수는 원래 행렬의 \( i \)열을 기준으로 했을 때 짠 행렬식의 전개에서 \( m_k \)의 계수가 된다는 뜻이다.

     

    근데 이 성분은 원래 행렬의 \(k\)행 \(i\)열 성분의 여인수가 된다. 여기에 행렬식을 전개하는 과정에서 치환군(permutation)을 고려해서 식을 정리하면 다음과 같이 쓸 수 있다.

    $$a_{ik}^{\prime} = \frac{(-1)^{i+k}}{D} C_{ki} \tag{8}$$

    식 (7)의 앞부분에 행렬식으로 나눈 항이 있음을 잊지 말자.

     

    전치 행렬(tanspose matrix)는 행렬식의 값이 바뀌지 않는다. 따라서 여인수 행렬의 행렬식도 변하지 않게 되므로 다음과 같이 식 (8)이 정리된다.

    $$a_{ik}^{\prime} = (-1)^{i+k} C^T_{ik} \tag{9}$$

     

     

    이를 토대로 가장 대표적인 다음과 같은 \( 2 \times 2 \) 역행렬 공식을 만들어보자.

    $$ A = \begin{pmatrix} a & b \\ c & d \end{pmatrix} \tag{10}$$

     

    이 식의 행렬식을 구하면 다음과 같다.

    $$ \det A = ad - bc \tag{11}$$

     

    \( a \)의 여인수는 \( d \)이고 치환군이 배정하는 숫자는 \( 1 \)이다. 마찬가지로 계속하면 \( b \)의 여인수는 \( c \)이고 치환군은 \( - 1 \), \( c \)의 여인수는 \( b \), 치환군은 \( - 1\), \( d\)의 여인수는 \( a \), 치환군은 \( 1 \)이다.

     

    역행렬의 \( 1\)행 \( 1 \)열 성분은 \( a \)의 전치 성분의 여인수이며 이 경우 \( a \)는 전치를 취해봤자 변하지 않는 대각 성분이기 때문에 여인수는 \( d \)다. 여기에 치환군을 곱하면 된다.

     

    \( 1 \)행 2열 성분의 경우 \( b\)의 전치 성분 \( c \)의 여인수 \( b\)가 역행렬 성분과 관련되고 여기에 치환군 \( - 1\)을 곱한 \( - b \)가 역행렬의 성분이다. 이런 행동을 모든 성분에 대해 반복해서 역행렬을 구할 수 있다.

    $$A^{-1} = \begin{pmatrix} \frac{d}{ad -bc} & \frac{-b}{ad - bc} \\ \frac{-c}{ad - bc} & \frac{a}{ad - bc} \end{pmatrix} = \frac{1}{ad - bc} \begin{pmatrix} d & - b \\ -c & a \end{pmatrix} \tag{12}$$

     

    실제로 식 (12)에서 구한 역행렬을 \(  A \)와 곱해주면 단위 행렬이 나와서 역행렬이 맞음을 알 수 있다.

     

     

    또한 행렬식을 고려하지 않고 \( A \) 행렬의 각 성분의 여인수로 만든 여인수 행렬에 치환군까지 적용시킨 행렬을 생각할 수 있다. 이 행렬을 수반 행렬(adjoint matrix)이라고 표현하며 다음과 같이 표현한다.

    $$\rm{adj} (A)_{ij} = C_{ij}^T \tag{13}$$

     

    이제 이 표현법을 사용해서 역행렬을 수반 행렬로 표현할 수 있다.

    $$ A^{-1} = \frac{1}{\det A} \rm{adj} (A) \tag{14}$$

     

     

    마지막으로 우리가 역행렬을 구하는 과정에서 크레머 법칙을 자연스럽게 사용했다. 그러나 행렬식이 \( 0 \)인 경우 크레머 법칙은 사용할 수 없고 실제로 이런 행렬의 경우 역행렬을 생각할 수 없다.

     

    그래서 행렬식을 먼저 구해서 다루고자 하는 행렬이 역행렬이 존재하는가 안 하는가를 따져야 하며 특히 역행렬이 존재하는 행렬, 다시 말해서 행렬식이 \( 0 \)이 아닌 행렬을 가역 행렬(invertible matrix) 혹은 정칙 행렬(regular matrix)라고 부른다.

     

     

    행렬의 기초 - 단위 행렬과 행렬식

    이번엔 행렬(matrix)의 더 부가적인 성질들과 연산을 알아보자. 1. 곱셈에 대한 항등원(identity) 먼저 행렬의 곱셈에 대한 항등원 \( I \)라 쓰고 이를 구하기 위해 행렬 곱셈의 일반화된 표현을 사용

    boringphys.tistory.com

     

    행렬식의 성질과 표현 - 크래머 법칙

    이번엔 행렬식(determinant)을 이용해서 선형 연립 방정식(linear simultaneous equation)을 푸는 방법인 크래머 법칙(Cramer's rule)을 알아보자. 먼저 \( n \)개의 변수(variable)로 이루어진 1차 방정식들의 경우

    boringphys.tistory.com

     

    행렬의 기초 - 여인수 행렬과 전치 행렬

    1. 여인수 행렬(cofactor matrix) 지난번에 행렬식(determinant)를 구하는 과정에서 소행렬(minor)이라는 개념을 정의했었다. 어떤 임의의 \( n \times n\) 행렬에서 한 성분(element)을 선택해 그 성분이 속한 행(

    boringphys.tistory.com

     

     

    반응형

    댓글

Designed by Tistory.