2.4.3 ケイリー–ハミルトンの定理

2.4.3 ケイリー–ハミルトンの定理

任意の正方複素行列がその特性方程式を満たすという事実は、シュールの定理と、特定のゼロパターンを持つ三角行列の積に関する観察から導かれます。

補題 2.4.3.1

\( R = [r_{ij}],\ T = [t_{ij}] \in \mathbb{M}_n \) が上三角行列であり、\( r_{ij} = 0 \) (ただし \( 1 \le i, j \le k < n \))、かつ \( t_{k+1,k+1} = 0 \) とします。行列積 \( S = [s_{ij}] = RT \) に対して、\( 1 \le i, j \le k+1 \) について \( s_{ij} = 0 \) が成り立ちます。

証明:

仮定より、行列 \( R \) と \( T \) は次のようなブロック構造を持っています:

R = \begin{bmatrix} 0_k & R_{12} \\ 0 & R_{22} \end{bmatrix},\quad
T = \begin{bmatrix} T_{11} & T_{12} \\ 0 & T_{22} \end{bmatrix}

ここで、\( R_{22},\ T_{11},\ T_{22} \) は上三角行列であり、\( T_{22} \) の第1列はすべてゼロです。積 \( RT \) は上三角行列になります。目標は、\( RT \) の左上 \( (k+1) \times (k+1) \) 主小行列がゼロであることを示すことです。\( T_{22} = [0\ Z] \) と分割し、ブロック積を実行すると:

RT = \begin{bmatrix}
0_k T_{11} + R_{12} 0 & 0_k T_{12} + R_{12}[0\ Z] \\
0 T_{11} + R_{22} 0 & 0 T_{12} + R_{22}[0\ Z]
\end{bmatrix}
= \begin{bmatrix}
0_k & [0\ R_{12}Z] \\
0 & [0\ R_{22}Z]
\end{bmatrix}

よって、望まれた左上 \( (k+1) \times (k+1) \) の主小行列がゼロであることがわかります。

定理 2.4.3.2(ケイリー–ハミルトンの定理)

\( A \in \mathbb{M}_n \) の特性多項式を \( p_A(t) \) とすると、次が成り立ちます:

p_A(A) = 0

証明:

\( p_A(t) = (t - \lambda_1)(t - \lambda_2)\cdots(t - \lambda_n) \) と因数分解し、\( A = UTU^* \)(\( U \) はユニタリ、\( T \) は上三角)と書きます。\( T \) の主対角成分は \( \lambda_1, \ldots, \lambda_n \) です。このとき、

p_A(A) = U p_A(T) U^*
= U [(T - \lambda_1 I)(T - \lambda_2 I)\cdots(T - \lambda_n I)] U^*

したがって、\( p_A(T) = 0 \) を示せば十分です。\( T - \lambda_1 I \) の左上 \( 1 \times 1 \) ブロックは 0 であり、\( T - \lambda_2 I \) の (2,2) 要素も 0 です。したがって、補題から左上 \( 2 \times 2 \) 主小行列も 0 です。これを繰り返すことで、帰納的にすべての主小行列が 0 となるため、最終的に \( p_A(T) = 0 \) が従います。

練習問題

以下の議論には何が誤っているでしょうか?
「すべての固有値 \( \lambda_i \) に対して \( p_A(\lambda_i) = 0 \) なので、\( p_A(A) \) の固有値はすべて 0 である。したがって、\( p_A(A) = 0 \) である。」
この誤りを示す例を挙げなさい。

また、次の議論には何が誤っているでしょうか?
「\( p_A(t) = \det(tI - A) \) なので、\( p_A(A) = \det(AI - A) = \det(0) = 0 \)。よって、\( p_A(A) = 0 \)。」

注意事項

ケイリー–ハミルトンの定理はしばしば「任意の正方行列は自分自身の特性方程式を満たす」と要約されます(式 (1.2.3))。しかしこれは慎重に解釈する必要があります。まずスカラー多項式として \( p_A(t) = \det(tI - A) \) を計算し、次に \( t \) を \( A \) に置き換えて \( p_A(A) \) を求めます。

この定理は複素数体上で証明されましたが、したがって実数や有理数などの複素数の部分体上の行列にも成り立ちます。さらに一般に、任意の体、あるいは可換環上の行列に対しても有効です(詳細は (2.4.P3) 参照)。

ケイリー–ハミルトン定理の応用

重要な応用として、\( k \ge n \) のとき、行列の冪 \( A^k \) を \( I, A, A^2, \ldots, A^{n-1} \) の線形結合として表すことができます。

例 2.4.3.3

次の行列を考えます:

A = \begin{bmatrix} 3 & 1 \\ -2 & 0 \end{bmatrix}

このとき、特性多項式は \( p_A(t) = t^2 - 3t + 2 \) なので、\( A^2 - 3A + 2I = 0 \) が成り立ちます。よって、

  • \( A^2 = 3A - 2I \)
  • \( A^3 = A A^2 = 3A^2 - 2A = 3(3A - 2I) - 2A = 7A - 6I \)
  • \( A^4 = 7A^2 - 6A = 15A - 14I \)

さらに、正則行列 \( A \) の負の冪も \( A \) と \( I \) の線形結合で表せます。\( A^2 - 3A + 2I = 0 \) を \( 2I = -A^2 + 3A = A(-A + 3I) \)、すなわち、

I = A \left[\frac{1}{2}(-A + 3I)\right]
\Rightarrow A^{-1} = -\frac{1}{2}A + \frac{3}{2}I

よって、

A^{-2} = (-\frac{1}{2}A + \frac{3}{2}I)^2 = \frac{1}{4}(3A - 2I) - \frac{3}{2}A + \frac{9}{4}I = -\frac{3}{4}A + \frac{7}{4}I

系 2.4.3.4

正則な \( A \in \mathbb{M}_n \) に対し、特性多項式 \( p_A(t) = t^n + a_{n-1}t^{n-1} + \cdots + a_1 t + a_0 \) が与えられたとします。次のように定義すると、

q(t) = -\frac{t^{n-1} + a_{n-1}t^{n-2} + \cdots + a_2 t + a_1}{a_0}

このとき、\( A^{-1} = q(A) \) は \( A \) の多項式で表されます。

証明: \( p_A(A) = 0 \) を \( A(q(A)) = -a_0 I \) と書き直すと、確かに \( A^{-1} = q(A) \) が従います。

練習問題

  • \( A, B \in \mathbb{M}_n \) が相似で、任意の多項式 \( g(t) \) に対して \( g(A) \sim g(B) \) が成り立つことを示しなさい。また、\( A \) と \( B \) が同じ多項式を満たすときに相似であるかどうかを考察しなさい。

例 2.4.3.5

すべての \( A \in \mathbb{M}_n \) は次数 \( n \) の多項式(特性方程式など)を満たすことを示しましたが、次数が \( n \) 未満の多項式を満たすこともあります。例えば:

A = \begin{bmatrix}
1 & 0 & 0 \\
0 & 1 & 1 \\
0 & 0 & 1
\end{bmatrix} \in \mathbb{M}_3

このとき、特性多項式は \( p_A(t) = (t - 1)^3 \)、また \( (A - I)^3 = 0 \) ですが、実際には \( (A - I)^2 = 0 \) より、次数2の多項式も満たします。ただし、次数1の多項式 \( h(t) = t + a_0 \) で \( h(A) = 0 \) となるものは存在しません(どんな \( a_0 \in \mathbb{C} \) に対しても \( h(A) = A + a_0 I \ne 0 \))。

練習問題

対角化可能な行列 \( A \in \mathbb{M}_n \) が高々 \( d \le n \) 個の異なる固有値 \( \lambda_1, \ldots, \lambda_d \) を持つとします。\( q(t) = (t - \lambda_1)\cdots(t - \lambda_d) \) としたとき、\( q(A) = 0 \) を示しなさい。また、これより低い次数の多項式 \( g(t) \) で \( g(A) = 0 \) となるものが存在しないことを示しなさい。例 2.4.3.5 のように、非対角化可能な行列では、満たすべき最小次数が固有値の数より大きくなることがあります。

コメント

タイトルとURLをコピーしました