[行列解析2.4.p3]ケイリー・ハミルトンの定理の証明と余因子行列の行列多項式展開

2.ユニタリ相似とユニタリ同値

2.4.P3

2.4.問題3

定理 (2.4.3.2) でのケイリー・ハミルトン定理の証明は複素行列が固有値を持つことに依存しているが、特性多項式の定義や置換 \( p_A(t) \to p_A(A) \) は固有値や複素数体の特性を必要としない

実際、ケイリー・ハミルトンの定理は、単位元を持つ可換環の元からなる行列に対しても成立する。可換環の例として、整数環の剰余類環(素数のときは体)、複数の形式的未定元を持つ複素係数多項式環などがある。

以下の(a)~(g)の証明を詳述せよ。

問題とヒント

(a)行列の基本恒等式

(0.8.2)
(t I - A)(\mathrm{adj}(t I - A)) \\
= \det(t I - A) I = p_A(t) I

を出発点とし、次の形に導け。

(2.4.12)
\begin{aligned}
&p_A(t) I  \\
&= I t^n + a_{n-1} I t^{n-1} 
 + a_{n-2} I t^{n-2} + \cdots + a_1 I t + a_0 I
\end{aligned}

これは、\( t \) に関する次数 \( n \) の多項式で、係数はスカラー行列である。

行列 \( A \in \mathbb{M}_n \) の固有多項式
\( p_A(t) = \det(t I - A) \) は、
\( t \) に関する \( n \) 次の多項式
\( t^n + a_{n-1}t^{n-1} + \cdots + a_0 \) である。
基本恒等式
\( (t I - A)\mathrm{adj}(t I - A) = p_A(t) I \) において、
左辺は行列の積であり、右辺はスカラー多項式に単位行列 \( I \) を乗じたものである。
右辺を各次数の項に展開することで、係数がスカラー行列 \( a_k I \) となる多項式の形式を導くことができる。

(b)なぜ \( \mathrm{adj}(t I - A) \) は各成分が次数最大 \( n-1 \) の多項式となる行列か説明し、次の形に書けることを示せ。 

(2.4.13)
\begin{aligned}
&\mathrm{adj}(t I - A) \\
&= A_{n-1} t^{n-1} + A_{n-2} t^{n-2} + \cdots + A_1 t + A_0
\end{aligned}

ここで \( A_0 = (-1)^{n-1} \mathrm{adj} A \) で、各 \( A_k \) は \( A \) の成分に関する多項式関数の成分を持つ \( n \times n \) 行列である。

行列 \( t I - A \) の各成分は \( t \) に関する高々 \( 1 \) 次の多項式である。
余因子行列 \( \mathrm{adj}(t I - A) \) の各成分は、\( t I - A \) から \( 1 \) つの行と列を除いた \( (n-1) \times (n-1) \) 小行列式の交代和(余因子)である。
行列式の定義に基づき、\( (n-1) \) 次の正方行列の行列式は成分の \( n-1 \) 次の多項式となるため、余因子行列全体を各次数の行列係数を用いた多項式として整理できる。

(c)式 (2.4.13) を用いて積

(t I - A)(\mathrm{adj}(t I - A))

を計算し、

(2.4.14)
\begin{aligned}
A_{n-1} &t^n \\
\quad  + (A_{n-2} - A A_{n-1})& t^{n-1}  \\
+ \cdots & \\
+ (A_0 - A A_1)& t \\
- A A_0
\end{aligned}

と表せることを示せ。

行列 \( t I - A \) と、その余因子行列を \( t \) の多項式として表現した式 (2.4.13) との積を計算する。分配法則を用いて、\( t I \) を掛ける操作と \( -A \) を掛ける操作に分けて展開し、各次数 \( t^k \) ごとに項を整理することで、行列を係数に持つ多項式の形を導き出す。

(d)式 (2.4.12) と (2.4.14) の対応する係数を比較し、次の \( n+1 \) 個の方程式を得よ。

(2.4.15)
\begin{aligned}
A_{n-1} &= I \\
A_{n-2} - A A_{n-1} &= a_{n-1} I \\
\vdots \\
A_0 - A A_1 &= a_1 I \\
- A A_0 &= a_0 I
\end{aligned}

行列の基本恒等式 \( (t I - A) \mathrm{adj}(t I - A) = p_A(t) I \) において、両辺を \( t \) に関する多項式として展開したものが式 (2.4.14) と式 (2.4.12) である。多項式の恒等式において、すべての \( t \) に対して等号が成立するためには、各次数 \( t^k \) の係数行列が両辺で一致しなければならない。最高次である \( t^n \) から定数項までの係数を順に比較することで、連立行列方程式を導き出す。

(e)各 \( k = 1, \ldots, n \) について、式(2.4.15) の第 \( k \) 式に左から \( A_{n-k+1} \) を掛け、全ての \( n+1 \) 式を足し合わせ、ケイリー・ハミルトンの定理 \( 0 = p_A(A) \) を得よ。

係数比較で得られた \( n+1 \) 個の行列方程式に対して、各項の \( A \) の次数が揃うように左から \( A^k \) を乗じる。具体的には、\( t^{n-k} \) の係数に対応する式に \( A^{n-k} \) を掛けて全て加算すると、左辺の隣り合う項が「入れ子(テレスコーピング)」の構造となって打ち消し合い、最終的に固有多項式に行列 \( A \) を代入した形が現れる。

(f)各 \( k = 1, \ldots, n-1 \) について、式(2.4.15) の第 \( k \) 式に左から \( A_{n-k} \) を掛け、最初の \( n \) 式のみ足し合わせ、次の恒等式を得よ。

\begin{aligned}
& \mathrm{adj} A \\
& =(-1)^{n-1} ( A_{n-1} + a_{n-1} A_{n-2} + \cdots + a_2 A + a_1 I )
\end{aligned}

ここで \( \mathrm{adj} A \) は多項式 \( p_A(t) \) の係数(\( a_0 = (-1)^n \det A \) を除く)を逆順に並べたものと一致する多項式行列である。

(2.4.15) で得られた \( n+1 \) 個の方程式のうち、最初の \( n \) 個(\( t^n \) から \( t^1 \) の係数比較式)を順に利用する。各式に \( A \) のべき乗を左から掛けて加算することで、中間項を打ち消し合わせる(テレスコーピング)。最後に、\( A_0 \) と \( \mathrm{adj} A \) の関係式 \( A_0 = (-1)^{n-1} \mathrm{adj} A \) を用いて、余因子行列を直接行列 \( A \) と固有多項式の係数で表す。

(g)式 (2.4.15) を用いて、式(2.4.13) の右辺の行列係数が

\begin{aligned}
A_{n-1} &= I \\
A_{n-k-1} 
&= A_k + a_{n-1} A_{k-1} + \cdots + a_{n-k+1} A + a_{n-k} I \\
&( k = 1, \ldots, n-1 )
\end{aligned}

であることを示せ。

(2.4.15) で得られた連立行列方程式は、係数行列 \( A_k \) に関する漸化式の構造を持っている。\( A_{n-1} = I \) から順に \( A_{n-2}, A_{n-3}, \dots \) と代入を繰り返すことで、各係数行列を \( A \) のべき乗と固有多項式の係数 \( a_i \) の組み合わせとして表現できる。数学的帰納法、あるいは逐次代入の考え方を用いて、指定された一般項の形を導く。

証明で用いる代数演算は加算・乗算のみで、除算や多項式方程式の根は使わないことに注意。

解答例

(a)余因子行列の恒等式を用いた固有多項式の導出

基本恒等式

(0.8.2)
\begin{aligned}
&(t I - A)(\mathrm{adj}(t I - A)) \\
&= \det(t I - A) I \\
&= p_A(t) I
\end{aligned}

を出発点とし、次の形に導け。

(2.4.12)
\begin{aligned}
&p_A(t) I  \\
&= I t^n + a_{n-1} I t^{n-1} 
 + a_{n-2} I t^{n-2} + \cdots + a_1 I t + a_0 I
\end{aligned}

これは、\( t \) に関する次数 \( n \) の多項式で、係数はスカラー行列である。

行列 \( A \) の固有多項式 \( p_A(t) \) は、行列式 \( \det(t I - A) \) の定義に基づき、次のようなスカラー係数を持つ \( t \) の \( n \) 次多項式として展開される。

p_A(t) = t^n + a_{n-1} t^{n-1} + a_{n-2} t^{n-2} + \cdots + a_1 t + a_0

基本恒等式 (0.8.2) によれば、次の関係が成立する。

(t I - A) \mathrm{adj}(t I - A) = p_A(t) I

ここで、右辺の \( p_A(t) I \) に注目する。スカラー多項式 \( p_A(t) \) と単位行列 \( I \) の積は、行列の各成分に \( p_A(t) \) を乗じる操作に相当するため、次のように分配法則を用いて展開できる。

\begin{aligned}
p_A(t) I &= (t^n + a_{n-1} t^{n-1} + a_{n-2} t^{n-2} + \cdots + a_1 t + a_0) I \\
&= (t^n) I + (a_{n-1} t^{n-1}) I + (a_{n-2} t^{n-2}) I + \cdots + (a_1 t) I + (a_0) I
\end{aligned}

スカラー \( a_k \) と変数 \( t^k \) は行列 \( I \) と可換であるため、これらを整理すると、係数を行列 \( a_k I \) とする形式 (2.4.12) が得られる。

p_A(t) I = I t^n + a_{n-1} I t^{n-1} + a_{n-2} I t^{n-2} + \cdots + a_1 I t + a_0 I

これにより、基本恒等式の右辺は、各項の係数がスカラー行列であるような \( t \) に関する次数 \( n \) の行列多項式として表現されることが示された。

(b)余因子行列の多項式表示と定数項の導出

なぜ \( \mathrm{adj}(t I - A) \) は各成分が次数最大 \( n-1 \) の多項式となる行列か説明し、次の形に書けることを示せ。 

(2.4.13)
\begin{aligned}
&\mathrm{adj}(t I - A) \\
&= A_{n-1} t^{n-1} + A_{n-2} t^{n-2} + \cdots + A_1 t + A_0
\end{aligned}

ここで \( A_0 = (-1)^{n-1} \mathrm{adj} A \) で、各 \( A_k \) は \( A \) の成分に関する多項式関数の成分を持つ \( n \times n \) 行列である。

行列 \( M = t I - A \) の成分を \( m_{ij} \) とすると、\( m_{ii} = t - a_{ii} \) であり、\( i \neq j \) のとき \( m_{ij} = -a_{ij} \) である。余因子行列 \( \mathrm{adj}(M) \) の \( (i, j) \) 成分は、\( M \) の \( (j, i) \) 余因子 \( (-1)^{j+i} \det(M_{ji}) \) で与えられる。

ここで \( M_{ji} \) は \( M \) から第 \( j \) 行と第 \( i \) 列を取り除いた \( n-1 \) 次の正方行列である。その行列式 \( \det(M_{ji}) \) は、高々 \( n-1 \) 個の \( t \) を含む成分の積の和で構成されるため、\( t \) に関する次数が最大 \( n-1 \) の多項式となる。したがって、すべての成分が \( n-1 \) 次以下の多項式である行列 \( \mathrm{adj}(t I - A) \) は、行列係数 \( A_k \in \mathbb{M}_n \) を用いて次のように展開できる。

\mathrm{adj}(t I - A) = A_{n-1} t^{n-1} + A_{n-2} t^{n-2} + \cdots + A_1 t + A_0

次に、定数項 \( A_0 \) を求める。多項式における定数項は変数に \( 0 \) を代入することで得られる。上式に \( t = 0 \) を代入すると次のようになる。

\mathrm{adj}(0 \cdot I - A) = A_0 \implies \mathrm{adj}(-A) = A_0

余因子行列の定義より、任意の行列 \( B \) とスカラー \( c \) に対して \( \mathrm{adj}(cB) = c^{n-1} \mathrm{adj} B \) が成り立つ。ここで \( c = -1, B = A \) とすると、

A_0 = \mathrm{adj}(-A) = (-1)^{n-1} \mathrm{adj} A

となり、定数項が \( (-1)^{n-1} \mathrm{adj} A \) であることが示された。

(c)余因子行列の多項式展開と積の整理

(b)の式 (2.4.13) を用いて積

(t I - A)(\mathrm{adj}(t I - A))

を計算し、

(2.4.14)
\begin{aligned}
& A_{n-1} t^n \\
& + (A_{n-2} - A A_{n-1}) t^{n-1} \\
& + \quad  \cdots  \\
&+ (A_0 - A A_1) t \\
& \quad   \quad   \quad   - A A_0
\end{aligned}

と表せることを示せ。

式 (2.4.13) より、余因子行列は \( \mathrm{adj}(t I - A) = \sum_{k=0}^{n-1} A_k t^k \) と書ける。これを用いて積 \( (t I - A) \mathrm{adj}(t I - A) \) を展開する。

\begin{aligned}
& (t I - A)(A_{n-1} t^{n-1} + A_{n-2} t^{n-2} + \cdots + A_1 t + A_0) \\
&= t I (A_{n-1} t^{n-1} + A_{n-2} t^{n-2} + \cdots + A_1 t + A_0) \\
& \quad - A (A_{n-1} t^{n-1} + A_{n-2} t^{n-2} + \cdots + A_1 t + A_0)
\end{aligned}

各項に分配すると次のようになる。

\begin{aligned}
&= (A_{n-1} t^n + A_{n-2} t^{n-1} + \cdots + A_1 t^2 + A_0 t) \\
& \quad - (A A_{n-1} t^{n-1} + A A_{n-2} t^{n-2} + \cdots + A A_1 t + A A_0)
\end{aligned}

次に、\( t \) のべき指数が同じ項をまとめて整理する。

\begin{aligned}
& \quad \quad A_{n-1} t^n \\
& + (A_{n-2} - A A_{n-1}) t^{n-1} \\
& + (A_{n-3} - A A_{n-2}) t^{n-2} \\
& + \cdots \\
& + (A_0 - A A_1) t \\
& \quad \quad \quad - A A_0
\end{aligned}

以上の計算により、与えられた積は \( t \) に関する次数 \( n \) の多項式として、式 (2.4.14) の形に表されることが示された。

(d)固有多項式の係数比較と行列方程式の導出

(a)での式 (2.4.12) と(c)での式 (2.4.14) の対応する係数を比較し、次の \( n+1 \) 個の方程式を得よ。

(2.4.15)
\begin{aligned}
A_{n-1} &= I \\
A_{n-2} - A A_{n-1} &= a_{n-1} I \\
\vdots \\
A_0 - A A_1 &= a_1 I \\
- A A_0 &= a_0 I
\end{aligned}

まず、固有多項式に単位行列を乗じた式 (2.4.12) は次の通りである。

p_A(t) I = I t^n + a_{n-1} I t^{n-1} + a_{n-2} I t^{n-2} + \cdots + a_1 I t + a_0 I

次に、余因子行列との積を展開した式 (2.4.14) は次の通りである。

A_{n-1} t^n + (A_{n-2} - A A_{n-1}) t^{n-1} + \cdots + (A_0 - A A_1) t - A A_0

恒等式の性質により、\( t^n, t^{n-1}, \ldots, t^1, t^0 \) の各係数を比較すると、以下の \( n+1 \) 個の方程式が得られる。

\( t^n \) の係数:

A_{n-1} = I

\( t^{n-1} \) の係数:

A_{n-2} - A A_{n-1} = a_{n-1} I

以下、各次数について同様に比較を続けると、一般に \( t^k \) (\( 1 \leq k \leq n-2 \)) の係数は \( A_{k-1} - A A_k = a_k I \) となる。特に \( t^1 \) と定数項については以下のようになる。

\( t^1 \) の係数:

A_0 - A A_1 = a_1 I

定数項(\( t^0 \)):

- A A_0 = a_0 I

以上により、多項式の係数比較から \( n+1 \) 個の行列方程式 (2.4.15) が導かれた。

(e)行列方程式の合成とケイリー・ハミルトンの定理

各 \( k = 1, \ldots, n \) について、式(2.4.15) の第 \( k \) 式に左から \( A_{n-k+1} \) を掛け、全ての \( n+1 \) 式を足し合わせ、ケイリー・ハミルトンの定理 \( 0 = p_A(A) \) を得よ。

式 (2.4.15) で得られた各方程式に対して、指示通りに左から順に \( A^n, A^{n-1}, \ldots, A, I \) を掛ける。

\begin{aligned}
A^n (A_{n-1}) &= A^n (I) \\
A^{n-1} (A_{n-2} - A A_{n-1}) &= A^{n-1} (a_{n-1} I) \\
A^{n-2} (A_{n-3} - A A_{n-2}) &= A^{n-2} (a_{n-2} I) \\
&\vdots \\
A^1 (A_0 - A A_1) &= A^1 (a_1 I) \\
I (- A A_0) &= I (a_0 I)
\end{aligned}

これらの式の左辺を展開し、全ての式の左辺同士、右辺同士を足し合わせる。まず左辺の和を \( L \)、右辺の和を \( R \) とすると、左辺の和は次のように隣接する項が打ち消し合う。

\begin{aligned}
L &= A^n A_{n-1} \\
&\quad + (A^{n-1} A_{n-2} - A^n A_{n-1}) \\
&\quad + (A^{n-2} A_{n-3} - A^{n-1} A_{n-2}) \\
&\quad + \cdots \\
&\quad + (A A_0 - A^2 A_1) \\
&\quad \quad \quad \quad - A A_0 \\
&= 0
\end{aligned}

一方で、右辺の和 \( R \) は次のようになる。

R = A^n + a_{n-1} A^{n-1} + a_{n-2} A^{n-2} + \cdots + a_1 A + a_0 I

固有多項式の定義 \( p_A(t) = t^n + a_{n-1} t^{n-1} + \cdots + a_0 \) より、この右辺は行列多項式 \( p_A(A) \) そのものである。したがって、\( L = R \) より以下の結論を得る。

p_A(A) = 0

これは、任意の正方行列はその固有多項式を零化するというケイリー・ハミルトンの定理を示している。

(f)余因子行列の多項式係数による表現の導出

各 \( k = 1, \ldots, n-1 \) について、式(2.4.15) の第 \( k \) 式に左から \( A_{n-k} \) を掛け、最初の \( n \) 式のみ足し合わせ、次の恒等式を得よ。

\mathrm{adj} A = \\
(-1)^{n-1} ( A_{n-1} + a_{n-1} A_{n-2} + \cdots + a_2 A + a_1 I )

ここで \( \mathrm{adj} A \) は多項式 \( p_A(t) \) の係数(\( a_0 = (-1)^n \det A \) を除く)を逆順に並べたものと一致する多項式行列である。

式 (2.4.15) の最初の \( n \) 個の方程式に対し、指示に従い左から順に \( A^{n-1}, A^{n-2}, \dots, A, I \) を掛ける。

\begin{aligned}
A^{n-1} (A_{n-1}) &= A^{n-1} (I) \\
A^{n-2} (A_{n-2} - A A_{n-1}) &= A^{n-2} (a_{n-1} I) \\
A^{n-3} (A_{n-3} - A A_{n-2}) &= A^{n-3} (a_{n-2} I) \\
&\vdots \\
I (A_0 - A A_1) &= I (a_1 I)
\end{aligned}

これら \( n \) 本の式の両辺をすべて足し合わせる。左辺については、隣り合う項が互いに打ち消し合う。

\begin{aligned}
L &= A^{n-1} A_{n-1} \\
&\quad + (A^{n-2} A_{n-2} - A^{n-1} A_{n-1}) \\
&\quad + (A^{n-3} A_{n-3} - A^{n-2} A_{n-2}) \\
&\quad + \dots \\
&\quad + (A_0 - A A_1) \\
&= A_0
\end{aligned}

右辺の和 \( R \) は次のようになる。

R = A^{n-1} + a_{n-1} A^{n-2} + a_{n-2} A^{n-3} + \dots + a_2 A + a_1 I

\( L = R \) より \( A_0 = A^{n-1} + a_{n-1} A^{n-2} + \dots + a_1 I \) が得られる。ここで、(b) で示した関係式 \( A_0 = (-1)^{n-1} \mathrm{adj} A \) を代入する。

(-1)^{n-1} \mathrm{adj} A = A^{n-1} + a_{n-1} A^{n-2} + \dots + a_1 I

両辺に \( (-1)^{n-1} \) を掛ける(または移行する)ことで、次の恒等式が得られる。

\mathrm{adj} A = (-1)^{n-1} ( A^{n-1} + a_{n-1} A^{n-2} + \dots + a_2 A + a_1 I )

これは \( \mathrm{adj} A \) が固有多項式の定数項を除く係数を用いた行列多項式として表現できることを示している。

(g)余因子行列の係数行列に関する逐次公式の導出

式 (2.4.15) を用いて、(2.4.13) の右辺の行列係数が

A_{n-1} = I, \\
A_{n-k-1} 
= A_k + a_{n-1} A_{k-1} + \cdots + a_{n-k+1} A + a_{n-k} I

(\( k = 1, \ldots, n-1 \))であることを示せ。

式 (2.4.15) の関係式を次のように整理する。

A_{n-1} = I \\
A_{n-m-1} = A A_{n-m} + a_{n-m} I \quad (m = 1, \dots, n-1)

この漸化式を用いて、\( A_{n-2}, A_{n-3} \) と順次求めていく。

\( m=1 \) のとき:

A_{n-2} = A A_{n-1} + a_{n-1} I = A + a_{n-1} I

\( m=2 \) のとき:

A_{n-3} = A A_{n-2} + a_{n-2} I = A(A + a_{n-1} I) + a_{n-2} I = A^2 + a_{n-1} A + a_{n-2} I

これを繰り返すことにより、一般の \( k \) について \( A_{n-k-1} \) を求めると、\( A \) の次数が順次上がり、対応する係数が現れる。

\begin{aligned}
A_{n-k-1} &= A A_{n-k} + a_{n-k} I \\
&= A (A^{k-1} + a_{n-1} A^{k-2} + \dots + a_{n-k+1} I) + a_{n-k} I \\
&= A^k + a_{n-1} A^{k-1} + \dots + a_{n-k+1} A + a_{n-k} I
\end{aligned}

これにより、余因子行列を多項式展開した際の行列係数 \( A_{n-k-1} \) が、行列 \( A \) と固有多項式の係数 \( a_i \) を用いて目的の形式で表されることが示された。


行列解析の総本山

総本山の目次📚

[行列解析]総本山📚
行列解析の総本山。行列解析の内容を網羅的かつ体系的に整理しています。線形代数の学習を一通り終えた方が、次のステップとして取り組むのに最適です。行列に関する不等式を研究するには、行列解析の知識が欠かせません。

記号の意味🔎

[行列解析9.0]主要な記号一覧🔎
行列解析で使用している記号や用語の簡単な説明です。

コメント

タイトルとURLをコピーしました