4.5.22定理
定理 4.5.22.
\(A, B \in M_p\)、および \(C \in M_q\) とする。このとき、\(A \oplus C\) と \(B \oplus C\) が ∗合同であるのは、\(A\) と \(B\) が ∗合同である場合に限る。
証明.
もし \(S \in M_p\) が正則で \(A = S B S^{*}\) を満たすならば、\(S \oplus I_q\) も正則であり、次が成り立つ:
(S \oplus I_q)(B \oplus C)(S \oplus I_q)^{*} = S B S^{*} \oplus C = A \oplus C
逆に、もし \(A \oplus C\) と \(B \oplus C\) が ∗合同であると仮定する。\(A, B, C\) の ∗合同標準形をそれぞれ \(L_A, L_B, L_C\) とする。これらはすべてタイプ 0, I, II のブロックの直和で表される。さらに、正則行列 \(S_A, S_B, S_C\) が存在して、\(A = S_A L_A S_A^{*}, B = S_B L_B S_B^{*}, C = S_C L_C S_C^{*}\) が成り立つ。
このとき \(L_A \oplus L_C\) は \(A \oplus C\) と ∗合同であり(\(S_A \oplus S_C\) を通じて)、仮定より \(B \oplus C\) とも ∗合同である。そしてこれは \(L_B \oplus L_C\) と ∗合同である(\(S_B \oplus S_C\) を通じて)。よって、\(L_A \oplus L_C\) と \(L_B \oplus L_C\) は ∗合同であり、いずれも標準ブロックの直和であるため、∗合同標準形の一意性により、直和成分の順序入れ替えで互いに得られる。この事実は \(L_C\) の直和成分を除去した後も成立する。残りの直和は \(A\) の ∗合同標準形であり、それは同時に \(B\) の ∗合同標準形でもある。したがって \(A\) と \(B\) は ∗合同である。
与えられた \(A \in M_n\) の ∗合同標準形を決定する典型的な手順は3つのステップからなる:
ステップ 1.
正則 \(S \in M_n\) を構成して、
A = S(B \oplus N)S^{*}
を満たすようにする。ここで \(N = J_{r_1}(0) \oplus \cdots \oplus J_{r_p}(0)\) は冪零ジョルダンブロックの直和、\(B\) は正則である。この構成を正則化(regularization)と呼ぶ。正則化はアドホックに行うことも、既知の正則化アルゴリズムを用いることもできる。正則化によって得られる直和 \(B \oplus N\) は \(A\) の ∗合同標準形と ∗合同であるため、(4.5.21) の一意性により \(N\) が \(A\) の特異部分であることが保証される。そして消去定理により、\(B\) は \(A\) の正則部分となる。
ステップ 2.
\(A\) の正則部分の ∗コスクエアのジョルダン標準形を計算する。これによりタイプ II ブロックが完全に決定され、タイプ I ブロックは符号を除いて決定される。
ステップ 3.
既知のアルゴリズムまたはアドホックな方法を用いて、タイプ I ブロックの符号を決定する。
練習問題.
\(A, B, S \in M_n\) とする。\(S\) が正則であり、\(A = S B S^{*}\) と仮定する。次を定めよ: \(\nu = \dim(\text{nullspace } A)\)、\(\delta = \dim((\text{nullspace } A) \cap (\text{nullspace } A^{*}))\)、\(\nu' = \dim(\text{nullspace } B)\)、\(\delta' = \dim((\text{nullspace } B) \cap (\text{nullspace } B^{*}))\)。\(\nu = \nu'\)、\(\delta = \delta'\) が成り立つこと、すなわち \(\dim(\text{nullspace } A)\) および \(\dim((\text{nullspace } A) \cap (\text{nullspace } A^{*}))\) が ∗合同不変量であることを説明せよ。また、\(\nu = \delta\) であることと、\(A\) と \(A^{*}\) の零空間が一致することが同値であることを説明せよ。
与えられた \(A \in M_n\) の正則化アルゴリズムは、まず上記の不変量 \(\nu\) と \(\delta\) を計算することから始まる。∗合同標準形に現れる \(J_1(0)\) ブロックの個数は \(\delta\) である。もし \(\nu = \delta\)(すなわち \(A\) と \(A^{*}\) の零空間が一致する)なら、アルゴリズムは終了し、\(\,0_\delta\) が \(A\) の特異部分である。もし \(\nu \gt \delta\) ならば、アルゴリズムは \(A\) を特殊なブロック形式に変換する ∗合同を求め、その後そのブロックに対してアルゴリズムを繰り返す。このアルゴリズムの出力は、各 \(k = 1, \ldots, n\) に対し、\(A\) の特異部分に含まれる \(J_k(0)\) ブロックの個数を決定する整数不変量の列である。
与えられた \(A \in M_n\) が ∗合同によって対角化可能であるのは、次の条件が成り立つ場合に限る:(a) その ∗合同標準形にタイプ II ブロックが存在しない(最小のタイプ II ブロックは 2×2 である)、(b) タイプ 0 ブロックは \(J_1(0) = [0]\) である、(c) タイプ I ブロックは \(\lambda_1 = [\lambda]\) であり、\(|\lambda| = 1\) を満たす。この場合、\(\text{rank}(A) = r\) ならば、正則 \(S \in M_n\) が存在して
A = S(\Phi \oplus 0_{n-r})S^{*}
が成り立つ。ここで \(\Phi = \text{diag}(\lambda_1, \ldots, \lambda_r)\)、かつ \(|\lambda_j| = 1\) である。さらに \(S = [S_1 \; S_2]\) と分割し、\(S_1 \in M_r\) とすると、
A = [S_1 \; S_2](\Phi \oplus 0_{n-r})[S_1 \; S_2]^{*} = S_1 \Phi S_1^{*}
と表せる。ここで \(S_1 = U_1 R\) を QR分解 (2.1.14) とし、\(U = [U_1 \; U_2] \in M_n\) をユニタリ行列とすれば、
A = S_1 \Phi S_1^{*} = U_1 R \Phi R^{*} U_1^{*}
となる。したがって
U^{*} A U = \begin{bmatrix} R \Phi R^{*} & 0 \\ 0 & 0_{n-r} \end{bmatrix}
が成り立つ。よって、\(A\) は(ユニタリ)∗合同によって \(R \Phi R^{*} \oplus 0_{n-r}\) に合同であり、従って \(R \Phi R^{*}\) が \(A\) の正則部分となる。
次のことを仮定します。可逆行列 \(B \in M_r\) が ∗合同によって対角化可能であるとします。このとき、\(B\) の ∗合同標準形にはタイプIIブロックが存在しないので、∗コスクエア \(B^{-*}B\) のジョルダン標準形は、固有値の絶対値が 1 の \(J_1(\lambda)\) という形のブロックのみを含みます。つまり、\(B^{-*}B\) は対角化可能であり、すべての固有値は絶対値 1 を持ちます。
そこで、可逆行列 \(S \in M_n\) をとり、
B^{-*}B = S \Phi S^{-1},
ただし \(\Phi = \mathrm{diag}(e^{i\theta_1} I_{n_1} \oplus \cdots \oplus e^{i\theta_d} I_{n_d})\)、各 \(\theta_j \in [0, 2\pi)\)、かつ \(j \ne k\) なら \(\theta_j \ne \theta_k\) とします。
すると \(B = B^{*} S \Phi S^{-1}, \; BS = B^{*} S \Phi, \; S^{*}BS = S^{*}B^{*}S \Phi\) が成り立ちます。ここで \(\tilde{B} = S^{*}BS\) と置くと、\(\tilde{B} = \tilde{B}^{*}\Phi\) となります。すなわち \(\tilde{B} = (\tilde{B}^{*}\Phi)^{*}\Phi = \Phi^{*}\tilde{B}\Phi\) なので、\(\Phi \tilde{B} = \tilde{B}\Phi\) が成り立ちます。これは \(\Phi\) がユニタリであるためです。
\(\tilde{B} = [B_{jk}]_{j,k=1}^d\) を \(\Phi\) に対応するブロックに分割すると、\(\tilde{B}\) と \(\Phi\) が可換であることから、\(\tilde{B}\) は \(\Phi\) と両立するブロック対角行列になります。すなわち、
\tilde{B} = B_1 \oplus \cdots \oplus B_d.
さらに、\(\tilde{B} = \tilde{B}^{*}\Phi\) であることから、各 \(j\) に対して \(B_j = e^{i\theta_j} B_j^{*}\) となります。したがって、\(e^{-i\theta_j/2} B_j\) はエルミート行列です。
任意のエルミート行列は、その慣性行列に ∗合同であるため、各 \(j = 1, \ldots, d\) に対して、可逆行列 \(S_j \in M_{n_j}\) と非負整数 \(n_j^{+}, n_j^{-}\) が存在して、\(n_j^{+} + n_j^{-} = n_j\) かつ
e^{-i\theta_j/2} B_j = S_j (I_{n_j^{+}} \oplus (-I_{n_j^{-}})) S_j^{*}
が成り立ちます。すなわち、
B_j = e^{i\theta_j/2} S_j (I_{n_j^{+}} \oplus (-I_{n_j^{-}})) S_j^{*}.
したがって、\(B\) は次の行列に ∗合同です。
e^{i\theta_1/2} I_{n_1^{+}} \oplus e^{i(\pi+\theta_1/2)} I_{n_1^{-}} \oplus \cdots \oplus e^{i\theta_d/2} I_{n_d^{+}} \oplus e^{i(\pi+\theta_d/2)} I_{n_d^{-}} \tag{4.5.23}
これはタイプIブロックの直和であり、したがって \(B\) の ∗合同標準形です。ここで \(B\) の正準角(または正準射線)は \(\tfrac{1}{2}\theta_1, \ldots, \tfrac{1}{2}\theta_d\)(それぞれ重複度 \(n_1^{+}, \ldots, n_d^{+}\))と、\(\pi + \tfrac{1}{2}\theta_1, \ldots, \pi + \tfrac{1}{2}\theta_d\)(それぞれ重複度 \(n_1^{-}, \ldots, n_d^{-}\))となります。
以上の解析から、次のアルゴリズムが得られます。これは、与えられた \(A \in M_n\) が ∗合同によって対角化可能かどうかを判定し、可能であればその ∗合同標準形を求める方法です。
ステップ1.
\(A\) と \(A^{*}\) が同じ零空間を持つか確認する。異なる場合は停止。すなわち、\(A\) は ∗合同によって対角化不可能である。同じ場合、\(U_2 \in M_{n, n-r}\) を \(A\) の零空間の正規直交基底とし、\(U = [U_1 \; U_2] \in M_n\) をユニタリとする。このとき \(AU_2 = 0, \; U_2^{*}A = 0\) なので、
U^{*}AU = \begin{bmatrix} U_1^{*}AU_1 & 0 \\ 0 & 0_{n-r} \end{bmatrix},
ここで \(B = U_1^{*}AU_1\) が \(A\) の正則部分となる。
ステップ2.
\(B^{-*}B\) が (a) 対角化可能であるかつ (b) すべての固有値の絶対値が 1 であるかを確認する。どちらかが満たされない場合は停止。すなわち、\(A\) は ∗合同によって対角化不可能である。両方満たされる場合、\(A\) は ∗合同によって対角化可能である。
ステップ3.
\(B^{-*}B\) を対角化する。すなわち、可逆行列 \(S \in M_n\) を構成して
B^{-*}B = S \Phi S^{-1},
ただし \(\Phi = e^{i\theta_1} I_{n_1} \oplus \cdots \oplus e^{i\theta_d} I_{n_d}, \; \theta_j \in [0, 2\pi), \; j \ne k \Rightarrow \theta_j \ne \theta_k\)。このとき
S^{*}BS = B_1 \oplus \cdots \oplus B_d,
かつ各 \(j = 1, \ldots, d\) に対して \(e^{-i\theta_j/2} B_j\) はエルミート行列となる。ここで \(e^{-i\theta_j/2} B_j\) の正の固有値の個数を \(n_j^{+}\)、負の固有値の個数を \(n_j^{-}\) とする。すると、\(A\) の ∗合同標準形は
e^{i\theta_1/2} I_{n_1^{+}} \oplus e^{i(\pi+\theta_1/2)} I_{n_1^{-}} \oplus \cdots \oplus e^{i\theta_d/2} I_{n_d^{+}} \oplus e^{i(\pi+\theta_d/2)} I_{n_d^{-}} \oplus 0_{n-r}.
以上の議論を次の定理としてまとめます。
行列解析の総本山

コメント