[行列解析2.4.8]定理(可換族と同時三角化)

2.4.8

2.4.8 可換族と同時三角化。

ここでは、シュールの定理の可換族版 (2.3.3) を用いて、可換な行列に対して固有値が「加算」や「乗算」される(ある順序で)ことを示す。

定理 2.4.8.1.

\(A, B \in M_n\) が可換とする。このとき、\(A\) の固有値の順序付け \(\alpha_1, \ldots, \alpha_n\) と、\(B\) の固有値の順序付け \(\beta_1, \ldots, \beta_n\) が存在して、\(A+B\) の固有値は \(\alpha_1+\beta_1, \alpha_2+\beta_2, \ldots, \alpha_n+\beta_n\) となり、\(AB\) の固有値は \(\alpha_1\beta_1, \alpha_2\beta_2, \ldots, \alpha_n\beta_n\) となる。

特に、

\sigma(A+B) \subseteq \sigma(A) + \sigma(B), \quad 
\sigma(AB) \subseteq \sigma(A)\sigma(B)

証明.

\(A\) と \(B\) が可換であるので、(2.3.3) によりユニタリ行列 \(U \in M_n\) が存在し、

U^* A U = T = [t_{ij}], \quad U^* B U = R = [r_{ij}]

がともに上三角行列となる。

上三角行列 \(T+R = U^*(A+B)U\) の対角成分(すなわち固有値)は \(t_{11}+r_{11}, \ldots, t_{nn}+r_{nn}\) であり、これは \(A+B\) の固有値である。

同様に、上三角行列 \(TR = U^*(AB)U\) の対角成分は \(t_{11}r_{11}, \ldots, t_{nn}r_{nn}\) であり、これは \(AB\) の固有値である。 ■

演習.

\(A, B \in M_n\) が可換であるとする。なぜ \(\rho(A+B) \leq \rho(A) + \rho(B)\) および \(\rho(AB) \leq \rho(A)\rho(B)\) が成り立つのかを説明せよ。

したがって、スペクトル半径関数は可換行列に対して劣加法的かつ劣乗法的である。

例 2.4.8.2.

たとえ \(A\) と \(B\) が可換でも、それぞれの固有値の和が必ずしも \(A+B\) の固有値になるとは限らない。

対角行列

A = \begin{bmatrix} 1 & 0 \\ 0 & 2 \end{bmatrix}, \quad 
B = \begin{bmatrix} 3 & 0 \\ 0 & 4 \end{bmatrix}

を考えると、\(1+4=5 \notin \{4,6\} = \sigma(A+B)\) である。

したがって、\(\sigma(A+B)\) は \(\sigma(A)+\sigma(B)\) に含まれるが、等しくはない。

例 2.4.8.3.

\(A\) と \(B\) が可換でない場合、\(\sigma(A+B)\) が \(\sigma(A)\) および \(\sigma(B)\) とどのように関係するかを言うのは難しい。

特に、\(\sigma(A+B)\) が \(\sigma(A)+\sigma(B)\) に含まれるとは限らない。次の行列を考える:

A = \begin{bmatrix} 0 & 1 \\ 0 & 0 \end{bmatrix}, \quad 
B = \begin{bmatrix} 0 & 0 \\ 1 & 0 \end{bmatrix}

このとき、\(\sigma(A+B) = \{-1,1\}\) であり、一方で \(\sigma(A) = \sigma(B) = \{0\}\) である。

演習.

上の行列に対して、なぜ \(\rho(A+B) \gt \rho(A)+\rho(B)\) が成立するのかを説明せよ。

したがって、スペクトル半径関数は \(M_n\) 全体では劣加法的でない。

例 2.4.8.4.

(2.4.8.1) の逆は成り立つだろうか?すなわち、もし \(A\) と \(B\) の固有値がある順序で加算されるならば、\(A\) と \(B\) は可換であると言えるだろうか?

答えは否である。たとえ任意のスカラー \(\alpha, \beta\) に対して \(\alpha A\) と \(\beta B\) の固有値が加算される場合でもそうである。

これは興味深い現象であり、そのような行列対の特徴付けは未解決問題である。

次の非可換な行列を考える:

A = \begin{bmatrix} 
0 & 1 & 0 \\ 
0 & 0 & -1 \\ 
0 & 0 & 0 
\end{bmatrix}, \quad
B = \begin{bmatrix} 
0 & 0 & 0 \\ 
1 & 0 & 0 \\ 
0 & 1 & 0 
\end{bmatrix}

このとき、\(\sigma(A) = \sigma(B) = \{0\}\) である。

さらに、任意の \(\alpha, \beta \in \mathbb{C}\) に対して \(p_{\alpha A + \beta B}(t) = t^3\) であり、\(\sigma(\alpha A + \beta B) = \{0\}\) となるので、固有値は加算される。

しかしもし \(A\) と \(B\) が同時に上三角化可能であれば、(2.4.8.1) の証明により \(AB\) の固有値は \(A\) と \(B\) の固有値の積となるはずである。

しかし実際には \(\sigma(AB) = \{-1,0,1\}\) であり、これは \(\sigma(A)\cdot\sigma(B) = \{0\}\) に含まれない。

したがって、\(A\) と \(B\) は同時三角化可能ではない。

系 2.4.8.5.

\(A, B \in M_n\) が可換とし、\(\sigma(A) = \{\alpha_1,\ldots,\alpha_{d_1}\}, \sigma(B) = \{\beta_1,\ldots,\beta_{d_2}\}\) とする。

すべての \(i, j\) に対して \(\alpha_i \neq -\beta_j\) ならば、\(A+B\) は非特異である。

演習.

(2.4.8.1) を用いて (2.4.8.5) を確認せよ。

演習.

\(T=[t_{ij}], R=[r_{ij}]\) が同じサイズの \(n \times n\) 上三角行列であり、\(p(s,t)\) が2つの非可換変数に関する多項式(すなわち、2つの非可換変数における語の線形結合)であるとする。

このとき、なぜ \(p(T,R)\) は上三角行列であり、その対角成分(固有値)は \(p(t_{11}, r_{11}), \ldots, p(t_{nn}, r_{nn})\) となるのかを説明せよ。

複素行列においては、同時三角化と同時ユニタリ三角化は同値な概念である。

定理 2.4.8.6.

\(A_1, \ldots, A_m \in M_n\) が与えられているとする。

このとき、ある正則行列 \(S \in M_n\) が存在して、すべての \(i=1,\ldots,m\) に対して \(S^{-1}A_iS\) が上三角行列となることと、あるユニタリ行列 \(U \in M_n\) が存在してすべての \(i=1,\ldots,m\) に対して \(U^*A_iU\) が上三角行列となることは同値である。

証明.

(2.1.14) を用いて \(S=QR\) と分解する。

ただし \(Q\) はユニタリ行列、\(R\) は上三角行列である。

このとき

T_i = S^{-1}A_iS = (QR)^{-1}A_i(QR) = R^{-1}(Q^*A_iQ)R

となり、\(T_i\) は上三角行列である。

したがって、\(Q^*A_iQ = RT_iR^{-1}\) もまた3つの上三角行列の積であり上三角行列となる。■

\(m\) 個の行列が相似変換で同時に上三角化可能であるかどうかは、McCoy の次の定理によって完全に特徴づけられる。

これは \(m\) 個の非可換変数に関する多項式 \(p(t_1,\ldots,t_m)\) を含み、これは変数の積の線形結合、すなわち非可換変数の「語」の線形結合である。

鍵となる観察は前の演習で得られた:もし \(T_1, \ldots, T_m\) が上三角行列であれば、\(p(T_1,\ldots,T_m)\) も上三角行列となり、その対角成分は各 \(T_1, \ldots, T_m\) の対角成分に基づいて特定の順序で固有値を与える、というものである。

各 \(k=1,\ldots,n\) に対して、\(p(T_1,\ldots,T_m)\) の \(k\) 番目の対角成分(すなわち固有値)は、\(T_1,\ldots,T_m\) のそれぞれの \(k\) 番目の対角成分に対する同じ多項式の値である。

定理 2.4.8.7 (McCoy).

\(m \geq 2\) とし、\(A_1,\ldots,A_m \in M_n\) が与えられているとする。

次は同値である:

(a) 任意の \(m\) 個の非可換変数に関する多項式 \(p(t_1,\ldots,t_m)\) と任意の \(k,\ell=1,\ldots,m\) に対して、\(p(A_1,\ldots,A_m)(A_kA_\ell - A_\ell A_k)\) は冪零である。

(b) あるユニタリ行列 \(U \in M_n\) が存在して、各 \(i=1,\ldots,m\) に対して \(U^*A_iU\) が上三角行列である。

(c) 各 \(i=1,\ldots,m\) に対して、その固有値の順序付け \(\lambda^{(i)}_1,\ldots,\lambda^{(i)}_n\) が存在して、任意の \(m\) 個の非可換変数に関する多項式 \(p(t_1,\ldots,t_m)\) に対して、\(p(A_1,\ldots,A_m)\) の固有値は

p(\lambda^{(1)}_i, \ldots, \lambda^{(m)}_i), \quad i=1,\ldots,n

で与えられる。

証明.

(b) ⇒ (c): \(T_k = U^*A_kU = [t^{(k)}_{ij}]\) とし、\(\lambda^{(k)}_1 = t^{(k)}_{11}, \ldots, \lambda^{(k)}_n = t^{(k)}_{nn}\) とおく。

このとき、

p(A_1,\ldots,A_m) = U p(T_1,\ldots,T_m) U^*

の固有値は \(p(T_1,\ldots,T_m)\) の対角成分であり、それは \(\{p(\lambda^{(1)}_i,\ldots,\lambda^{(m)}_i)\}_{i=1}^n\) である。

(c) ⇒ (a): 与えられた多項式 \(p(t_1,\ldots,t_m)\) に対して、\(q_{k\ell}(t_1,\ldots,t_m) = p(t_1,\ldots,t_m)(t_k t_\ell - t_\ell t_k)\) を考える。

このとき (c) により

q_{k\ell}(\lambda^{(1)}_i,\ldots,\lambda^{(m)}_i) 
= p(\lambda^{(1)}_i,\ldots,\lambda^{(m)}_i) (\lambda^{(k)}_i \lambda^{(\ell)}_i - \lambda^{(\ell)}_i \lambda^{(k)}_i) = 0

である。

したがって、各 \(p(A_1,\ldots,A_m)(A_kA_\ell - A_\ell A_k)\) は冪零である。

(a) ⇒ (b): (次の補題を参照)\(A_1,\ldots,A_m\) が共通のユニタリ固有ベクトル \(x\) をもつと仮定する。

この仮定の下で、(2.3.3) の証明と同様に帰納法で進める。

まず \(x\) を第1列に持つ任意のユニタリ行列 \(U_1\) をとると、各 \(A_i\) を

A_i = U_1^* A_i U_1 = 
\begin{bmatrix}
\lambda^{(i)}_1 & * \\
0 & \tilde{A}_i
\end{bmatrix}, \quad \tilde{A}_i \in M_{n-1}

の形にできる。

すると、性質 (a) は \(\tilde{A}_1,\ldots,\tilde{A}_{m} \in M_{n-1}\) に継承されるので、帰納法により (b) が従う。■

我々は、可換な行列は常に共通の固有ベクトルをもつことを知っている (1.3.19)。

したがって、上の定理の \(A_1,\ldots,A_m\) が可換であれば、すべての \(k,\ell\) に対して

p(A_1,\ldots,A_m)(A_kA_\ell - A_\ell A_k) = 0

が成り立つので、条件 (a) は自明に満たされる。

次の補題は、可換性よりも弱い条件 (a) が共通固有ベクトルの存在を保証することを示す。

補題 2.4.8.10.

\(A_1,\ldots,A_m \in M_n\) とする。

\(m \geq 2\) の非可換変数に関する任意の多項式 \(p(t_1,\ldots,t_m)\) とすべての \(k,\ell=1,\ldots,m\) に対して、各行列 \(p(A_1,\ldots,A_m)(A_kA_\ell - A_\ell A_k)\) が冪零であると仮定する。

このとき、任意の非零ベクトル \(x \in \mathbb{C}^n\) に対して、ある非可換変数に関する多項式 \(q(t_1,\ldots,t_m)\) が存在して、\(q(A_1,\ldots,A_m)x\) が \(A_1,\ldots,A_m\) の共通固有ベクトルとなる。

証明.

一般の場合の特徴はすべて \(m=2\) の場合に現れるので、ここでは \(m=2\) の場合を考える。

\(A,B \in M_n\) とし、\(C = AB-BA\) とおく。任意の2変数非可換多項式 \(p(s,t)\) に対して \(p(A,B)C\) が冪零であると仮定する。

任意の非零ベクトル \(x \in \mathbb{C}^n\) をとる。

このとき、ある2変数非可換多項式 \(q(s,t)\) が存在して、\(q(A,B)x\) が \(A,B\) の共通固有ベクトルとなることを示す。

(1.1.9) を用いて、多項式 \(g_1(t)\) をとり、\(\xi_1 = g_1(A)x\) が \(A\) の固有ベクトル、すなわち \(A\xi_1 = \lambda \xi_1\) を満たすようにする。

場合 I:

任意の多項式 \(p(t)\) に対して \(Cp(B)\xi_1 = 0\)、すなわち

ABp(B)\xi_1 = BAp(B)\xi_1

が成り立つと仮定する。

この恒等式に \(p(t)=1\) を代入すると \(AB\xi_1 = BA\xi_1\) が得られる。

次に帰納法を用いる。ある \(k \geq 1\) に対して \(AB^k\xi_1 = B^kA\xi_1\) が成り立つと仮定すると、

AB^{k+1}\xi_1 = AB \cdot B^k \xi_1 = BA \cdot B^k \xi_1 
= B \cdot AB^k \xi_1 = B \cdot B^k A \xi_1 = B^{k+1} A \xi_1

となり、帰納法が完成する。

我々は、任意の \( k \geq 1 \) に対して \( AB^k \xi_1 = B^k A \xi_1 \) が成り立つことを結論する。したがって、任意の多項式 \( p(t) \) に対して

A p(B)\xi_1 = p(B) A \xi_1 = p(B)\lambda \xi_1 = \lambda (p(B)\xi_1)

となる。

したがって、もし \( p(B)\xi_1 \neq 0 \) であれば、\( p(B)\xi_1 \) は \( A \) の固有ベクトルである。

再び (1.1.9) を用いて、多項式 \( g_2(t) \) を選び、\( g_2(B)\xi_1 = g_2(B)g_1(A)x \) が \( B \) の固有ベクトル(必ず非零)になるようにする。

このとき \( q(s,t) = g_2(t)g_1(s) \) とおくと、\( q(A,B)x \) は \( A \) と \( B \) の共通固有ベクトルであることが示された。

場合 II:

ある多項式 \( f_1(t) \) が存在して \( C f_1(B)\xi_1 \neq 0 \) であると仮定する。

(1.1.9) を用いて、多項式 \( q_1(t) \) を取り、\( \xi_2 = q_1(A) C f_1(B)\xi_1 \) が \( A \) の固有ベクトルとなるようにする。

もし任意の多項式 \( p(t) \) に対して \( C p(B)\xi_2 = 0 \) であれば、場合 I によって共通固有ベクトルを構成できる。

そうでなければ、多項式 \( f_2(t) \) を取り \( C f_2(B)\xi_2 \neq 0 \) とし、多項式 \( q_2(t) \) を用いて \( \xi_3 = q_2(A) C f_2(B)\xi_2 \) を \( A \) の固有ベクトルとする。

この手続きを繰り返すことで、次のような固有ベクトル列を構成できる。

\xi_k = q_{k-1}(A) C f_{k-1}(B) \xi_{k-1}, \quad k = 2,3,\ldots

ここで、ある \( k \leq n \) に対して (i) \( C p(B)\xi_k = 0 \) が任意の多項式 \( p(t) \) について成り立つ場合、場合 I により \( A \) と \( B \) の共通固有ベクトルを得ることができる。

もし (i) が \( k = 1,2,\ldots,n \) のそれぞれで偽であるなら、構成により \( n+1 \) 個のベクトル \( \xi_1, \ldots, \xi_{n+1} \) が得られるが、これらは線形従属である。

したがって、零でないスカラーが少なくとも一つ存在する \( c_1, \ldots, c_{n+1} \) によって

c_1 \xi_1 + \cdots + c_{n+1} \xi_{n+1} = 0

が成り立つ。

ここで \( r = \min \{ i : c_i \neq 0 \} \) とすると、次が得られる。

- c_r \xi_r =
\sum_{i=r}^n c_{i+1} \xi_{i+1} =
\sum_{i=r}^n c_{i+1} q_i(A) C f_i(B) \xi_i

特に \( i=r \) の項は

c_{r+1} q_r(A) C f_r(B) \xi_r

となり、その他の項も (2.4.8.12) を繰り返し用いることで

h_i(A,B) C f_r(B) \xi_r

という形に書き換えられる(ただし \( h_i(A,B) \) は \( A,B \) の多項式)。

したがって、次の恒等式を得る。

- c_r \xi_r = p(A,B) C f_r(B) \xi_r

ここで \( p(s,t) \) は2変数の非可換多項式である。

これは、\( f_r(B)\xi_r \) が \( p(A,B)C \) の非零固有値 \( -c_r \) に対応する固有ベクトルであることを意味する。

しかし仮定では \( p(A,B)C \) は冪零であるため矛盾が生じる。この矛盾により、ある \( k \leq n \) について (i) が成立することが示され、したがって \( A \) と \( B \) は共通固有ベクトルをもつことが結論される。 □

我々はマッコイの定理 2.4.8.7 を複素行列に対して述べたが、もし (b) を「同時相似化」(同時ユニタリ相似化ではなく)に弱めれば、この定理は複素数体の部分体上の行列および多項式に対しても成り立つ。

ただしその部分体は行列 \( A_1, \ldots, A_m \) の固有値をすべて含んでいなければならない。


参考:Matrix Analysis:Second Edition ISBN 0-521-30587-X.(当サイトは公式と無関係です)

コメント

タイトルとURLをコピーしました