2.4.8 可換な行列族と同時三角化

2.4.8 可換な行列族と同時三角化

ここでは、Schur の定理の可換族版 (2.3.3) を用いて、可換行列の固有値がある順序で「加法的」かつ「乗法的」であることを示します。

定理 2.4.8.1. \( A, B \in M_n \) が可換であるとする。このとき、\( A \) の固有値の順序を \( \alpha_1, \ldots, \alpha_n \)、\( B \) の固有値の順序を \( \beta_1, \ldots, \beta_n \) と取れば、行列 \( A + B \) の固有値は \( \alpha_1 + \beta_1, \alpha_2 + \beta_2, \ldots, \alpha_n + \beta_n \) であり、行列 \( AB \) の固有値は \( \alpha_1 \beta_1, \alpha_2 \beta_2, \ldots, \alpha_n \beta_n \) となる。特に、スペクトルは以下を満たす:

 \sigma(A + B) \subseteq \sigma(A) + \sigma(B), \quad \sigma(AB) \subseteq \sigma(A) \sigma(B). 

証明: \( A, B \) は可換なので、(2.3.3) によりユニタリ行列 \( U \in M_n \) が存在し、\( U^* A U = T = [t_{ij}] \) と \( U^* B U = R = [r_{ij}] \) はともに上三角行列となる。行列 \( T + R = U^*(A + B)U \) の対角成分(したがって固有値)は \( t_{11} + r_{11}, \ldots, t_{nn} + r_{nn} \) であり、\( A + B \) と相似なのでこれが \( A + B \) の固有値である。行列 \( TR = U^*(AB)U \) の対角成分は \( t_{11} r_{11}, \ldots, t_{nn} r_{nn} \) であり、これが \( AB \) の固有値となる。

練習問題: \( A, B \in M_n \) が可換のとき、スペクトル半径について \( \rho(A + B) \leq \rho(A) + \rho(B) \)、\( \rho(AB) \leq \rho(A) \rho(B) \) が成り立つ理由を説明せよ。すなわち、スペクトル半径関数は可換行列に対し部分加法的かつ部分乗法的である。

例 2.4.8.2. \( A, B \) が可換でも、固有値の和すべてが \( A + B \) の固有値とは限らない。例えば、対角行列

のとき、\( 1 + 4 = 5 \notin \{4, 6\} = \sigma(A + B) \) であるため、\( \sigma(A + B) \subsetneq \sigma(A) + \sigma(B) \) となる。

例 2.4.8.3. \( A, B \) が可換でない場合、\( \sigma(A + B) \) が \( \sigma(A) \) や \( \sigma(B) \) とどのような関係にあるか述べることは困難である。特に、\( \sigma(A + B) \subseteq \sigma(A) + \sigma(B) \) は成り立たない。たとえば

のとき、\( \sigma(A + B) = \{-1, 1\} \) であるが、\( \sigma(A) = \sigma(B) = \{0\} \) である。

練習問題: 上の例の行列について、なぜ \( \rho(A + B) > \rho(A) + \rho(B) \) となり、スペクトル半径関数が \( M_n \) 上で部分加法的でないか説明せよ。

例 2.4.8.4. (2.4.8.1) の逆は成り立つか?すなわち、\( A, B \) の固有値がある順序で和になるなら、\( A, B \) は可換でなければならないか?答えは否である。特に、すべてのスカラー \( \alpha, \beta \) について \( \alpha A \) と \( \beta B \) の固有値が和になる場合でも、可換とは限らない。この現象は興味深く、そのような行列対の特徴付けは未解決問題である。

例えば、非可換な行列

がある。このとき、\( \sigma(A) = \sigma(B) = \{0\} \) であり、多項式の特性多項式は \( p_{\alpha A + \beta B}(t) = t^3 \) であって、任意の \( \alpha, \beta \in \mathbb{C} \) で \( \sigma(\alpha A + \beta B) = \{0\} \) と固有値は和になる。もし \( A, B \) が同時に上三角化可能ならば、(2.4.8.1) の証明から \( AB \) の固有値は \( A, B \) の固有値の積の並び替えであるはずだが、

であり、よって \( A, B \) は同時三角化可能ではない。

系 2.4.8.5. \( A, B \in M_n \) が可換で、\( \sigma(A) = \{\alpha_1, \ldots, \alpha_{d_1}\} \)、\( \sigma(B) = \{\beta_1, \ldots, \beta_{d_2}\} \) とする。もしすべての \( i, j \) について \( \alpha_i \neq -\beta_j \) ならば、\( A + B \) は正則行列である。

演習問題

(2.4.8.5) を (2.4.8.1) を用いて確認せよ。

演習問題:\( T = [t_{ij}] \)、\( R = [r_{ij}] \) を同じサイズの \( n \times n \) の上三角行列とし、\( p(s, t) \) を非可換変数2つに関する多項式(すなわち、2つの非可換変数の単語の線形結合)とする。このとき、\( p(T, R) \) が上三角行列であり、その主対角成分(固有値)が \( p(t_{11}, r_{11}), \ldots, p(t_{nn}, r_{nn}) \) であることを説明せよ。

複素行列において、同時三角化と同時ユニタリ三角化は同値な概念である。

定理 2.4.8.6

行列 \( A_1, \ldots, A_m \in \mathbb{M}_n \) が与えられているとする。次の条件は同値である:

  • 可逆行列 \( S \in \mathbb{M}_n \) が存在して、すべての \( i = 1, \ldots, m \) に対して \( S^{-1}A_i S \) が上三角行列である。
  • ユニタリ行列 \( U \in \mathbb{M}_n \) が存在して、すべての \( i = 1, \ldots, m \) に対して \( U^*A_iU \) が上三角行列である。

証明

(2.1.14) を用いて \( S = QR \) と書く。ただし、\( Q \) はユニタリ行列、\( R \) は上三角行列とする。

このとき、

 T_i = S^{-1} A_i S = (QR)^{-1} A_i (QR) = R^{-1} Q^* A_i Q R 

は上三角行列となる。よって、

 Q^* A_i Q = R T_i R^{-1} 

は3つの上三角行列の積なので、やはり上三角行列である。■

マッコイの定理(Theorem 2.4.8.7)

自然数 \( m \geq 2 \) とし、行列 \( A_1, \ldots, A_m \in \mathbb{M}_n \) が与えられているとする。次の条件は同値である:

  1. 任意の非可換変数 \( t_1, \ldots, t_m \) に関する多項式 \( p(t_1, \ldots, t_m) \) とすべての \( k, \ell = 1, \ldots, m \) に対して、行列 \( p(A_1, \ldots, A_m)(A_k A_\ell - A_\ell A_k) \) は冪零である。
  2. ユニタリ行列 \( U \in \mathbb{M}_n \) が存在して、すべての \( i \) に対して \( U^*A_iU \) が上三角行列である。
  3. 各行列 \( A_i \) に対してその固有値の順序付き集合 \( \lambda_1^{(i)}, \ldots, \lambda_n^{(i)} \) が存在して、任意の非可換変数の多項式 \( p(t_1, \ldots, t_m) \) に対して、行列 \( p(A_1, \ldots, A_m) \) の固有値は \( p(\lambda_i^{(1)}, \ldots, \lambda_i^{(m)}) \)(\( i = 1, \ldots, n \))である。

証明概要

  • (b) ⇒ (c):\( T_k = U^*A_kU = [t_{ij}^{(k)}] \) を上三角行列とし、\( \lambda_i^{(k)} = t_{ii}^{(k)} \) とする。すると、\( p(A_1, \ldots, A_m) = Up(T_1, \ldots, T_m)U^* \) なので、主対角成分は \( p(\lambda_i^{(1)}, \ldots, \lambda_i^{(m)}) \)。
  • (c) ⇒ (a):与えられた任意の多項式 \( p(t_1, \ldots, t_m) \) に対して、次の多項式を考える:
 q_{k\ell}(t_1, \ldots, t_m) = p(t_1, \ldots, t_m)(t_k t_\ell - t_\ell t_k) 

これにより、固有値がすべて 0 になるため、行列は冪零である。

  • (a) ⇒ (b):仮定により共通固有ベクトル \( x \) が存在するとして帰納法を用いて示す。(詳細は省略)

 

補題 2.4.8.10

行列 \( A_1, \ldots, A_m \in \mathbb{M}_n \) が、任意の非可換変数の多項式 \( p(t_1, \ldots, t_m) \) に対して、すべての \( k, \ell \) について行列 \( p(A_1, \ldots, A_m)(A_k A_\ell - A_\ell A_k) \) が冪零であると仮定する。このとき、任意の非零ベクトル \( x \in \mathbb{C}^n \) に対して、ある多項式 \( q(t_1, \ldots, t_m) \) が存在して、\( q(A_1, \ldots, A_m)x \) はすべての \( A_i \) に共通な固有ベクトルとなる。

証明の概略(\( m = 2 \) の場合)

行列 \( A, B \in \mathbb{M}_n \) に対して、\( C = AB - BA \) とおく。任意の多項式 \( p(s, t) \) に対して \( p(A, B)C \) が冪零であるとする。

任意の非零ベクトル \( x \) に対して、ある多項式 \( q(s, t) \) が存在して \( q(A, B)x \) が \( A \) と \( B \) の共通固有ベクトルとなることを示す。

詳細な構成は、場合分け(Case I, II)と帰納法、および冪零性に反する仮定の矛盾によって証明される。

証明(\( m = 2 \) の場合)

ここでは一般の場合の特徴をすべて示すために、特に \( m = 2 \) の場合を考える。行列 \( A, B \in \mathbb{M}_n \) とし、

 C = AB - BA 

と定義する。すべての非可換変数 \( s, t \) に関する多項式 \( p(s, t) \) に対して、\( p(A, B)C \) が冪零であると仮定する。任意の非零ベクトル \( x \in \mathbb{C}^n \) に対して、ある多項式 \( q(s, t) \) が存在して、\( q(A, B)x \) が \( A \) と \( B \) の共通固有ベクトルになることを示す。

Case I:

まず、(1.1.9) を使って、多項式 \( g_1(t) \) を選び、

 \xi_1 = g_1(A)x 

が \( A \) の固有ベクトル(つまり \( A\xi_1 = \lambda \xi_1 \))になるようにする。

次に、任意の多項式 \( p(t) \) に対して \( Cp(B)\xi_1 = 0 \) であると仮定する。これはすなわち:

 ABp(B)\xi_1 = BAp(B)\xi_1 

(式 2.4.8.11)。\( p(t) = 1 \) のとき、\( AB\xi_1 = BA\xi_1 \) となる。

次に帰納法を用いる。ある \( k \geq 1 \) に対して \( AB^k \xi_1 = B^k A \xi_1 \) と仮定する。このとき、

 AB^{k+1} \xi_1 = AB \cdot B^k \xi_1 = BA \cdot B^k \xi_1 = B \cdot AB^k \xi_1 = B \cdot B^k A \xi_1 = B^{k+1} A \xi_1 

よってすべての \( k \geq 1 \) に対して \( AB^k \xi_1 = B^k A \xi_1 \) が成り立ち、したがって任意の多項式 \( p(t) \) に対して、

 Ap(B)\xi_1 = \lambda p(B)\xi_1 

より、\( p(B)\xi_1 \) が \( A \) の固有ベクトルとなる(非零であれば)。再度 (1.1.9) を用いて、多項式 \( g_2(t) \) を選び、

 g_2(B)\xi_1 = g_2(B)g_1(A)x 

が \( B \) の固有ベクトル(必ず非零)となるようにする。このとき、

 q(s, t) = g_2(t)g_1(s) 

と定めれば、\( q(A, B)x \) は \( A \) と \( B \) の共通固有ベクトルになる。

Case II:

ある多項式 \( f_1(t) \) が存在して \( C f_1(B)\xi_1 \neq 0 \) であるとする。(1.1.9) を用いて、多項式 \( q_1(t) \) を選び、

 \xi_2 = q_1(A)C f_1(B)\xi_1 

が \( A \) の固有ベクトルとなるようにする。もし \( Cp(B)\xi_2 = 0 \) であれば Case I に戻って共通固有ベクトルが得られる。

そうでなければ、さらに \( f_2(t) \), \( q_2(t) \) を使って

 \xi_3 = q_2(A)C f_2(B)\xi_2 

を構成する。同様にして、次の漸化式により \( A \) の固有ベクトル列を構成していく:

 \xi_k = q_{k-1}(A)C f_{k-1}(B)\xi_{k-1},\quad k = 2, 3, \ldots 

以下のいずれかが成り立つまで繰り返す:

  1. (i) ある \( k \leq n \) に対して \( Cp(B)\xi_k = 0 \)(Case I に戻る)
  2. (ii) \( k = n + 1 \) になる

後者の場合、ベクトル列 \( \xi_1, \ldots, \xi_{n+1} \) は線形従属なので、係数 \( c_1, \ldots, c_{n+1} \) が存在して:

 c_1\xi_1 + \cdots + c_{n+1}\xi_{n+1} = 0 

最小の \( r \) を \( c_r \neq 0 \) であるように選び、次の式を得る:

 -cr\xi_r = \sum_{i=r}^{n} c_{i+1} \xi_{i+1} = \sum_{i=r}^{n} c_{i+1}q_i(A)C f_i(B)\xi_i 

右辺の第1項は、(2.4.8.12) より:

 c_{r+2}q_{r+1}(A)C f_{r+1}(B)q_r(A)C f_r(B)\xi_r 

その他の項もすべて、ある多項式 \( h_i(A, B) \) によって:

 h_i(A, B)C f_r(B)\xi_r 

と書ける。したがって、次の形の恒等式が得られる:

 -cr\xi_r = p(A, B)C f_r(B)\xi_r 

ここで \( p(s, t) \) は2つの非可換変数の多項式である。これは \( f_r(B)\xi_r \) が \( p(A, B)C \) の非零固有値 \( -cr \) に対応する固有ベクトルであることを意味するが、これは \( p(A, B)C \) が冪零であるという仮定に矛盾する。したがって、(i) が成り立ち、Case I に戻って共通固有ベクトルが得られる。■

補足

我々はマッコイの定理 2.4.8.7 を複素行列に対して述べてきたが、条件 (b) を「同時ユニタリ相似」ではなく「同時相似」に弱めれば、定理はすべての固有値を含む複素数の部分体上の行列および多項式にも適用可能である。

コメント

タイトルとURLをコピーしました