2.2 ユニタリ類似
ユニタリ行列 \( U \) に対して \( U^* = U^{-1} \) が成り立つことから、写像 \( A \mapsto U^*AU \) はユニタリ行列による類似変換(similarity transformation)になります。この特殊な類似変換をユニタリ類似(unitary similarity)と呼びます。
定義 2.2.1
\( A, B \in \mathbb{M}_n \) に対し、ユニタリ行列 \( U \in \mathbb{M}_n \) が存在して
A = U B U^*
が成り立つとき、\( A \) は \( B \) とユニタリ類似である(unitarily similar)と言います。もしこの \( U \) を実数でとることができ(したがって \( U \) は実直交行列)、そのようなときは「実直交類似」(real orthogonally similar)と呼びます。
また、\( A \) がユニタリ類似で対角化可能(unitarily diagonalizable)であるとは、ユニタリ行列 \( U \) によって対角行列にユニタリ類似であることを意味します。同様に、\( A \) が実直交類似で対角化可能とは、実直交行列によって対角行列に類似であることを意味します。
練習問題
ユニタリ類似が同値関係(equivalence relation)であることを示せ。
定理 2.2.2
\( U \in \mathbb{M}_n \)、\( V \in \mathbb{M}_m \) がユニタリ行列、\( A = [a_{ij}] \in \mathbb{M}_{n,m} \)、\( B = [b_{ij}] \in \mathbb{M}_{n,m} \)、かつ \( A = U B V \) とする。このとき、
\sum_{i=1}^{n} \sum_{j=1}^{m} |a_{ij}|^2 = \sum_{i=1}^{n} \sum_{j=1}^{m} |b_{ij}|^2
特に、\( m = n \) かつ \( V = U^* \) のとき、すなわち \( A \) が \( B \) にユニタリ類似であるとき、この恒等式が成り立ちます。
証明
次を示せば十分です:
\operatorname{tr}(A^*A) = \operatorname{tr}(B^*B)
実際、
A = UBV \Rightarrow A^*A = (UBV)^* (UBV) = V^* B^* U^* U B V = V^* B^* B V
よって、
\operatorname{tr}(A^*A) = \operatorname{tr}(V^* B^* B V) = \operatorname{tr}(B^* B V V^*) = \operatorname{tr}(B^* B)
練習問題
次の 2 行列が類似であるが、ユニタリ類似ではないことを示せ:
A = \begin{bmatrix} 3 & 1 \\ -2 & 0 \end{bmatrix}, \quad B = \begin{bmatrix} 1 & 1 \\ 0 & 2 \end{bmatrix}
ユニタリ類似は通常の類似を含みますが、その逆は成り立ちません。つまり、類似であってもユニタリ類似であるとは限りません。ユニタリ類似による同値類は、通常の類似よりも細かい分類になります。
ユニタリ類似も類似と同様に、基底の変更に対応しますが、特に「正規直交基底から別の正規直交基底への変換」に対応します。
練習問題
式 (2.1.11) の記法を用いて、平面回転 \( U(\theta; i, j) \) による実直交類似変換の下で、行と列の \( i, j \) のみが変化する理由を説明せよ。
練習問題
式 (2.1.13) の記法を用いて、任意の \( A \in \mathbb{M}_n \) に対して次が成り立つ理由を示せ:
U(y, x)^* A U(y, x) = U_w^* A U_w
すなわち、基本的にエルミートなユニタリ行列 \( U(y, x) \) によるユニタリ類似変換は、ハウスホルダー行列(Householder matrix)による類似変換と一致します。ハウスホルダー行列によるユニタリまたは実直交類似変換のことをハウスホルダー変換(Householder transformation)と呼びます。
計算上または理論的な理由から、ある行列をユニタリ類似で別の特別な形に変換することがしばしば便利です。以下はその代表的な例です。
例 2.2.3:対角成分がすべて等しい行列へのユニタリ類似
行列 \( A = [a_{ij}] \in \mathbb{M}_n \) が与えられたとします。ユニタリ行列 \( U \in \mathbb{M}_n \) が存在して、\( B = U^* A U = [b_{ij}] \) のすべての主対角成分が等しくなることを主張します。もし \( A \) が実行列なら、\( U \) は実直交行列として選ぶことができます。
この主張が正しければ、\( \operatorname{tr} A = \operatorname{tr} B = n b_{11} \) となるため、\( B \) の主対角成分はすべて \( A \) の主対角成分の平均と等しいことになります。
複素数体で \( n = 2 \) の場合
任意の \( A \in \mathbb{M}_2 \) に対して、\( A - \frac{1}{2} \operatorname{tr} A \cdot I \) に置き換えることで一般性を失わずに \( \operatorname{tr} A = 0 \) と仮定できます。このとき、\( A \) の固有値は \( \pm\lambda \)(\( \lambda \in \mathbb{C} \))です。
このとき、\( u^* A u = 0 \) となる単位ベクトル \( u \) を求めたい。もし \( \lambda = 0 \) なら、\( A u = 0 \) を満たす任意の単位ベクトル \( u \) を取ればよいです。
\( \lambda \ne 0 \) の場合は、\( A \) の固有値 \( \pm \lambda \) に対応する線形独立な固有ベクトル \( w, z \) をとり、\( x(\theta) = e^{i\theta} w + z \) と定義します。これは任意の \( \theta \in \mathbb{R} \) に対して 0 でないベクトルです。
このとき次が成り立ちます:
x(\theta)^* A x(\theta) = \lambda (e^{i\theta} w + z)^* (e^{i\theta} w - z) = 2i\lambda \operatorname{Im}(e^{i\theta} z^* w)
もし \( z^* w = e^{i\varphi} |z^* w| \) なら、\( \theta = -\varphi \) に取ると、上式は 0 になります。したがって、\( u = x(-\varphi)/\|x(-\varphi)\| \) とすればよいです。
次に、\( u \) に直交する任意の単位ベクトル \( v \in \mathbb{C}^2 \) を取って、\( U = [u \ v] \) を作ると、これはユニタリ行列で、\( (U^* A U)_{11} = u^* A u = 0 \) が成り立ちます。
また、\( \operatorname{tr}(U^* A U) = \operatorname{tr} A = 0 \) なので、\( (U^* A U)_{22} = 0 \) も成り立ちます。
実数体で \( n = 2 \) の場合
行列 \( A = [a_{ij}] \in \mathbb{M}_2 \) の対角成分が異なると仮定します。このとき、回転行列
U_\theta = \begin{bmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{bmatrix}
を用いると、計算により、\( U_\theta A U_\theta^T \) の対角成分が等しくなる条件は次の通りです:
(\cos^2 \theta - \sin^2 \theta)(a_{11} - a_{22}) = 2 \sin\theta \cos\theta (a_{12} + a_{21})
よって、
\cot 2\theta = \frac{a_{12} + a_{21}}{a_{11} - a_{22}}
を満たす \( \theta \in (0, \frac{\pi}{2}) \) を選べば、対角成分が等しくなります。
以上により、任意の \( 2 \times 2 \) 行列 \( A \) は、主対角成分が等しい行列にユニタリ類似であり、\( A \) が実行列なら実直交類似になります。
一般の \( n > 2 \) の場合
次を定義します:
f(A) = \max\{ |a_{ii} - a_{jj}| : i, j = 1, \ldots, n \}
\( f(A) > 0 \) のとき、\( f(A) = |a_{ii} - a_{jj}| \) を与えるインデックスの対 \( (i, j) \) を選びます(複数あれば任意に1つを選ぶ)。そして、
A_2 = \begin{bmatrix} a_{ii} & a_{ij} \\ a_{ji} & a_{jj} \end{bmatrix}
とします。この \( A_2 \) に対して、ユニタリ行列(\( A \) が実なら実直交行列)\( U_2 \in \mathbb{M}_2 \) を選び、\( U_2^* A_2 U_2 \) の対角成分を
\frac{1}{2}(a_{ii} + a_{jj})
と等しくします。
次に、(2.1.11) の回転行列のように \( U(i, j) \in \mathbb{M}_n \) を構成します。この \( U(i, j)^* A U(i, j) \) は \( A \) の \( i \) 行と \( j \) 行(および列)のみに影響を与え、それ以外の主対角成分を保ちます。
一方で、すべての \( k \ne i, j \) に対し、次の評価が成り立ちます:
\left| a_{kk} - \frac{1}{2}(a_{ii} + a_{jj}) \right| = \left| \frac{1}{2}(a_{kk} - a_{ii}) + \frac{1}{2}(a_{kk} - a_{jj}) \right| \le \frac{1}{2} |a_{kk} - a_{ii}| + \frac{1}{2} |a_{kk} - a_{jj}| \le f(A)
等号成立は \( a_{ii} = a_{jj} \) の場合のみです。したがって、主対角成分の差の最大値 \( f(A) \) は、この変換により確実に減少します。この操作を有限回繰り返すことで、最終的にすべての主対角成分が等しくなるようなユニタリ行列 \( U \)(実行列なら実直交行列)を得られます。
補足:コンパクト性と連続性の議論
集合 \( R(A) = \{ U^* A U : U \in \mathbb{M}_n \text{はユニタリ} \} \) を考えます。これはコンパクト集合であり、関数 \( f \) は \( R(A) \) 上の連続な非負関数なので、最小値を達成する点 \( B \in R(A) \) が存在します。
もし \( f(B) > 0 \) なら、上で構成したような \( U \) によって \( f(U^* B U) < f(B) \) となり、最小性に矛盾します。よって、\( f(B) = 0 \) であり、これは \( B \) の主対角成分がすべて等しいことを意味します。
例 2.2.4:上ヘッセンベルグ行列へのユニタリ類似
行列 \( A = [a_{ij}] \in M_n \) が与えられたとします。以下に示す構成によって、\( A \) は下の対角線に非負の成分を持つ上ヘッセンベルグ行列とユニタリ類似であることが示されます。
\( A \) の第1列を \( a_1 = [a_{11}, \xi^T]^T \) と分割し、ここで \( \xi \in \mathbb{C}^{n-1} \) とします。もし \( \xi = 0 \) ならば、単位行列 \( U_1 = I_{n-1} \) を使います。そうでない場合は、(2.1.13) に従って、ユニタリ行列 \( U_1 = U(\|\xi\|_2 e_1, \xi) \in M_{n-1} \) を構成します。これは \( \xi \) を \( e_1 \) の正の倍数に写すものです。
次に、ユニタリ行列
V_1 = I_1 \oplus U_1
を構成し、\( V_1 A \) の第1列が次のベクトル
[a_{11}, \|\xi\|_2, 0, \dots, 0]^T
であることを確認します。さらに、
A_1 = V_1 A V_1^*
も \( A \) とユニタリ類似であり、第1列は \( V_1 A \) と同じです。
このとき \( A_1 \) を以下のように分割します:
A_1 = \begin{bmatrix} a_{11} & * \\ \|\xi\|_2 & \\ 0 & A_2 \end{bmatrix}, \quad A_2 \in M_{n-1}
次に、(2.1.13) に従い、\( A_2 \) の第1列を第2成分が非負、かつ第3成分以下がすべて 0 となるようなベクトルに写すユニタリ行列 \( U_2 \) を構成します。次に
V_2 = I_2 \oplus U_2
を定め、
A_2 = V_2 A V_2^*
とします。この変換は \( A_1 \) の第1列には影響を与えません。
この手順を最大で \( n - 1 \) 回繰り返すことで、非負の下対角成分を持つ上ヘッセンベルグ行列 \( A_{n-1} \) を得ます。これは \( A \) とユニタリ類似です。
練習問題: \( A \) がエルミートまたは反エルミート行列であるとき、上記の構成によって得られる行列が、それぞれ三重対角のエルミートまたは反エルミート行列になることを説明しなさい。この行列は \( A \) とユニタリ類似である。
コメント