2.4.7 すべての正方行列はほとんど対角化可能である

2.4.7 すべての正方行列はほとんど対角化可能である

Schur の結果を用いると、すべての複素数値正方行列が「ほとんど対角化可能」であることが、次の2つの意味で明確になります。1つ目は、任意の行列に対してそれに任意に近い対角化可能な行列が存在すること、2つ目は、任意の行列が非対角成分が任意に小さい上三角行列に相似であることです。

定理 2.4.7.1. 任意の \( A = [a_{ij}] \in M_n \) と任意の \( \varepsilon > 0 \) に対し、\( n \) 個の異なる固有値を持つ(したがって対角化可能な)行列 \( A(\varepsilon) = [a_{ij}(\varepsilon)] \in M_n \) が存在して、次を満たします:

 \sum_{i,j=1}^n |a_{ij} - a_{ij}(\varepsilon)|^2 < \varepsilon 

証明: \( U \in M_n \) をユニタリ行列として \( U^*AU = T \) が上三角行列となるようにとります。

対角行列 \( E = \mathrm{diag}(\varepsilon_1, \varepsilon_2, \ldots, \varepsilon_n) \) を次の条件で構成します:

  • \( |\varepsilon_i| < \sqrt{\varepsilon/n} \)
  • \( t_{ii} + \varepsilon_i \ne t_{jj} + \varepsilon_j \)(\( i \ne j \))

(このような選び方は可能であることを少し考えればわかります。)

すると、\( T + E \) は \( n \) 個の異なる固有値 \( t_{11} + \varepsilon_1, \ldots, t_{nn} + \varepsilon_n \) を持ちます。よって、それと相似な行列 \( A + UEU^* \) も同様です。ここで、\( A(\varepsilon) = A + UEU^* \) とおくと、

 A - A(\varepsilon) = -UEU^* 

ゆえに、(2.2.2) より

 \sum_{i,j} |a_{ij} - a_{ij}(\varepsilon)|^2 = \sum_{i=1}^n |\varepsilon_i|^2 < n \cdot \frac{\varepsilon}{n} = \varepsilon 

練習問題: 定理 (2.4.6) にある条件

 \sum_{i,j} |a_{ij} - a_{ij}(\varepsilon)|^2 < \varepsilon 

は、次の条件に置き換えることができることを示しなさい:

 \max_{i,j} |a_{ij} - a_{ij}(\varepsilon)| < \varepsilon 

ヒント:定理を \( \varepsilon^2 \) を使って適用し、2乗和が \( \varepsilon^2 \) 未満であるなら、各項は絶対値で \( \varepsilon \) 未満であることを示す。

定理 2.4.7.2. 任意の \( A \in M_n \) と \( \varepsilon > 0 \) に対し、正則行列 \( S_\varepsilon \in M_n \) が存在して、

 S_\varepsilon^{-1} A S_\varepsilon = T_\varepsilon = [t_{ij}(\varepsilon)] 

が上三角行列であり、かつ \( i < j \) に対して次を満たします:

 |t_{ij}(\varepsilon)| \le \varepsilon 

証明: Schur の定理を適用して、ユニタリ行列 \( U \in M_n \) と上三角行列 \( T \in M_n \) を得るようにし、\( U^*AU = T \) とします。

任意の \( \alpha \ne 0 \) に対して対角行列 \( D_\alpha = \mathrm{diag}(1, \alpha, \alpha^2, \ldots, \alpha^{n-1}) \) を定義し、

 t = \max_{i<j} |t_{ij}| 

とおきます。

ここで \( \varepsilon < 1 \) を仮定して証明しても十分です。

もし \( t \le 1 \) ならば \( S_\varepsilon = UD_\varepsilon \) とし、そうでなければ \( S_\varepsilon = UD_{1/t} D_\varepsilon \) とします。どちらの場合も、この \( S_\varepsilon \) は主張を満たします。

特に \( t \le 1 \) のとき、計算により \( t_{ij}(\varepsilon) = t_{ij} \varepsilon^{j-i} \) となり、その絶対値は \( \varepsilon^{j-i} \le \varepsilon \) です(\( i < j \))。

一方、\( t > 1 \) の場合には、\( D_{1/t} \) によって類似変換を前処理することで、すべての非対角成分の絶対値を 1 以下に抑えることができます。

練習問題: 定理 (2.4.7.2) の次の変形版を証明しなさい:

もし \( A \in M_n \) および \( \varepsilon > 0 \) ならば、正則行列 \( S_\varepsilon \in M_n \) が存在して、

 S_\varepsilon^{-1} A S_\varepsilon = T_\varepsilon = [t_{ij}(\varepsilon)] 

が上三角行列であり、

 \sum_{j > i} |t_{ij}(\varepsilon)| \le \varepsilon 

を満たします。

ヒント:定理 (2.4.7) を \( \varepsilon \) の代わりに \( \frac{2\varepsilon}{n(n-1)} \) で適用せよ。

コメント

タイトルとURLをコピーしました