6.3.12
この定理は、行列 \( A \in M_n \) の単純固有値 \( \lambda \) が、摂動 \( A + tE \) によってどのように変化するかを定量的に示すものである。ここで \( E \in M_n \) は任意の行列であり、\( x \) と \( y \) はそれぞれ \( \lambda \) に対応する右固有ベクトルおよび左固有ベクトルとする。
定理 6.3.12. \( A, E \in M_n \) とし、\( \lambda \) を \( A \) の単純固有値とする。\( x \) および \( y \) をそれぞれ \( \lambda \) に対応する右・左固有ベクトルとする。このとき次が成り立つ。
(a) 任意の \( \varepsilon \gt 0 \) に対して、ある \( \delta \gt 0 \) が存在し、すべての複素数 \( t \) で \(|t| \lt \delta\) を満たすものについて、\( A + tE \) にはただ1つの固有値 \( \lambda(t) \) が存在して、
|\lambda(t) - \lambda - t \, \frac{y^{*}E x}{y^{*}x}| \le |t| \varepsilon
(b) \( \lambda(t) \) は \( t = 0 \) で連続であり、
\lim_{t \to 0} \lambda(t) = \lambda
(c) \( \lambda(t) \) は \( t = 0 \) で微分可能であり、次が成り立つ。
\left. \frac{d\lambda(t)}{dt} \right|_{t=0} = \frac{y^{*}E x}{y^{*}x}
証明. 戦略としては、\( A + tE \) に相似な行列を構成し、その \((1,1)\) 成分を \( \lambda + t \frac{y^{*}E x}{y^{*}x} \) とし、さらにこの行列のゲルシュゴリン円板のうち最初の行に対応する円板の半径が \( |t|\varepsilon \) 以下であり、他の \( n-1 \) 個の円板と交わらないようにする。
まず、\( \mu = \min\{ |\lambda - \hat{\lambda}| : \hat{\lambda} \text{ は } A \text{ の固有値で } \hat{\lambda} \ne \lambda \} \) とおく。このとき仮定より \( \mu \gt 0 \) である。ここで \( \varepsilon \in (0, \mu/7) \) を選ぶ。
補題 (6.3.10) の記号を用いる。すなわち \( \eta = y / (y^{*}x) \) とおき、次の相似変換を考える:
S^{-1}(A + tE)S = \begin{bmatrix} \lambda & 0 \\ 0 & A_{1} \end{bmatrix} + t \begin{bmatrix} \eta^{*}E x & \eta^{*}E S_{1} \\ Z_{1}^{*}E x & Z_{1}^{*}E S_{1} \end{bmatrix} = \begin{bmatrix} \lambda + t\eta^{*}E x & t\eta^{*}E S_{1} \\ tZ_{1}^{*}E x & A_{1} + tZ_{1}^{*}E S_{1} \end{bmatrix}
ここで、行列の \((1,1)\) 成分が \( \lambda + t\frac{y^{*}E x}{y^{*}x} \) となることが確認できる。次に、(2.4.7.2) で述べた「ほぼ対角な」上三角形の形に \( A_{1} \) を変換する相似変換を行う:
A_{1} = S_{\varepsilon} T_{\varepsilon} S_{\varepsilon}^{-1}
ここで \( T_{\varepsilon} \) は上三角行列で、\( A_{1} \) の固有値を主対角上に持ち、行削除絶対行和が高々 \( \varepsilon \) である。さらに \( S_{\varepsilon} = [1] \oplus S_{\varepsilon} \) とし、相似変換を施すと次のようになる:
S_{\varepsilon}^{-1}S^{-1}(A + tE)SS_{\varepsilon} = \begin{bmatrix} \lambda + t\eta^{*}E x & t\eta^{*}E S_{1}S_{\varepsilon} \\ tS_{\varepsilon}^{-1}Z_{1}^{*}E x & T_{\varepsilon} + tS_{\varepsilon}^{-1}Z_{1}^{*}E S_{1}S_{\varepsilon} \end{bmatrix}
さらに、\( r \gt 0 \) で \( R(r) = [1] \oplus r I_{n-1} \) とおき、\( r \| \eta^{*}E S_{1}S_{\varepsilon} \|_{1} \lt \varepsilon \) となるように選ぶ。このとき最終的な相似変換を行う:
R(r)^{-1}S_{\varepsilon}^{-1}S^{-1}(A + tE)SS_{\varepsilon}R(r)\\ = \begin{bmatrix} \lambda + t\eta^{*}E x & t r \eta^{*}E S_{1}S_{\varepsilon} \\ t r^{-1} S_{\varepsilon}^{-1}Z_{1}^{*}E x & T_{\varepsilon} + t S_{\varepsilon}^{-1}Z_{1}^{*}E S_{1}S_{\varepsilon} \end{bmatrix}
この構成により、ゲルシュゴリン円板の議論を適用できる。主対角成分 \( \lambda + t\eta^{*}E x \) に対応する円板の半径は \( |t|\varepsilon \) 以下であり、他の \( n-1 \) 個の円板とは交わらない。よって定理 6.1.1 により、\( A + tE \) はこの円板内にただ1つの固有値 \( \lambda(t) \) を持つ。
したがって、
|\lambda(t) - \lambda - t\eta^{*}E x| \le |t|\varepsilon
さらに、\( |t| \lt \delta \) のとき
|\lambda(t) - \lambda| \le |t|\varepsilon + |t|\,|\eta^{*}E x| \le 2\varepsilon
が成り立つ。この結果から (b) が従う。また、
\left| \frac{\lambda(t) - \lambda}{t} - \eta^{*}E x \right| \lt \varepsilon \quad (0 \lt |t| \lt \delta)
より、(c) も成立する。
固有値の感度と近似固有値の評価
次の演習では、前の定理の仮定と記号を用いる。
演習
ベクトル \(x = [x_i]\)、\(y = [y_i]\) とする。このとき、次の式が成り立つ理由を説明せよ。
\frac{\partial \lambda}{\partial a_{ij}} = \frac{\overline{y_i} x_j}{y^* x}
ただし、\(i, j = 1, \ldots, n\) である。ヒント:\(E = E_{ij}\) を、\(i,j\) 成分のみが1で他は0の \(n \times n\) 行列とする。
次の演習を考える。正の数 \( \epsilon \gt 0 \) が与えられているとする。行列
A = \begin{bmatrix} 1 & 1 \\ 0 & 1 + \epsilon \end{bmatrix}
を考える。このとき、単純固有値(重複度1の固有値)は \(\lambda = 1\) であり、対応する右固有ベクトルと左固有ベクトルはそれぞれ
x = \begin{bmatrix} 1 \\ 0 \end{bmatrix}, \quad y = \begin{bmatrix} \epsilon \\ -1 \end{bmatrix}
である。全ての \(i, j\) の組に対して \(\partial \lambda / \partial a_{ij}\) を計算せよ。さらに、\(\epsilon \to 0\) のときに何が起こるかを考察せよ。これより、固有ベクトル \(x\) と \(y\) がほぼ直交している場合、対応する固有値は特定の行列摂動に対して非常に敏感であることがわかる。
式 (6.3.13) による単純固有値の導関数の公式には、特異値に対する類似の式も存在する(式 (7.3.12) を参照)。
固有値の状況とは対照的に、対角化可能な行列の固有ベクトルは、行列要素のわずかな摂動によって大きく変化する場合がある。たとえば、
A = \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix}, \quad E = \begin{bmatrix} \epsilon & \delta \\ 0 & 0 \end{bmatrix}
とする。ただし \(\epsilon, \delta \ne 0\) とする。このとき、\(A + E\) の固有値は \(\lambda = 1\) および \(\lambda = 1 + \epsilon\) であり、それぞれの正規化された右固有ベクトルは
\begin{bmatrix} 1 \\ 0 \end{bmatrix}, \quad \frac{1}{(\epsilon^2 + \delta^2)^{1/2}} \begin{bmatrix} -\delta \\ \epsilon \end{bmatrix}
である。比 \(\epsilon / \delta\) を適切に選ぶことで、後者の固有ベクトルは \(\epsilon\) および \(\delta\) を任意に小さくしても、任意の方向を指すように選ぶことができる。
これまでに示した固有値摂動の評価は、すべて事前評価(a priori)であり、計算された固有値や固有ベクトル、またはそれらから導かれる量を含まない。
ここで、\( \hat{x} \ne 0 \) を行列 \(A \in M_n\) の「近似固有ベクトル」とし、対応する「近似固有値」を \( \hat{\lambda} \) とする。もし \(A\) が対角化可能であれば、残差ベクトル
r = A \hat{x} - \hat{\lambda} \hat{x}
を用いることで、\(\hat{\lambda}\) が \(A\) の真の固有値をどの程度近似しているかを評価することができる。
行列解析の総本山

コメント