7.4.12 カントロビッチとヴィーラントの不等式
行列 \( A \in M_n \) がエルミートかつ正定値であるとする。ここで、\(\lambda_1\) および \(\lambda_n\) をそれぞれ \(A\) の最小および最大の固有値とする。本節の目的は、次の2つの古典的不等式が等価かつ成立することを示し、さらにそれらの解析的および幾何的な意味を考察することである。
まず、カントロビッチの不等式は次のように与えられる。
(x^* A x)(x^* A^{-1} x) \le \frac{(\lambda_1 + \lambda_n)^2}{4 \lambda_1 \lambda_n} \, \|x\|_4^2
\quad \text{for all } x \in \mathbb{C}^n
一方、ヴィーラントの不等式は次のように与えられる。
|x^* A y|^2 \le
\left( \frac{\lambda_1 - \lambda_n}{\lambda_1 + \lambda_n} \right)^2
(x^* A x)(y^* A y) \\
\quad \text{for all orthogonal } x, y \in \mathbb{C}^n
式 (7.4.12.1) は \(x = 0\) の場合に成り立ち、式 (7.4.12.2) は \(x = 0\) または \(y = 0\) の場合に成り立つ。したがって、以降の議論では \(x \ne 0\)、\(y \ne 0\) の場合のみを考える。
カントロビッチの不等式を導くために、まず次の3つの行列を考える: \(\lambda_n I - A\)、\(A - \lambda_1 I\)、および \(A^{-1}\)。これらはいずれもエルミートであり、最初の2つは半正定値、最後の1つは正定値である。これら3つの行列は可換なので、その積もまたエルミートかつ半正定値である。したがって、任意の非零ベクトル \(x\) に対して次が成り立つ。
0 \le x^* (\lambda_n I - A)(A - \lambda_1 I)A^{-1} x
= x^* \left( (\lambda_1 + \lambda_n)I - \lambda_1 \lambda_n A^{-1} - A \right) x
したがって、次の不等式が得られる。
x^* A x + \lambda_1 \lambda_n (x^* A^{-1} x) \le (\lambda_1 + \lambda_n)(x^* x)
ここで \(t_0 = \lambda_1 \lambda_n (x^* A^{-1} x)\) とおくと、上式は次のように書き換えられる。
t_0 (x^* A x) \le t_0 (\lambda_1 + \lambda_n)(x^* x) - t_0^2
関数 \( f(t) = t(\lambda_1 + \lambda_n)(x^*x) - t^2 \) は凹関数であり、その臨界点は \(t = (x^*x)(\lambda_1 + \lambda_n)/2\) にあり、そこで最大値を取る。したがって、 \( f(t_0) \le (x^*x)^2 (\lambda_1 + \lambda_n)^2 / 4 \) であり、式 (7.4.12.4) から次を得る。
\lambda_1 \lambda_n (x^* A^{-1} x)(x^* A x)
\le \frac{1}{4} (\lambda_1 + \lambda_n)^2 (x^*x)^2
これがカントロビッチの不等式 (7.4.12.1) である。
次に、カントロビッチの不等式がヴィーラントの不等式を含意することを示す。正定値な \(2 \times 2\) 行列
B = \begin{bmatrix} a & b \\ \bar{b} & c \end{bmatrix}
を考える。このとき、逆行列は \( B^{-1} = (\det B)^{-1} \operatorname{adj} B = \begin{bmatrix} c / \det B & * \\ * & * \end{bmatrix} \) である。固有値を \(\mu_1 \le \mu_2\) とする。ここで \(x = e_1\)、\(A = B\) とすると、不等式 (7.4.12.1) は次のように書ける。
\frac{(\mu_1 + \mu_2)^2}{4 \mu_1 \mu_2}
\ge (e_1^* B e_1)(e_1^* B^{-1} e_1)
= \frac{ac}{ac - |b|^2}
= \frac{1}{1 - \frac{|b|^2}{ac}}
整理すると次が得られる。
\frac{|b|^2}{ac}
\le
\left( \frac{\mu_1 - \mu_2}{\mu_1 + \mu_2} \right)^2
= \left( \frac{1 - \mu_2 / \mu_1}{1 + \mu_2 / \mu_1} \right)^2
次に、任意の直交する正規化ベクトル \(x, y \in \mathbb{C}^n\) に対し、次の正定値な \(2 \times 2\) 行列を考える。
B = [x \; y]^* A [x \; y]
= \begin{bmatrix}
x^* A x & x^* A y \\
y^* A x & y^* A y
\end{bmatrix}
ポアンカレ分離定理の固有値交差不等式 (4.3.38) により、\(B\) の固有値 \(\mu_1 \le \mu_2\) は次を満たす: \(0 \lt \lambda_1 \le \mu_1 \le \mu_2 \le \lambda_n\)。したがって \(0 \lt \mu_2 / \mu_1 \le \lambda_n / \lambda_1\) である。 関数 \( f(t) = (1 - t)^2 / (1 + t)^2 \) が区間 \((1, \infty)\) 上で単調増加であることから、次の関係が成り立つ。
\frac{|x^* A y|^2}{(x^* A x)(y^* A y)}
\le
\left( \frac{1 - \mu_2 / \mu_1}{1 + \mu_2 / \mu_1} \right)^2
\le
\left( \frac{1 - \lambda_n / \lambda_1}{1 + \lambda_n / \lambda_1} \right)^2
=
\left( \frac{\lambda_1 - \lambda_n}{\lambda_1 + \lambda_n} \right)^2
これがヴィーラントの不等式 (7.4.12.2) である。
演習1.
\( x \in \mathbb{C}^n \) が \( A \) の固有ベクトルである場合、式 (7.4.12.1) および (7.4.12.2) がともに成り立つことを説明せよ。 ヒント:算術–幾何平均の不等式を用いる。
演習2.
\( x \in \mathbb{C}^n \) が \( A \) の固有ベクトルでない場合、次が成り立つことを説明せよ。
A^{-1}x - (x^*A^{-1}x)x \ne 0, \quad x - (x^*A^{-1}x)Ax \ne 0
演習3.
\( x \in \mathbb{C}^n \) が単位ベクトルであるとき、次が成り立つことを説明せよ。
(x^*Ax)(x^*A^{-1}x) \ge 1
等号が成立するのは \( x \) が \( A \) の固有ベクトルのときに限られる。 ヒント:次の計算を用いる。
1 = (x^*x)^2 = (x^*A^{1/2}A^{-1/2}x)^2 \le \|A^{1/2}x\|_2^2 \|A^{-1/2}x\|_2^2 = (x^*Ax)(x^*A^{-1}x)
等号が成り立つのは \( A^{1/2}x = \alpha A^{-1/2}x \) のときであり、この場合 \( x \) は \( A \) の固有ベクトルである。
カントロビッチの不等式 をワイラントの不等式から導くには、固有ベクトルでない単位ベクトル \( x \in \mathbb{C}^n \) を取り、
y = A^{-1}x - (x^*A^{-1}x)x
と定義する。このとき \( y \ne 0 \) であり、次の関係が成り立つ。
x^*y = 0, \quad Ay = x - (x^*A^{-1}x)Ax \ne 0,
x^*Ay = 1 - (x^*Ax)(x^*A^{-1}x) \lt 0, \quad y^*Ay = - (x^*A^{-1}x)(x^*Ay)
このとき、ワイラントの不等式は次の形で与えられる。
(x^*Ay)^2 \le -\left(\frac{\lambda_1 - \lambda_n}{\lambda_1 + \lambda_n}\right)^2 (x^*Ax)(x^*A^{-1}x)(x^*Ay)
したがって次が得られる。
(x^*Ax)(x^*A^{-1}x) - 1 = -x^*Ay \le \left(\frac{\lambda_1 - \lambda_n}{\lambda_1 + \lambda_n}\right)^2 (x^*Ax)(x^*A^{-1}x)
これより次式が導かれる。
(x^*Ax)(x^*A^{-1}x) \le \frac{(\lambda_1 + \lambda_n)^2}{4\lambda_1\lambda_n}
これがカントロビッチの不等式である。
演習4.
\( u, v \in \mathbb{C}^n \) を直交正規ベクトルとし、\( Au = \lambda_1u, \, Av = \lambda_nv \) とする。 さらに、
x = \frac{u + v}{\sqrt{2}}, \quad y = \frac{u - v}{\sqrt{2}}
と定義せよ。このとき、(7.4.12.2) はこの直交正規ベクトル \( x, y \) に対して等号が成立し、(7.4.12.1) はこの単位ベクトル \( x \) に対して等号が成立することを示せ。
次に、\( B \in M_n \) が正則で特異値 \( \sigma_1 \ge \cdots \ge \sigma_n \gt 0 \) をもつとする。 このとき、ワイラントの不等式 (7.4.12.2) に \( A = B^*B \) を代入すると、次の不等式が得られる。
| \langle Bx, By \rangle | \le \left( \frac{\sigma_1^2 - \sigma_n^2}{\sigma_1^2 + \sigma_n^2} \right) \|Bx\| \, \|By\| = \left( \frac{\kappa^2 - 1}{\kappa^2 + 1} \right) \|Bx\| \, \|By\|
ここで \( x, y \in \mathbb{C}^n \) は直交ベクトルであり、\( \kappa = \sigma_1 / \sigma_n \) は \( B \) のスペクトル条件数である。 さらに、角度 \( \theta_\kappa \in (0, \pi/2] \) を次の関係で定義する。
\cos \theta_\kappa = \frac{\kappa^2 - 1}{\kappa^2 + 1}
演習5.
次を示せ。
\sin \theta_\kappa = \frac{2\kappa}{\kappa^2 + 1}, \quad \cot\left(\frac{\theta_\kappa}{2}\right) = \kappa, \quad \theta_\kappa \in (0, \pi/2]
\( B, x, y \) が実ベクトルの場合、(7.4.12.6) は次のように書ける。
\cos \theta_{Bx,By} = \frac{|\langle Bx, By \rangle|}{\|Bx\| \, \|By\|} \le \cos \theta_\kappa ここで \( \theta_{Bx,By} \in (0, \pi/2] \) は実ベクトル \( Bx \) と \( By \) のなす角である。 この式は、幾何学的に \( 0 \le \theta_\kappa \le \theta_{Bx,By} \) という関係を示している。
さらに、(7.4.12.2)(したがって (7.4.12.7) も)で等号が成り立つ非零直交ベクトルが存在するため、 \( \theta_\kappa \)(\( B \) のスペクトル条件数のみにより定まる)は、\( x, y \) が実直交正規ペアを動くときの \( Bx \) と \( By \) のなす角の最小値である。
また、\( \kappa \) が大きいとき、
\frac{\kappa^2 - 1}{\kappa^2 + 1} = \frac{1 - \kappa^{-2}}{1 + \kappa^{-2}} \approx 1
であり、したがって \( \theta_\kappa = \cos^{-1}\left(\frac{1 - \kappa^{-2}}{1 + \kappa^{-2}}\right) \) は 0 に近くなる。 逆に \( \kappa \) が小さい場合には角度が大きくなる。 よって、\( \kappa \) が大きいほど、直交正規ベクトル \( x, y \) に対して \( Bx \) と \( By \) はほぼ平行である。
演習6.
\( B \in M_n \) を正則行列、\( \kappa \) をそのスペクトル条件数とし、 カントロビッチの不等式に \( A = B^*B \) を代入せよ。 次を導け。
\|Bx\|^2 \, \|B^{-*}x\|^2 \le \left(\frac{2\kappa}{\kappa^2 + 1}\right) \|x\|_2^4
\sin \theta_\kappa \, \|Bx\|^2 \, \|B^{-*}x\|^2 \le \|x\|_2^4
これは任意の \( x \in \mathbb{C}^n \) に対して成り立つ。
行列解析の総本山



コメント