[行列解析7.4.12]カントロビッチとヴィーラントの不等式

7.4.12 カントロビッチとヴィーラントの不等式
行列解析の総本山
- 総本山の目次📚
- 記号の意味🔎

7.4.12 カントロビッチとヴィーラントの不等式

行列 \( A \in M_n \) がエルミートかつ正定値であるとする。ここで、\(\lambda_1\) および \(\lambda_n\) をそれぞれ \(A\) の最小および最大の固有値とする。本節の目的は、次の2つの古典的不等式が等価かつ成立することを示し、さらにそれらの解析的および幾何的な意味を考察することである。

まず、カントロビッチの不等式は次のように与えられる。

(7.4.12.1)

(x^* A x)(x^* A^{-1} x) \le \frac{(\lambda_1 + \lambda_n)^2}{4 \lambda_1 \lambda_n} \, \|x\|_4^2 \quad \text{for all } x \in \mathbb{C}^n

一方、ヴィーラントの不等式は次のように与えられる。

(7.4.12.2)

|x^* A y|^2 \le \left( \frac{\lambda_1 - \lambda_n}{\lambda_1 + \lambda_n} \right)^2 (x^* A x)(y^* A y) \\ \quad \text{for all orthogonal } x, y \in \mathbb{C}^n

式 (7.4.12.1) は \(x = 0\) の場合に成り立ち、式 (7.4.12.2) は \(x = 0\) または \(y = 0\) の場合に成り立つ。したがって、以降の議論では \(x \ne 0\)、\(y \ne 0\) の場合のみを考える。

カントロビッチの不等式を導くために、まず次の3つの行列を考える： \(\lambda_n I - A\)、\(A - \lambda_1 I\)、および \(A^{-1}\)。これらはいずれもエルミートであり、最初の2つは半正定値、最後の1つは正定値である。これら3つの行列は可換なので、その積もまたエルミートかつ半正定値である。したがって、任意の非零ベクトル \(x\) に対して次が成り立つ。

0 \le x^* (\lambda_n I - A)(A - \lambda_1 I)A^{-1} x = x^* \left( (\lambda_1 + \lambda_n)I - \lambda_1 \lambda_n A^{-1} - A \right) x

したがって、次の不等式が得られる。

(7.4.12.3)

x^* A x + \lambda_1 \lambda_n (x^* A^{-1} x) \le (\lambda_1 + \lambda_n)(x^* x)

ここで \(t_0 = \lambda_1 \lambda_n (x^* A^{-1} x)\) とおくと、上式は次のように書き換えられる。

(7.4.12.4)

t_0 (x^* A x) \le t_0 (\lambda_1 + \lambda_n)(x^* x) - t_0^2

関数 \( f(t) = t(\lambda_1 + \lambda_n)(x^*x) - t^2 \) は凹関数であり、その臨界点は \(t = (x^*x)(\lambda_1 + \lambda_n)/2\) にあり、そこで最大値を取る。したがって、 \( f(t_0) \le (x^*x)^2 (\lambda_1 + \lambda_n)^2 / 4 \) であり、式 (7.4.12.4) から次を得る。

\lambda_1 \lambda_n (x^* A^{-1} x)(x^* A x) \le \frac{1}{4} (\lambda_1 + \lambda_n)^2 (x^*x)^2

これがカントロビッチの不等式 (7.4.12.1) である。

次に、カントロビッチの不等式がヴィーラントの不等式を含意することを示す。正定値な \(2 \times 2\) 行列

B = \begin{bmatrix} a & b \\ \bar{b} & c \end{bmatrix}

を考える。このとき、逆行列は \( B^{-1} = (\det B)^{-1} \operatorname{adj} B = \begin{bmatrix} c / \det B & * \\ * & * \end{bmatrix} \) である。固有値を \(\mu_1 \le \mu_2\) とする。ここで \(x = e_1\)、\(A = B\) とすると、不等式 (7.4.12.1) は次のように書ける。

\frac{(\mu_1 + \mu_2)^2}{4 \mu_1 \mu_2} \ge (e_1^* B e_1)(e_1^* B^{-1} e_1) = \frac{ac}{ac - |b|^2} = \frac{1}{1 - \frac{|b|^2}{ac}}

整理すると次が得られる。

(7.4.12.5)

\frac{|b|^2}{ac} \le \left( \frac{\mu_1 - \mu_2}{\mu_1 + \mu_2} \right)^2 = \left( \frac{1 - \mu_2 / \mu_1}{1 + \mu_2 / \mu_1} \right)^2

次に、任意の直交する正規化ベクトル \(x, y \in \mathbb{C}^n\) に対し、次の正定値な \(2 \times 2\) 行列を考える。

B = [x \; y]^* A [x \; y] = \begin{bmatrix} x^* A x & x^* A y \\ y^* A x & y^* A y \end{bmatrix}

ポアンカレ分離定理の固有値交差不等式 (4.3.38) により、\(B\) の固有値 \(\mu_1 \le \mu_2\) は次を満たす： \(0 \lt \lambda_1 \le \mu_1 \le \mu_2 \le \lambda_n\)。したがって \(0 \lt \mu_2 / \mu_1 \le \lambda_n / \lambda_1\) である。関数 \( f(t) = (1 - t)^2 / (1 + t)^2 \) が区間 \((1, \infty)\) 上で単調増加であることから、次の関係が成り立つ。

\frac{|x^* A y|^2}{(x^* A x)(y^* A y)} \le \left( \frac{1 - \mu_2 / \mu_1}{1 + \mu_2 / \mu_1} \right)^2 \le \left( \frac{1 - \lambda_n / \lambda_1}{1 + \lambda_n / \lambda_1} \right)^2 = \left( \frac{\lambda_1 - \lambda_n}{\lambda_1 + \lambda_n} \right)^2

これがヴィーラントの不等式 (7.4.12.2) である。

演習1.　

\( x \in \mathbb{C}^n \) が \( A \) の固有ベクトルである場合、式 (7.4.12.1) および (7.4.12.2) がともに成り立つことを説明せよ。ヒント：算術–幾何平均の不等式を用いる。

演習2.　

\( x \in \mathbb{C}^n \) が \( A \) の固有ベクトルでない場合、次が成り立つことを説明せよ。

A^{-1}x - (x^*A^{-1}x)x \ne 0, \quad x - (x^*A^{-1}x)Ax \ne 0

演習3.　

\( x \in \mathbb{C}^n \) が単位ベクトルであるとき、次が成り立つことを説明せよ。

(x^*Ax)(x^*A^{-1}x) \ge 1

等号が成立するのは \( x \) が \( A \) の固有ベクトルのときに限られる。ヒント：次の計算を用いる。

1 = (x^*x)^2 = (x^*A^{1/2}A^{-1/2}x)^2 \le \|A^{1/2}x\|_2^2 \|A^{-1/2}x\|_2^2 = (x^*Ax)(x^*A^{-1}x)

等号が成り立つのは \( A^{1/2}x = \alpha A^{-1/2}x \) のときであり、この場合 \( x \) は \( A \) の固有ベクトルである。

カントロビッチの不等式をワイラントの不等式から導くには、固有ベクトルでない単位ベクトル \( x \in \mathbb{C}^n \) を取り、

y = A^{-1}x - (x^*A^{-1}x)x

と定義する。このとき \( y \ne 0 \) であり、次の関係が成り立つ。

x^*y = 0, \quad Ay = x - (x^*A^{-1}x)Ax \ne 0,

x^*Ay = 1 - (x^*Ax)(x^*A^{-1}x) \lt 0, \quad y^*Ay = - (x^*A^{-1}x)(x^*Ay)

このとき、ワイラントの不等式は次の形で与えられる。

(x^*Ay)^2 \le -\left(\frac{\lambda_1 - \lambda_n}{\lambda_1 + \lambda_n}\right)^2 (x^*Ax)(x^*A^{-1}x)(x^*Ay)

したがって次が得られる。

(x^*Ax)(x^*A^{-1}x) - 1 = -x^*Ay \le \left(\frac{\lambda_1 - \lambda_n}{\lambda_1 + \lambda_n}\right)^2 (x^*Ax)(x^*A^{-1}x)

これより次式が導かれる。

(x^*Ax)(x^*A^{-1}x) \le \frac{(\lambda_1 + \lambda_n)^2}{4\lambda_1\lambda_n}

これがカントロビッチの不等式である。

演習4.　

\( u, v \in \mathbb{C}^n \) を直交正規ベクトルとし、\( Au = \lambda_1u, \, Av = \lambda_nv \) とする。さらに、

x = \frac{u + v}{\sqrt{2}}, \quad y = \frac{u - v}{\sqrt{2}}

と定義せよ。このとき、(7.4.12.2) はこの直交正規ベクトル \( x, y \) に対して等号が成立し、(7.4.12.1) はこの単位ベクトル \( x \) に対して等号が成立することを示せ。

次に、\( B \in M_n \) が正則で特異値 \( \sigma_1 \ge \cdots \ge \sigma_n \gt 0 \) をもつとする。このとき、ワイラントの不等式 (7.4.12.2) に \( A = B^*B \) を代入すると、次の不等式が得られる。

(7.4.12.6)

| \langle Bx, By \rangle | \le \left( \frac{\sigma_1^2 - \sigma_n^2}{\sigma_1^2 + \sigma_n^2} \right) \|Bx\| \, \|By\| = \left( \frac{\kappa^2 - 1}{\kappa^2 + 1} \right) \|Bx\| \, \|By\|

ここで \( x, y \in \mathbb{C}^n \) は直交ベクトルであり、\( \kappa = \sigma_1 / \sigma_n \) は \( B \) のスペクトル条件数である。さらに、角度 \( \theta_\kappa \in (0, \pi/2] \) を次の関係で定義する。

\cos \theta_\kappa = \frac{\kappa^2 - 1}{\kappa^2 + 1}

演習5.　

次を示せ。

\sin \theta_\kappa = \frac{2\kappa}{\kappa^2 + 1}, \quad \cot\left(\frac{\theta_\kappa}{2}\right) = \kappa, \quad \theta_\kappa \in (0, \pi/2]

\( B, x, y \) が実ベクトルの場合、(7.4.12.6) は次のように書ける。

(7.4.12.7)

\cos \theta_{Bx,By} = \frac{|\langle Bx, By \rangle|}{\|Bx\| \, \|By\|} \le \cos \theta_\kappa

ここで \( \theta_{Bx,By} \in (0, \pi/2] \) は実ベクトル \( Bx \) と \( By \) のなす角である。この式は、幾何学的に \( 0 \le \theta_\kappa \le \theta_{Bx,By} \) という関係を示している。

さらに、(7.4.12.2)（したがって (7.4.12.7) も）で等号が成り立つ非零直交ベクトルが存在するため、 \( \theta_\kappa \)（\( B \) のスペクトル条件数のみにより定まる）は、\( x, y \) が実直交正規ペアを動くときの \( Bx \) と \( By \) のなす角の最小値である。

また、\( \kappa \) が大きいとき、

\frac{\kappa^2 - 1}{\kappa^2 + 1} = \frac{1 - \kappa^{-2}}{1 + \kappa^{-2}} \approx 1

であり、したがって \( \theta_\kappa = \cos^{-1}\left(\frac{1 - \kappa^{-2}}{1 + \kappa^{-2}}\right) \) は 0 に近くなる。逆に \( \kappa \) が小さい場合には角度が大きくなる。よって、\( \kappa \) が大きいほど、直交正規ベクトル \( x, y \) に対して \( Bx \) と \( By \) はほぼ平行である。