[行列解析7.4.12]カントロビッチとヴィーラントの不等式

7.4.12 カントロビッチとヴィーラントの不等式

行列 \( A \in M_n \) がエルミートかつ正定値であるとする。ここで、\(\lambda_1\) および \(\lambda_n\) をそれぞれ \(A\) の最小および最大の固有値とする。本節の目的は、次の2つの古典的不等式が等価かつ成立することを示し、さらにそれらの解析的および幾何的な意味を考察することである。

まず、カントロビッチの不等式は次のように与えられる。

(7.4.12.1)
(x^* A x)(x^* A^{-1} x) \le \frac{(\lambda_1 + \lambda_n)^2}{4 \lambda_1 \lambda_n} \, \|x\|_4^2
\quad \text{for all } x \in \mathbb{C}^n

一方、ヴィーラントの不等式は次のように与えられる。

(7.4.12.2)
|x^* A y|^2 \le 
\left( \frac{\lambda_1 - \lambda_n}{\lambda_1 + \lambda_n} \right)^2
(x^* A x)(y^* A y) \\
\quad \text{for all orthogonal } x, y \in \mathbb{C}^n

式 (7.4.12.1) は \(x = 0\) の場合に成り立ち、式 (7.4.12.2) は \(x = 0\) または \(y = 0\) の場合に成り立つ。したがって、以降の議論では \(x \ne 0\)、\(y \ne 0\) の場合のみを考える。

カントロビッチの不等式を導くために、まず次の3つの行列を考える: \(\lambda_n I - A\)、\(A - \lambda_1 I\)、および \(A^{-1}\)。これらはいずれもエルミートであり、最初の2つは半正定値、最後の1つは正定値である。これら3つの行列は可換なので、その積もまたエルミートかつ半正定値である。したがって、任意の非零ベクトル \(x\) に対して次が成り立つ。

0 \le x^* (\lambda_n I - A)(A - \lambda_1 I)A^{-1} x
= x^* \left( (\lambda_1 + \lambda_n)I - \lambda_1 \lambda_n A^{-1} - A \right) x

したがって、次の不等式が得られる。

(7.4.12.3)
x^* A x + \lambda_1 \lambda_n (x^* A^{-1} x) \le (\lambda_1 + \lambda_n)(x^* x)

ここで \(t_0 = \lambda_1 \lambda_n (x^* A^{-1} x)\) とおくと、上式は次のように書き換えられる。

(7.4.12.4)
t_0 (x^* A x) \le t_0 (\lambda_1 + \lambda_n)(x^* x) - t_0^2

関数 \( f(t) = t(\lambda_1 + \lambda_n)(x^*x) - t^2 \) は凹関数であり、その臨界点は \(t = (x^*x)(\lambda_1 + \lambda_n)/2\) にあり、そこで最大値を取る。したがって、 \( f(t_0) \le (x^*x)^2 (\lambda_1 + \lambda_n)^2 / 4 \) であり、式 (7.4.12.4) から次を得る。

\lambda_1 \lambda_n (x^* A^{-1} x)(x^* A x)
\le \frac{1}{4} (\lambda_1 + \lambda_n)^2 (x^*x)^2

これがカントロビッチの不等式 (7.4.12.1) である。

次に、カントロビッチの不等式がヴィーラントの不等式を含意することを示す。正定値な \(2 \times 2\) 行列

B = \begin{bmatrix} a & b \\ \bar{b} & c \end{bmatrix}

を考える。このとき、逆行列は \( B^{-1} = (\det B)^{-1} \operatorname{adj} B = \begin{bmatrix} c / \det B & * \\ * & * \end{bmatrix} \) である。固有値を \(\mu_1 \le \mu_2\) とする。ここで \(x = e_1\)、\(A = B\) とすると、不等式 (7.4.12.1) は次のように書ける。

\frac{(\mu_1 + \mu_2)^2}{4 \mu_1 \mu_2}
\ge (e_1^* B e_1)(e_1^* B^{-1} e_1)
= \frac{ac}{ac - |b|^2}
= \frac{1}{1 - \frac{|b|^2}{ac}}

整理すると次が得られる。

(7.4.12.5)
\frac{|b|^2}{ac}
\le
\left( \frac{\mu_1 - \mu_2}{\mu_1 + \mu_2} \right)^2
= \left( \frac{1 - \mu_2 / \mu_1}{1 + \mu_2 / \mu_1} \right)^2

次に、任意の直交する正規化ベクトル \(x, y \in \mathbb{C}^n\) に対し、次の正定値な \(2 \times 2\) 行列を考える。

B = [x \; y]^* A [x \; y]
= \begin{bmatrix}
x^* A x & x^* A y \\
y^* A x & y^* A y
\end{bmatrix}

ポアンカレ分離定理の固有値交差不等式 (4.3.38) により、\(B\) の固有値 \(\mu_1 \le \mu_2\) は次を満たす: \(0 \lt \lambda_1 \le \mu_1 \le \mu_2 \le \lambda_n\)。したがって \(0 \lt \mu_2 / \mu_1 \le \lambda_n / \lambda_1\) である。 関数 \( f(t) = (1 - t)^2 / (1 + t)^2 \) が区間 \((1, \infty)\) 上で単調増加であることから、次の関係が成り立つ。

\frac{|x^* A y|^2}{(x^* A x)(y^* A y)}
\le
\left( \frac{1 - \mu_2 / \mu_1}{1 + \mu_2 / \mu_1} \right)^2
\le
\left( \frac{1 - \lambda_n / \lambda_1}{1 + \lambda_n / \lambda_1} \right)^2
=
\left( \frac{\lambda_1 - \lambda_n}{\lambda_1 + \lambda_n} \right)^2

これがヴィーラントの不等式 (7.4.12.2) である。

演習1. 

\( x \in \mathbb{C}^n \) が \( A \) の固有ベクトルである場合、式 (7.4.12.1) および (7.4.12.2) がともに成り立つことを説明せよ。 ヒント:算術–幾何平均の不等式を用いる。

演習2. 

\( x \in \mathbb{C}^n \) が \( A \) の固有ベクトルでない場合、次が成り立つことを説明せよ。

A^{-1}x - (x^*A^{-1}x)x \ne 0, \quad x - (x^*A^{-1}x)Ax \ne 0

演習3. 

\( x \in \mathbb{C}^n \) が単位ベクトルであるとき、次が成り立つことを説明せよ。

(x^*Ax)(x^*A^{-1}x) \ge 1

等号が成立するのは \( x \) が \( A \) の固有ベクトルのときに限られる。 ヒント:次の計算を用いる。

1 = (x^*x)^2 = (x^*A^{1/2}A^{-1/2}x)^2 \le \|A^{1/2}x\|_2^2 \|A^{-1/2}x\|_2^2 = (x^*Ax)(x^*A^{-1}x)

等号が成り立つのは \( A^{1/2}x = \alpha A^{-1/2}x \) のときであり、この場合 \( x \) は \( A \) の固有ベクトルである。

カントロビッチの不等式 をワイラントの不等式から導くには、固有ベクトルでない単位ベクトル \( x \in \mathbb{C}^n \) を取り、

y = A^{-1}x - (x^*A^{-1}x)x

と定義する。このとき \( y \ne 0 \) であり、次の関係が成り立つ。

x^*y = 0, \quad Ay = x - (x^*A^{-1}x)Ax \ne 0,
x^*Ay = 1 - (x^*Ax)(x^*A^{-1}x) \lt 0, \quad y^*Ay = - (x^*A^{-1}x)(x^*Ay)

このとき、ワイラントの不等式は次の形で与えられる。

(x^*Ay)^2 \le -\left(\frac{\lambda_1 - \lambda_n}{\lambda_1 + \lambda_n}\right)^2 (x^*Ax)(x^*A^{-1}x)(x^*Ay)

したがって次が得られる。

(x^*Ax)(x^*A^{-1}x) - 1 = -x^*Ay \le \left(\frac{\lambda_1 - \lambda_n}{\lambda_1 + \lambda_n}\right)^2 (x^*Ax)(x^*A^{-1}x)

これより次式が導かれる。

(x^*Ax)(x^*A^{-1}x) \le \frac{(\lambda_1 + \lambda_n)^2}{4\lambda_1\lambda_n}

これがカントロビッチの不等式である。

演習4. 

\( u, v \in \mathbb{C}^n \) を直交正規ベクトルとし、\( Au = \lambda_1u, \, Av = \lambda_nv \) とする。 さらに、

x = \frac{u + v}{\sqrt{2}}, \quad y = \frac{u - v}{\sqrt{2}}

と定義せよ。このとき、(7.4.12.2) はこの直交正規ベクトル \( x, y \) に対して等号が成立し、(7.4.12.1) はこの単位ベクトル \( x \) に対して等号が成立することを示せ。

次に、\( B \in M_n \) が正則で特異値 \( \sigma_1 \ge \cdots \ge \sigma_n \gt 0 \) をもつとする。 このとき、ワイラントの不等式 (7.4.12.2) に \( A = B^*B \) を代入すると、次の不等式が得られる。

(7.4.12.6)
| \langle Bx, By \rangle | \le \left( \frac{\sigma_1^2 - \sigma_n^2}{\sigma_1^2 + \sigma_n^2} \right) \|Bx\| \, \|By\| = \left( \frac{\kappa^2 - 1}{\kappa^2 + 1} \right) \|Bx\| \, \|By\| 

ここで \( x, y \in \mathbb{C}^n \) は直交ベクトルであり、\( \kappa = \sigma_1 / \sigma_n \) は \( B \) のスペクトル条件数である。 さらに、角度 \( \theta_\kappa \in (0, \pi/2] \) を次の関係で定義する。

\cos \theta_\kappa = \frac{\kappa^2 - 1}{\kappa^2 + 1}

演習5. 

次を示せ。

\sin \theta_\kappa = \frac{2\kappa}{\kappa^2 + 1}, \quad \cot\left(\frac{\theta_\kappa}{2}\right) = \kappa, \quad \theta_\kappa \in (0, \pi/2]

\( B, x, y \) が実ベクトルの場合、(7.4.12.6) は次のように書ける。

(7.4.12.7)
\cos \theta_{Bx,By} = \frac{|\langle Bx, By \rangle|}{\|Bx\| \, \|By\|} \le \cos \theta_\kappa 

ここで \( \theta_{Bx,By} \in (0, \pi/2] \) は実ベクトル \( Bx \) と \( By \) のなす角である。 この式は、幾何学的に \( 0 \le \theta_\kappa \le \theta_{Bx,By} \) という関係を示している。

さらに、(7.4.12.2)(したがって (7.4.12.7) も)で等号が成り立つ非零直交ベクトルが存在するため、 \( \theta_\kappa \)(\( B \) のスペクトル条件数のみにより定まる)は、\( x, y \) が実直交正規ペアを動くときの \( Bx \) と \( By \) のなす角の最小値である。

また、\( \kappa \) が大きいとき、

\frac{\kappa^2 - 1}{\kappa^2 + 1} = \frac{1 - \kappa^{-2}}{1 + \kappa^{-2}} \approx 1

であり、したがって \( \theta_\kappa = \cos^{-1}\left(\frac{1 - \kappa^{-2}}{1 + \kappa^{-2}}\right) \) は 0 に近くなる。 逆に \( \kappa \) が小さい場合には角度が大きくなる。 よって、\( \kappa \) が大きいほど、直交正規ベクトル \( x, y \) に対して \( Bx \) と \( By \) はほぼ平行である。

演習6. 

\( B \in M_n \) を正則行列、\( \kappa \) をそのスペクトル条件数とし、 カントロビッチの不等式に \( A = B^*B \) を代入せよ。 次を導け。

(7.4.12.8)
\|Bx\|^2 \, \|B^{-*}x\|^2 \le \left(\frac{2\kappa}{\kappa^2 + 1}\right) \|x\|_2^4 
(7.4.12.9)
\sin \theta_\kappa \, \|Bx\|^2 \, \|B^{-*}x\|^2 \le \|x\|_2^4 

これは任意の \( x \in \mathbb{C}^n \) に対して成り立つ。


行列解析の総本山

[行列解析]総本山
行列解析の総本山。行列解析の内容を網羅的かつ体系的に整理しています。線形代数の学習を一通り終えた方が、次のステップとして取り組むのに最適です。行列に関する不等式を研究するには、行列解析の知識が欠かせません。

コメント

タイトルとURLをコピーしました