7.4.問題集
この節では、半正定値行列および正定値行列に関するいくつかの不等式、特にカントロヴィッチ不等式とその拡張版であるグリューブ=ラインボルト不等式について扱う。以下では、それぞれの導出や幾何学的解釈を確認する。
7.4.P1
スカラー・カントロヴィッチ不等式の導出
\( 0 \lt \lambda_1 \le \cdots \le \lambda_n \)、かつ \(\alpha_1, \ldots, \alpha_n \) が非負で \(\alpha_1 + \cdots + \alpha_n = 1\) であると仮定する。ここで、 \( A = (\lambda_1 + \lambda_n)/2 \)、および \( G = \sqrt{\lambda_1 \lambda_n} \) とする(これはそれぞれ \(\lambda_1\) と \(\lambda_n\) の算術平均および幾何平均である)。
このとき、次のスカラー・カントロヴィッチ不等式を、式 (7.4.12.1) から導け。
\left( \sum_{i=1}^{n} \alpha_i \lambda_i \right)
\left( \sum_{i=1}^{n} \alpha_i \lambda_i^{-1} \right)
\le \frac{A^2}{G^2}
(x^* A x)(x^* A^{-1} x) \le \frac{(\lambda_1 + \lambda_n)^2}{4 \lambda_1 \lambda_n} \, \|x\|_4^2
\quad \text{for all } x \in \mathbb{C}^n
7.4.P2
行列要素に対する改良された評価
\( A = [a_{ij}] \in M_n \) が正定値行列であり、固有値が \( 0 \lt \lambda_1 \le \cdots \le \lambda_n \) であるとする。すべての \( i \ne j \) に対して、(7.1.P1) より \( |a_{ij}|^2 \lt a_{ii} a_{jj} \) が成り立つことが知られている。式 (7.4.12.2) を用いて、次のより強い評価式を証明せよ。
|a_{ij}|^2 \le
\left( \frac{\lambda_n - \lambda_1}{\lambda_n + \lambda_1} \right)^2
a_{ii} a_{jj}, \quad \forall i \ne j
|x^* A y|^2 \le
\left( \frac{\lambda_1 - \lambda_n}{\lambda_1 + \lambda_n} \right)^2
(x^* A x)(y^* A y) \\
\quad \text{for all orthogonal } x, y \in \mathbb{C}^n
7.4.P3
グリューブ=ラインボルト不等式
次に、2つの行列に対する (7.4.12.1) の一般化を示す。\( B, C \in M_n \) が可換な正定値行列であり、それぞれの固有値が \( 0 \lt \lambda_1 \le \cdots \le \lambda_n \)、および \( 0 \lt \mu_1 \le \cdots \le \mu_n \) であるとする。このとき、グリューブ=ラインボルト不等式は次を主張する。
(x^* B^2 x)(x^* C^2 x)
\le
\frac{(\lambda_1 \mu_1 + \lambda_n \mu_n)^2}{4 \lambda_1 \lambda_n \mu_1 \mu_n}
(x^* B C x)^2, \quad \forall x \in \mathbb{C}^n
同値な形として、次の式も成り立つ。
\frac{ \langle Bx, Cx \rangle }{ \|Bx\| \, \|Cx\| }
\ge
\frac{ 2 \sqrt{ \lambda_1 \lambda_n \mu_1 \mu_n } }{ \lambda_1 \mu_1 + \lambda_n \mu_n },
\quad \forall x \ne 0, \, x \in \mathbb{C}^n
ただし、カントロヴィッチ不等式とは異なり、\( B \) も \( C \) もスカラー行列でない場合、この不等式が等号となる単位ベクトル \( x \) は必ずしも存在しない。
- (a) 式 (7.4.12.11) を証明せよ。
- (b) \( B \) または \( C \) のいずれか一方がスカラー行列である場合、(7.4.12.12) において等号が成立することを示せ。
- (c) 可換な正定値行列 \( B \) および \( C \) のどのような選択で (7.4.12.11) が (7.4.12.1) に帰着するかを示せ。
- (d) \( B, C, x \) が実数の場合、(7.4.12.12) を幾何学的に解釈せよ。すなわち、ベクトル \( Bx \) と \( Cx \) のなす小さい角度の余弦の下限(または角度の上限)として解釈せよ。
7.4.P4
固有値条件数と角度の幾何学的解釈
\( A \in M_n \) が正定値行列で、固有値が \( 0 \lt \lambda_1 \le \cdots \le \lambda_n \) であるとする。また、\( A u_1 = \lambda_1 u_1 \)、\( A u_n = \lambda_n u_n \) を満たす直交正規ベクトル \( u_1, u_n \in \mathbb{C}^n \) をとる。 さらに、\( \kappa = \lambda_n / \lambda_1 \) を \( A \) のスペクトル条件数とする。
式 (7.4.12.12) から次の不等式を導け。
\frac{ \langle x, A x \rangle }{ \|x\| \, \|A x\| }
\ge
\frac{ 2 \sqrt{ \lambda_1 \lambda_n } }{ \lambda_1 + \lambda_n }
=
\frac{ 2 \sqrt{\kappa} }{ \kappa + 1 },
\quad \forall x \ne 0, \, x \in \mathbb{C}^n
等号は、ベクトル \( x_0 = \sqrt{\lambda_n} u_1 + \sqrt{\lambda_1} u_n \) に対して成立する。
\( A \) および \( x \) が実数の場合、この不等式は次のように幾何学的に解釈できる。
\cos \theta_{x, A x}
\ge
\frac{ 2 \sqrt{\kappa} }{ \kappa + 1 },
\quad \forall \|x\| = 1, \, x \in \mathbb{R}^n
したがって、任意の単位ベクトル \( x \) に対して \( 0 \le \theta_{x, A x} \le \cos^{-1}\left( \frac{2 \sqrt{\kappa}}{\kappa + 1} \right) \) が成り立ち、下限の等号は \( A \) の固有ベクトルで、上限の等号は \( x_0 \) に対して達成される。
7.4.P5
\( A \in M_n \) が正則行列であり、そのスペクトル条件数を \( \kappa \) とする。極分解およびカントロヴィッチ不等式を用いて、次を示せ:
|(x^* A x)(x^* A^{-1} x)| \le \frac{1}{4}(\kappa^{1/2} + \kappa^{-1/2})^2 \|x\|^4, \quad \text{for any } x \in \mathbb{C}^n
等号はある単位ベクトル \( x \) に対して成立する。
7.4.P6
\( A \) を正定値行列とし、そのスペクトル条件数を \( \kappa \) とする。このとき、カントロヴィッチ不等式およびワイラント不等式はそれぞれ次の形で表される:
(x^* A x)(x^* A^{-1} x) \le \frac{1}{4}(\kappa^{1/2} + \kappa^{-1/2})^2 \|x\|^4, \quad \text{for any } x \in \mathbb{C}^n
|x^* A y|^2 \le \left( \frac{\kappa - 1}{\kappa + 1} \right)^2 (x^* A x)(y^* A y), \quad \text{for all orthogonal } x, y \in \mathbb{C}^n
7.4.P7
\( A \in M_n \) が正則でエルミート行列であり、スペクトル条件数を \( \kappa \) とする。このとき次が成り立つことを示せ:
\max_{\|x\|=1} (\|A x\|_2 \, \|A^{-1} x\|_2) = \frac{1}{2}(\kappa + \kappa^{-1})
また、この最大値を達成するベクトル \( x \) を具体的に示せ。
7.4.P8
\( A \in M_n \) を正定値行列とし、その固有値が区間 \([m, M]\) に含まれると仮定する(ただし \( 0 \lt m \lt M \lt \infty \))。このとき次が成り立つことを示せ:
(x^* A x)(x^* A^{-1} x) \le \frac{(m + M)^2}{4 m M} \|x\|^4, \quad \text{for all } x \in \mathbb{C}^n
7.4.P9
\(\alpha_1, \ldots, \alpha_n, \beta_1, \ldots, \beta_n\) を正の実数とする(順序は問わない)。次の不等式が知られている:
\sum_{i=1}^n \alpha_i \beta_i \le \sum_{i=1}^n \alpha_i^{\downarrow} \beta_i^{\downarrow}
カントロヴィッチ不等式を用いると、この関係の逆向きの不等式を次のように得る:
\sum_{i=1}^n \alpha_i^{\downarrow} \beta_i^{\downarrow} \le \frac{m + M}{2 \sqrt{m M}} \sum_{i=1}^n \alpha_i \beta_i,
ただし、すべての \( i = 1, \ldots, n \) に対して \( 0 \lt m \le \alpha_i / \beta_i \le M \lt \infty \) である。
(a) \( A = \mathrm{diag}(\alpha_1/\beta_1, \ldots, \alpha_n/\beta_n) \) および \( x = [\alpha_i \beta_i]_1^n \) とおく。\( (x^T A x)(x^T A^{-1} x) \) を計算し、(7.4.12.1) を用いてその上界を与えよ。
(b) \((\sum_i \alpha_i^{\downarrow} \beta_i^{\downarrow})^2 \le (\sum_i \alpha_i^2)(\sum_i \beta_i^2)\) が下界を与える。
7.4.P10
\( x, y \in \mathbb{C}^n \) を零でないベクトルとし、\( A, B \in M_n \) を正定値行列とする。
(a) 次を示せ:
|x^* y|^2 \le (x^* A x)(y^* A^{-1} y),
等号は \( x = A^{-1} y \) のときに成立する。
(b) 関数 \( f(A, y) = (y^* A^{-1} y)^{-1} \) は次の変分表現をもつことを示せ:
f(A, y) = \min_{x^* y \ne 0} \frac{x^* A x}{|x^* y|^2}
(c) この表現から \( f(A + B, y) \ge f(A, y) + f(B, y) \) を導け。
(d) \( y = e_i \)(第 \( i \) 成分が1で他が0の標準基底ベクトル)とすると、次が成り立つ:
\gamma_{ii}^{-1} \ge \alpha_{ii}^{-1} + \beta_{ii}^{-1},
ここで、\((A + B)^{-1} = [\gamma_{ij}], \, A^{-1} = [\alpha_{ij}], \, B^{-1} = [\beta_{ij}]\) である。これはバーグストロームの不等式と呼ばれる。
(e) バーグストローム不等式は次の形でも表すことができる:
\frac{\det(A + B)}{\det(A + B)[\{i\}^c]} \ge \frac{\det A}{\det A[\{i\}^c]} + \frac{\det B}{\det B[\{i\}^c]}
\\ i = 1, \ldots, n
ここで、分母の行列式はそれぞれ主対角成分に対応する余因子を表す。
7.4.P11
Berenstein–Veinstein不等式とBergström不等式の同値性
\( A \in M_n \) が正定値行列であり、\( x, y \in \mathbb{C}^n \)、\( \alpha, \beta \) が実数で正の値であるとする。次のように定義する:
A_\alpha =
\begin{bmatrix}
A & x \\
x^* & \alpha
\end{bmatrix}, \quad
B_\beta =
\begin{bmatrix}
B & y \\
y^* & \beta
\end{bmatrix}
(a) 次を示せ:
\frac{\det A_\alpha}{\det A} = \alpha - x^* A^{-1} x \\
\quad \\
\frac{\det B_\beta}{\det B} = \beta - y^* B^{-1} y
\frac{\det(A_\alpha + B_\beta)}{\det(A + B)}
= \alpha + \beta - (x + y)^* (A + B)^{-1} (x + y).
(b) 次の関係を示せ:
\frac{\det(A_\alpha + B_\beta)}{\det(A + B)}
- \frac{\det A_\alpha}{\det A}
- \frac{\det B_\beta}{\det B} \\
= x^* A^{-1} x + y^* B^{-1} y - (x + y)^* (A + B)^{-1} (x + y).
(c) \( \alpha, \beta \) を十分に大きな正の実数とすると、\( A_\alpha \) および \( B_\beta \) は正定値である。このとき、式 (7.4.12.20) を用いることで、(7.4.12.19) が次のBerenstein–Veinstein不等式を意味することを示せ:
x^* A^{-1} x + y^* B^{-1} y
\ge (x + y)^* (A + B)^{-1} (x + y)
(d) 式 (7.4.12.20) を用いて、(7.4.12.21) が (7.4.12.19) を導くことを示せ。これにより、Bergström不等式とBerenstein–Veinstein不等式が同値であることがわかる。
7.4.P12
ランク1行列におけるユニタリ不変ノルムの比
\( N_1(\cdot) \)、\( N_2(\cdot) \) を \( M_{m,n} \) 上のユニタリ不変ノルムとする。このとき、次の関数を考える:
f(A) = \frac{N_1(A)}{N_2(A)}.
\( A \) がランク1の行列であるとき、この関数 \( f(A) \) は定数であることを示せ。その定数の値を求めよ。
7.4.P13
エルミート行列への距離と自己共役ノルム
任意の複素数 \( z \) と実数 \( x \) に対して、次の不等式が成り立つ:
|z - \operatorname{Re} z| \le |z - x|.
これを行列 \( A \in M_n \) に一般化した形として、次の不等式が考えられる:
\| A - \tfrac{1}{2}(A + A^*) \|
\le \| A - H \|
ここで、\( H \in M_n \) は任意のエルミート行列である。この不等式が、すべてのユニタリ不変ノルムおよびより一般に自己共役ノルムに対して成り立つことを示せ。
したがって、任意の \( A \in M_n \) に対し、ユニタリ不変ノルムに関して \( A \) からエルミート行列全体の閉集合までの距離は次の値で与えられる:
\tfrac{1}{2} \| A - A^* \|,
これは \( A \) の反エルミート部分のノルムに等しい。
7.4.P14
エルミート・対称・実部のノルム不等式
任意の複素数 \( z \) に対して、\( |\operatorname{Re} z| \le |z| \) が成り立つ。ユニタリ不変ノルム \( \| \cdot \| \) と \( A \in M_n \) に対して、次を示せ:
(a) エルミート部分に対して: \( \| (A + A^*)/2 \| \le \| A \| \)
(b) 対称部分に対して: \( \| (A + A^T)/2 \| \le \| A \| \)
(c) 実部に対して: \( \| (A + \overline{A})/2 \| \le \| A \| \)
7.4.P15
極分解に基づくユニタリ行列との距離
\( A \in M_n \) とし、\( \| \cdot \| \) をユニタリ不変ノルムとする。式 (7.4.9.1) を用いて次を示せ:
\| A - U \| \ge \| \sigma(A) - I \|
ここで、\( U \) は任意のユニタリ行列である。等号が成り立つのは、\( U \) が \( A \) の極分解におけるユニタリ因子であるときである。
したがって、\( \| \sigma(A) - I \| \) は、ユニタリ不変ノルムに関して \( A \) からユニタリ行列全体の集合までの距離を表す。
7.4.P16
特異値分解に基づく距離の評価
\( A \in M_n \) が特異値分解 \( A = V \sigma(A) W^* \) を持つとする。ユニタリ不変ノルム \( \| \cdot \| \) に対して、任意のユニタリ行列 \( U \in M_n \) について次が成り立つ:
\| \sigma(A) - I \| \le \| A - U \| \le \| \sigma(A) + I \|
7.4.P17
正則な行列 \(A \in M_n\) とその特異値分解 \(A = V \sigma(A) W^*\) を考える。ここで \(\sigma(A) = \mathrm{diag}(\sigma_1(A), \dots, \sigma_n(A))\) である。(7.4.2) で示したように、\(\sigma_{n-1}(A) = \sigma_n(A)\) の場合、フロベニウスノルムにおける \(A\) の最良特異値近似は少なくとも二つ存在する。
次に、\(B \in M_n\) が特異行列であり、\(\|A - B\|_2 = \sigma_n(A)\)、かつ \(\sigma_{n-1}(A) > \sigma_n(A)\) のとき、\(B\) は (7.4.2) で構成した行列 \(B_0\) であることを示すための証明の概要を詳述する。条件 \(\sigma_{n-1}(A) > \sigma_n(A)\) は (d) および (e) でのみ使用される。
(a) \(\Sigma_0 = \mathrm{diag}(\sigma_1(A), \dots, \sigma_{n-1}(A), 0)\) とする。(7.4.2) の議論を復習し、\(B\) の特異値が \(\Sigma_0\) と同じであること、すなわち \(\sigma(B) = \Sigma_0\) である理由を説明せよ。
(b) \(AB^*\) および \(B^*A\) が半正定値であり、かつ \(\mathrm{tr}(AB^*) = \sum_{i=1}^{n-1} \sigma_i^2(A)\) である理由を説明せよ。
(c) 単位行列 \(X, Y \in M_n\) が存在して、\(A = X \sigma(A) Y^*\)、\(B = X \tilde{\Sigma} Y^*\)、\(\tilde{\Sigma} = \mathrm{diag}(\lambda_1, \dots, \lambda_n) = P \Sigma_0 P^T\) となることを示せ。ここで \(P\) は順列行列である。
(d) \(\tilde{\Sigma} = \Sigma_0\) であることを示せ。
(e) 単位行列 \(Z = U \oplus [e^{i\theta}] \in M_n\) が存在して、\(X = V Z\)、\(Y = W Z\)、かつ \(Z \sigma(A) = \sigma(A) Z\) となることを示せ。
(f) \(Z \Sigma_0 = \Sigma_0 Z\) であることを説明し、結論として \(B = B_0\) となることを示せ。
7.4.P18
ユニタリ不変ノルムに関する不等式
\(\|\cdot\|\) を \(M_{n,m}\) 上のユニタリ不変ノルムとする。
任意の \(A \in M_{n,m}\) に対して次の不等式が成り立つ:
\| A \| \le \| \; |A|\; \|
ここで、\(|A|\) は行列 \(A\) の絶対値(すなわち \((A^* A)^{1/2}\))を表す。
参考文献と追加読み物
Kantorovich型不等式の一般化および参考文献については、A. Clausing, "Kantorovich-type inequalities", Amer. Math. Monthly 89 (1982) 314–320 を参照のこと。また、すべてのユニタリ不変ノルムに対して成り立つ不等式については、L. Mirsky, "Symmetric gauge functions and unitarily invariant norms", Quart. J. Math. Oxford 11 (1960) 50–59、および K. Fan and A. J. Hoffman, "Some metric inequalities in the space of matrices", Proc. Amer. Math. Soc. 6 (1955) 111–116 を参照せよ。
統計学における応用例やさらに多くの参考文献については、C. R. Rao, "Matrix approximations and reduction of dimensionality in multivariate statistical analysis", Multivariate Analysis–V, Proceedings of the Fifth International Symposium on Multivariate Analysis, P. R. Krishnaiah, North-Holland, Amsterdam, 1980, pp. 1–22 を参照せよ。
行列解析の総本山



コメント