4.3.48
定理 4.3.48.
\( n \ge 1 \) とし、\( x = [x_i] \in \mathbb{R}^n \)、\( y = [y_i] \in \mathbb{R}^n \) が与えられ、\( x \) が \( y \) をメジャライズするとする。さらに \(\Lambda = \mathrm{diag}(x) \in M_n(\mathbb{R})\) とする。
このとき、実直交行列 \( Q \) が存在して、\(\mathrm{diag}(Q^T \Lambda Q) = y\) が成り立つ。つまり、固有値が \( x_1, \ldots, x_n \) であり、対角成分が \( y_1, \ldots, y_n \) である実対称行列が存在する。
証明.
一般性を失わずに、ベクトル \( x \) と \( y \) の要素が非増加順に並んでいると仮定する:\( x_1 \ge x_2 \ge \cdots \) および \( y_1 \ge y_2 \ge \cdots \)。
\(n = 1\) の場合は自明である:\( x_1 = y_1 \)、\( Q = [1] \)、\( A = [x_1] \)。
したがって、\(n ≥ 2\) とする。
不等式 (4.3.44a,b) により、\( x_1 \ge y_1 \ge y_n \ge x_n \) が成り立つ。もし \( x_1 = x_n \) ならば、全ての要素は等しく、\( Q = I \) および \( A = x_1 I \) となる。したがって \( x_1 > x_n \) と仮定する。
\(n = 2\) の場合、\( x_1 > x_2 \) かつ \( x_1 \ge y_1 \ge y_2 = (x_1 - y_1) + x_2 \ge x_2 \) である。
次の実行列を考える:
P = \frac{1}{\sqrt{x_1 - x_2}} \begin{pmatrix} \sqrt{x_1 - y_2} & -\sqrt{y_2 - x_2} \\ \sqrt{y_2 - x_2} & \sqrt{x_1 - y_2} \end{pmatrix}
計算により \( P P^T = I \) となるので、P は実直交である。また、\( P^T \Lambda P \) の対角成分は \([y_1, y_2]^T\) となる。
帰納法で証明を進める。
\(n ≥ 3\) とし、ベクトル \(x, y\) のサイズが \(n − 1\) 以下の場合に定理が成り立つと仮定する。
k を \( x_k \ge y_1 \) となる最大の整数とする。\(x_1 ≥ y_1\) なので \(k ≥ 1\) が成り立ち、\(k ≤ n − 1\) と仮定する。すると \(x_k ≥ y_1 > x_{k+1} ≥ x_n\) となる。
\(η\) を \( η = x_k + x_{k+1} - y_1 \) とおくと、\(η ≥ x_{k+1}\) であり、ベクトル \([x_k, x_{k+1}]^T\) は \([y_1, η]^T\) をメジャライズする。
\(n = 2\) の場合の構成により、実直交行列 \(P_1\) が存在して、\(\mathrm{diag}(P_1^T D_1 P_1) = [y_1, η]^T\) が成り立つ。次に \(D_2\) を残りの対角成分の行列として定義する。帰納法の仮定により、実直交行列 \(P_2\) が存在して、\(\mathrm{diag}(P_2^T ([η] \oplus D_2) P_2) = [y_2, \ldots, y_n]^T\) となる。
したがって、実直交行列 \(Q = diag(P_1, I_{n-2}) diag(I_1, P_2)\) を構成することで、\(\mathrm{diag}(Q^T \Lambda Q) = y\) が得られる。
前定理により、メジャライズの幾何学的な特徴付けが可能である。行列 \( A = [a_{ij}] \in M_n \) が二重確率行列(doubly stochastic)であるとは、全ての要素が非負で、各行および各列の和が \(+1\) であることをいう。
定理 8.7.2 (Birkhoff の定理) \(n × n\) 行列は二重確率行列であることと、最大で \(n!\) 個の置換行列の凸結合として表せることは同値である。
演習. \(S, P_1, P_2 ∈ M_n\) とし、\(S\) は二重確率行列、\(P_1, P_2\) は置換行列であるとする。なぜ \(P_1 S P_2\) が二重確率行列となるのか説明せよ。
演習. \(A ∈ M_n\) とし、\(e ∈ \mathbb{R}^n\) を全ての要素が \(+1\) のベクトルとする。なぜ各行および各列の和が \(+1\) であることと \(Ae = A^T e = e\) が成り立つことは同値であるのか説明せよ。
行列解析の総本山

コメント