5.6.問題集
5.6.P1
\( M_n \) 上の \( l_1 \)-ノルムが誘導ノルムではない行列ノルムであることを説明せよ。
5.6.P2
単位行列 \(I\) および零行列 \(0\) 以外の 2×2 の射影行列の例を挙げよ。射影の固有値は 0 と 1 のみであることを示せ。射影行列 \(A\) が対角化可能であること、さらに \( A \neq 0 \) のとき任意の行列ノルムに対して \( \lVert \!|A|\! \rVert \geq 1 \) が成り立つことを説明せよ。
5.6.P3
\( M_n \) 上の行列ノルム \( \lVert \!|\cdot|\! \rVert \) に対して、任意の \( c \geq 1 \) に対して \( c \lVert \!|\cdot|\! \rVert \) が行列ノルムとなることを示せ。ただし、\( c \lt 1 \) のとき \( c \lVert \!|\cdot|\! \rVert_1 \) や \( c \lVert \cdot \rVert_2 \) は行列ノルムにならないことを示せ。
5.6.P4
(5.6.1) では同じノルムが2つの異なる方法で使われている。すなわち、\(x\) の大きさと \(Ax\) の大きさを測る場合である。より一般に、次のように定義することを考える。
\lVert \!|A|\! \rVert_{\alpha,\beta} = \max_{\lVert x \rVert_{\alpha} = 1} \lVert Ax \rVert_{\beta}
ここで \( \lVert \cdot \rVert_{\alpha}, \lVert \cdot \rVert_{\beta} \) は(異なる可能性のある)ベクトルノルムである。このとき \(\lVert \!|\cdot|\! \rVert_{\alpha,\beta}\) は行列ノルムになるだろうか。この考え方は \( m \times n \) 行列上のノルムを定義する際に使える可能性がある。なぜなら、\(\lVert \cdot \rVert_{\alpha}\) を \(\mathbb{C}^n\) 上のノルム、\(\lVert \cdot \rVert_{\beta}\) を \(\mathbb{C}^m\) 上のノルムと考えることができるからである。誘導行列ノルムと同様の性質を、この \(\lVert \!|\cdot|\! \rVert_{\alpha,\beta}\) は持つだろうか。
5.6.P5
\( \lVert \!|\cdot|\! \rVert_p \) を、\( \mathbb{C}^n \) 上の \( l_p \)-ノルム (\( p \geq 1 \)) によって誘導される行列ノルムとする。(5.4.21) および (5.6.21) を用いて次を示せ。
\max_{A \neq 0} \frac{\lVert \!|A|\! \rVert_{p_1}}{\lVert \!|A|\! \rVert_{p_2}} = n^{\frac{1}{\min\{p_1,p_2\}} - \frac{1}{\max\{p_1,p_2\}}}
さらに、すべての \( A \in M_n \)、すべての \( p \geq 1 \) に対して次が成り立つことを導け。
n^{\frac{1}{p}-1} \lVert \!|A|\! \rVert_1 \leq \lVert \!|A|\! \rVert_p \leq n^{1-\frac{1}{p}} \lVert \!|A|\! \rVert_1
n^{\frac{1}{p}-\frac{1}{2}} \lVert \!|A|\! \rVert_2 \leq \lVert \!|A|\! \rVert_p \leq n^{\frac{1}{2}-\frac{1}{p}} \lVert \!|A|\! \rVert_2
n^{-\frac{1}{p}} \lVert \!|A|\! \rVert_{\infty} \leq \lVert \!|A|\! \rVert_p \leq n^{\frac{1}{p}} \lVert \!|A|\! \rVert_{\infty}
5.6.P6
行列ノルムの公理 (1)–(3) が (5.6.7) の \(\lVert \!|\cdot|\! \rVert_S\) に対しても成り立つことを確認せよ。したがって、「行列ノルム」という仮定と結論を「行列上のノルム」に置き換えても (5.6.7) は依然として正しい。
5.6.P7
(5.6.33.1) の構成を一般化せよ。\( N_1(\cdot), \ldots, N_m(\cdot) \) を \( M_n \) 上の行列ノルムとし、\(\lVert \cdot \rVert\) を \(\mathbb{C}^m\) 上の絶対ノルムとする。ただしすべての \( x \in \mathbb{C}^m \) に対して \(\lVert x \rVert \geq \lVert x \rVert_\infty\) が成り立つと仮定する。そして
\lVert \!|A|\! \rVert = \lVert [N_1(A), \ldots, N_m(A)]^T \rVert
(a) 任意の標準基底ベクトル \( e_k \) に対して \(\lVert e_k \rVert \geq 1\) であることを示せ。
(b) \(\lVert \!|\cdot|\! \rVert\) が \( M_n \) 上の行列ノルムであることを示せ。
5.6.P8
\( M_n \) の非特異行列は \( M_n \) の中で稠密であることを示せ。すなわち、任意の \( M_n \) の行列は非特異行列列の極限であることを示せ。特異行列は \( M_n \) で稠密だろうか。
5.6.P9
任意の \( n \geq 1 \) に対して、\(\mathbb{C}^n\) 上のノルムの集合は凸集合であることを示せ。しかし、任意の \( n \geq 2 \) に対して、\( M_n \) 上の行列ノルムの集合は凸集合ではない。もし \( N_1(\cdot), N_2(\cdot) \) が \( M_n \) 上の行列ノルムならば、
N(\cdot) = \tfrac{1}{2} (N_1(\cdot) + N_2(\cdot))
が行列ノルムとなるのは、任意の \( A,B \in M_n \) に対して次が成り立つ場合に限る。
(N_1(A) - N_2(A))(N_1(B) - N_2(B)) \\ \leq 2(N_1(A)N_1(B) - N_1(AB)) \\ \quad \quad + 2(N_2(A)N_2(B) - N_2(AB))
ユニタリ不変な行列ノルムの集合が凸であることの証明については (7.4.10.2) を参照せよ。
5.6.P10
任意のノルム \( \lVert \cdot \rVert \) が \(\mathbb{C}^n\) 上に与えられているとする。任意の行列 \( A = [a_1 \dots a_n] \in M_n \) を列に沿って分割し、次を定義する。
N_{\lVert \cdot \rVert}(A) = \max_{1 \le i \le n} \lVert a_i \rVert
(a) \( N_{\lVert \cdot \rVert}(\cdot) \) が \( M_n \) 上のノルムであることを示せ。
(b) \( N_{\lVert \cdot \rVert}(\cdot) \) が行列ノルムであるのは、すべての \( x \in \mathbb{C}^n \) に対して \(\lVert x \rVert \ge \lVert x \rVert_1\) が成り立つ場合に限ることを示せ。
(c) 各 \( i = 1,\dots,n \) に対して、\( d_i(A) = \lVert a_i \rVert \) (ただし \( a_i \neq 0 \))、\( d_i(A) = 1 \) (\( a_i = 0 \) の場合)とし、
D_A = \mathrm{diag}(d_1(A), \dots, d_n(A))
と定義する。なぜ \( N_{\lVert \cdot \rVert}(AD_A^{-1}) \le 1 \) が成り立つか説明せよ。
(d) もし \( N_{\lVert \cdot \rVert}(\cdot) \) が行列ノルムなら、なぜ \(\rho(AD_A^{-1}) \le 1\)、\(|\det(AD_A^{-1})| \le 1\)、および \(|\det A| \le \det D_A = d_1(A) \cdots d_n(A)\) が成り立つか説明せよ。結論として、もし \( N_{\lVert \cdot \rVert}(\cdot) \) が行列ノルムであれば
|\det A| \le \lVert a_1 \rVert \cdots \lVert a_n \rVert
が成り立つ(注意:もし一部の \( a_i = 0 \) の場合はどうなるか)。
(e) \(\lVert \cdot \rVert = \lVert \cdot \rVert_1\) の場合、なぜ \( N_{\lVert \cdot \rVert_1}(A) = \lVert A \rVert_1 \) となるか説明し、次を導け。
|\det A| \le \lVert a_1 \rVert_1 \cdots \lVert a_n \rVert_1
(f) \(\lVert \cdot \rVert = n \lVert \cdot \rVert_\infty\) の場合、なぜ \( N_{n\lVert \cdot \rVert_\infty}(A) = n \lVert A \rVert_\infty \) となるか説明し、次を導け。
|\det A| \le n^n \lVert A \rVert_\infty^n
この境界を (2.3.P10) の場合と比較せよ。どちらが優れているか。
(g) \(\lVert \cdot \rVert = \lVert \cdot \rVert_2\) の場合、なぜ \( N_{\lVert \cdot \rVert_2}(A) \) は行列ノルムでないかを説明し、(d) の方法では次を導けないことを示せ。
|\det A| \le \lVert a_1 \rVert_2 \cdots \lVert a_n \rVert_2
それでもこの不等式(ハダマードの不等式)は正しい。理由は (2.1.P23) または (7.8.3) を参照せよ。
(h) なぜ (5.6.44) の方が (5.6.43) より優れた境界か説明せよ。理由は (d) の方法がユークリッドノルムで失敗するのと同じである。
5.6.P11
なぜ \(\lVert AA^* \rVert_2 = \lVert A^*A \rVert_2 = \lVert A \rVert_2^2\) が成り立つか説明せよ。
5.6.P12
\( A, B \in M_n \) および行列ノルム \(\lVert \cdot \rVert\) が与えられているとする。なぜ \(\lVert AB \pm BA \rVert \le 2 \lVert A \rVert \lVert B \rVert\) が成り立つか?
より良い上界は、\( A \) および \( B \) が正定値半定値であり、スペクトルノルムを用いる場合に得られる。(a) \( A \) が半正定値なら \(\lVert A - \frac{1}{2} \lVert A \rVert_2 I \rVert_2 = \frac{1}{2} \lVert A \rVert_2\) を示せ。
(b) \(\alpha, \beta \in \mathbb{C}\) として、\(\lVert AB - BA \rVert = \lVert (A - \alpha I)(B - \beta I) - (B - \beta I)(A - \alpha I) \rVert \le 2 \lVert A - \alpha I \rVert \lVert B - \beta I \rVert\) を説明せよ。
(c) \(\alpha = \frac{1}{2} \lVert A \rVert_2\)、\(\beta = \frac{1}{2} \lVert B \rVert_2\) として、\( A, B \) が半正定値なら \(\lVert AB - BA \rVert_2 \le \frac{1}{2} \lVert A \rVert_2 \lVert B \rVert_2\) を結論せよ。
5.6.P13
\( A \in M_n \) が特異行列なら、任意の行列ノルムに対して \(\lVert I - A \rVert \ge 1\) が成り立つ理由を説明せよ。
5.6.P14
行列ノルム \(\lVert \cdot \rVert_\alpha\) と \(\lVert \cdot \rVert_\beta\) が与えられているとする。行列ノルム \(\lVert \cdot \rVert = \max\{\lVert \cdot \rVert_\alpha, \lVert \cdot \rVert_\beta\}\) が誘導ノルムとなる条件は何か。
5.6.P15
すべての行列ノルム \(\lVert \cdot \rVert\) に対して \(\rho(A) \lt \lVert A \rVert\) が成り立つ行列 \( A \) の例を挙げよ。
5.6.P16
\( A = [a_{ij}] \in M_n \), \( n \ge 2 \) に対して、\(\lVert A \rVert = n \max_{i,j} |a_{ij}|\) と定義すると、この関数は誘導されない行列ノルムであることを説明せよ。
5.6.P17
(5.6.P16) の考え方を用いて、次の行列の逆行列を求めよ。
\begin{bmatrix} 1 & -2 & 1\\ 0 & 1 & 3\\ 0 & 0 & 1 \end{bmatrix}
5.6.P18
(5.6.P17) の方法を、任意の非特異な上三角行列 \( A \in M_n \) の逆行列を求めるように一般化する方法を説明せよ。
5.6.P19
スペクトル半径 \(\rho(\cdot)\) は非負、連続、斉次関数であるが、行列ノルム、ノルム、セミノルム、プレノルムではない。次の例を示せ:
(a) \( \rho(A) = 0 \) となる非零行列 \( A \) が存在する。
(b) \(\rho(A + B) \gt \rho(A) + \rho(B)\) となることがある。
(c) \(\rho(AB) \gt \rho(A)\rho(B) \gt 0\) となることがある。
5.6.P20
任意の \( A, B \in M_n \) に対して、\(\lVert AB \rVert_2 \le \lVert A \rVert_2 \lVert B \rVert_2\) および \(\lVert AB \rVert_2 \le \lVert A \rVert_2 \lVert B \rVert_2\) を示せ。これにより \(\lVert A \rVert_2 \le \sqrt{n} \lVert A \rVert_2\) を導け。
5.6.P21
任意の行列ノルム \(\lVert \cdot \rVert\) と \( A \in M_n \) に対して、次を示せ。
\lVert A \rVert_2 \le \lVert A \rVert^{1/2} \lVert A^* \rVert^{1/2}
これより次が導かれる。
\lVert A \rVert_2 \le \lVert A \rVert_1^{1/2} \lVert A \rVert_\infty^{1/2}
5.6.P22
行列ノルム \(\lVert \cdot \rVert\) が単位元ノルム(unital)であることは、すべての \( A \in M_n \) に対して \(\lVert A \rVert^D \ge |\mathrm{tr} A|\) が成り立つことと同値であることを示せ。
5.6.P23
以下の 6×6 の表の各成分が、すべての \( A \in M_n \) に対して \(\lVert A \rVert_\alpha \le C_{\alpha\beta} \lVert A \rVert_\beta\) を満たす最良定数 \( C_{\alpha\beta} \) を与えることを確認せよ。例えば、フロベニウスノルム(行 5)とスペクトルノルム(列 2)について、任意の \( A \in M_n \) に対して \(\lVert A \rVert_2 \le \sqrt{n} \lVert A \rVert_2\) が成り立つ。ここで定数 \(\sqrt{n}\) は表の位置 5,2 にある。表中のすべてのノルムは行列ノルムである。
\begin{array}{c|cccccc} \lVert \cdot \rVert_\alpha \backslash \lVert \cdot \rVert_\beta & \lVert \cdot \rVert_1 & \lVert \cdot \rVert_2 & \lVert \cdot \rVert_\infty & n\lVert \cdot \rVert_1 & \sqrt{n}\lVert \cdot \rVert_2 & n\lVert \cdot \rVert_\infty \\ \hline \lVert \cdot \rVert_1 & 1 & \sqrt{n} & n & 1 & \sqrt{n} & 1 \\ \lVert \cdot \rVert_2 & \sqrt{n} & 1 & \sqrt{n} & 1 & 1 & 1 \\ \lVert \cdot \rVert_\infty & n & \sqrt{n} & 1 & 1 & \sqrt{n} & 1 \\ n\lVert \cdot \rVert_1 & n & n^{3/2} & n & 1 & n & n \\ \sqrt{n}\lVert \cdot \rVert_2 & \sqrt{n} & \sqrt{n} & \sqrt{n} & 1 & 1 & 1 \\ n\lVert \cdot \rVert_\infty & n & n & n & n & n & 1 \end{array}
5.6.P24
(5.6.P23) の境界 (5,2) が次のように改善されることを示せ。
\lVert A \rVert_2 \le (\mathrm{rank}\, A)^{1/2} \lVert A \rVert_2
5.6.P25
\( A \in M_n \) を循環行列(0.9.6.1)で、最初の行が \([a_1 \dots a_n]\) であるとする。また \(\omega = e^{2\pi i/n}\) とする。次を示せ。
|a_1 + \cdots + a_n| \\ \le \max_{j=1,\dots,n} \left| \sum_{k=0}^{n-1} a_{k+1} \omega^{k(j-1)} \right| \\ \le \lVert A \rVert_2 \le |a_1| + \cdots + |a_n|
5.6.P26
\( A \in M_n \) で \(\rho(A) \lt 1\) のとき、ノイマン級数 \( I + A + A^2 + \dots \) が収束し、\((I - A)^{-1}\) に等しくなることを示せ。
5.6.P27
次のように次数が 1 以上の任意の多項式 \( f(z) \) は表せる:
f(z) = \gamma z^k p(z)
ここで \(\gamma\) は 0 でない定数であり、
p(z) = z^n + a_{n-1} z^{n-1} + \dots + a_1 z + a_0
はモニック多項式で、\(p(0) = a_0 = 0\)。\(p(z) = 0\) の根は \(f(z) = 0\) の 0 でない根であり、これらの根に対してさまざまな境界を与えることができる。\(C(p) \in M_n\) を多項式 \(p(z)\) のフロベニウスの同伴行列とする。\(C(p)\) の固有値は多項式 \(p\) の根(重複度を含む)である。
(a) 任意の行列ノルム \(\lVert \cdot \rVert\) に対して、\(\tilde{z}\) が \(p(z) = 0\) の根であれば次を示せ:
|\tilde{z}| \le \lVert C(p) \rVert
(b) \(\lVert \cdot \rVert_2\) を用いると次が得られる:
|\tilde{z}| \le \sqrt{n + |a_0|^2 + |a_1|^2 + \dots + |a_{n-1}|^2}
(c) \(\lVert \cdot \rVert_\infty\) を用いると:
|\tilde{z}| \le \max\{|a_0|, 1+|a_1|, \dots, 1+|a_{n-1}|\} \\ \le 1 + \max\{|a_0|, |a_1|, \dots, |a_{n-1}|\}
これは Cauchy の境界として知られる。
(d) \(\lVert \cdot \rVert_1\) を用いると Montel の境界が得られる:
|\tilde{z}| \le \max\{1, |a_0| + |a_1| + \dots + |a_{n-1}|\} \\ \le 1 + |a_0| + |a_1| + \dots + |a_{n-1}|
(e) \(\lVert \cdot \rVert_1\) を用いると次が得られる:
|\tilde{z}| \le (n-1) + |a_0| + |a_1| + \dots + |a_{n-1}|
(f) \(n \lVert \cdot \rVert_\infty\) を用いると:
|\tilde{z}| \le n \max\{1, |a_0|, |a_1|, \dots, |a_{n-1}|\}
5.6.P28
前問の記法を引き続き用い、(5.6.46) の境界を改善する。\( s = |a_0|^2 + |a_1|^2 + \dots + |a_{n-1}|^2 \) とおく。フロベニウスの同伴行列を \( C(p) = S + R \) と書く。ここで \( S = J_n(0)^T \) は n×n のニルポテント Jordan ブロックの転置、\( R = C(p) - J_n(0) \) は最後の列だけが非零のランク 1 行列である。
(a) 次を示せ:
SR^* = RS^* = 0, \quad \\ \lVert SS^* \rVert_2 = 1, \quad \\ \lVert RR^* \rVert_2 = \lVert R^* R \rVert_2 = s
(b) 次を示せ:
\lVert C(p) \rVert_2^2 = \lVert C(p)C(p)^* \rVert_2 \\ = \lVert (S+R)(S+R)^* \rVert_2 \\ = \lVert SS^* + RR^* \rVert_2 \\ \le \lVert SS^* \rVert_2 + \lVert RR^* \rVert_2
よって Carmichael と Mason の境界が得られる:
|\tilde{z}| \le \sqrt{s + 1}
(c) 最後に \( C(p) \) の最大特異値 \(\sigma_1(C(p))\) を用いるとさらに良い境界が得られる:
|\tilde{z}| \le \frac{1}{2} \sqrt{s + 1 + \sqrt{(s+1)^2 - 4|a_0|^2}} \\ = \sigma_1(C(p))
ここで \(1 \le \sigma_1(C(p)) \lt \sqrt{s+1}\)(\(\sigma_1(C(p)) = 1\) はかつて \(a_1 = \dots = a_{n-1} = 0\) の場合のみ)。したがって境界は常に \(\sqrt{s+1}\) より良い。
5.6.P29
Montel の境界 (5.6.48) を多項式
\begin{align} q(z) &= (z-1)p(z) \notag \\ &= z^{n+1} + (a_{n-1}-1)z^n \notag \\ & \quad \quad + (a_{n-2}-a_{n-1})z^{n-1} \notag \\ & \quad \quad + \dots + (a_0 - a_1) z + a_0 \notag \end{align}
に適用し、次を示せ:
\begin{align} |\tilde{z}| & \le \max\{1, |a_0| + |a_0 - a_1| \notag \\ & \quad + \dots + |a_{n-2} - a_{n-1}| \notag \\ & \quad \quad + |a_{n-1}-1|\} \notag \end{align}
これにより Montel の別の境界が得られる:
|\tilde{z}| \le |a_0| + |a_0 - a_1| \\ \quad \quad \quad \quad \quad \quad +\dots + |a_{n-2} - a_{n-1}| \\ \quad \quad \quad \quad \quad \quad \quad \quad \quad + |a_{n-1}-1|
5.6.P30
上記の Montel の境界を用いて Kakeya の定理を示せ:もし多項式
f(z) = a_n z^n + a_{n-1} z^{n-1} + \dots + a_1 z + a_0
の係数 \(a_i \ge 0\) が単調で \(a_n \ge a_{n-1} \ge \dots \ge a_0\) の場合、すべての根 \(\tilde{z}\) は単位円内にある。すなわち、すべての \(|\tilde{z}| \le 1\) である。
5.6.P31
前問の 4 問はいずれも \(p(z) = 0\) の根の絶対値の上限に関する問題であったが、これらは下限境界を得るためにも利用できる。もし \(p(z)\) が (5.6.45) で与えられ、\(a_0 \neq 0\) であれば、次の多項式を考える:
q(z) = \frac{1}{a_0} z^n p\left(\frac{1}{z}\right) \\ = z^n + \frac{a_1}{a_0} z^{n-1} + \frac{a_2}{a_0} z^{n-2} + \dots + \frac{a_{n-1}}{a_0} z + \frac{1}{a_0}
この \(q(z)\) の根は、\(p(z) = 0\) の根の逆数である。ここから \(q(z) = 0\) の上限境界を用いて、\(p(z) = 0\) の根 \(\tilde{z}\) の下限を次のように得られる。
Cauchy の下限:
|\tilde{z}| \ge \frac{|a_0|}{\max\left\{\begin{aligned}&1, |a_0| + |a_{n-1}|, |a_0| + |a_{n-2}|\\ & \quad , \dots, |a_0| + |a_1|\end{aligned}\right\}} \\ \ge \frac{|a_0|}{|a_0| + \max\{1, |a_{n-1}|, \dots, |a_1|\}}
Montel の下限:
|\tilde{z}| \ge \frac{|a_0|}{\max\{|a_0|, \\ 1 + |a_1| + \dots + |a_{n-1}|\}} \\ \ge \frac{|a_0|}{1 + |a_0| + |a_1| + \dots + |a_{n-1}|}
Carmichael と Mason の下限:
|\tilde{z}| \ge \frac{|a_0|}{\sqrt{1 + |a_0|^2 + |a_1|^2 + \dots + |a_{n-1}|^2}} \\ = \frac{|a_0|}{\sqrt{s + 1}}, \\ \quad s = |a_0|^2 + \dots + |a_{n-1}|^2
さらに (5.6.9(b)) および \(C(p)\) の最小特異値を用いると、より良い下限が得られる:
\begin{align} |\tilde{z}| & \ge \frac{1}{2} \sqrt{s+1 - \sqrt{(s+1)^2 - 4|a_0|^2}} \notag \\ &= \frac{|a_0|}{\sigma_1(C(p))} \notag \end{align}
この境界は Carmichael と Mason の下限より優れている理由を説明せよ。境界 (5.6.50) と (5.6.51) を用いると、すべての根を含む円環領域を表すことができる。例えば \(p(z) = z^5 + 1\) の場合、この円環はどのようになるか。
5.6.P32
次の多項式を考える:
\begin{align} & p(z) \notag = \frac{1}{n!} z^n + \frac{1}{(n-1)!} z^{n-1} \notag \\ & \quad \quad \quad \quad + \dots + \frac{1}{2} z^2 + z + 1 \notag \end{align}
これは指数関数 \(e^z\) の n 次部分和である。すべての根 \(\tilde{z}\) は次の不等式を満たす:
\frac{1}{2} \le |\tilde{z}| \le 1 + n!
\(z^n p(1/z)\) に Kakeya の定理を適用すると、実際にはすべての根が \(|\tilde{z}| \ge 1\) を満たすことがわかる。
5.6.P33
任意の非特異行列 \(D\) に対して \(\rho(A) = \rho(D^{-1} A D)\) であることから、(5.6.P27) の方法を \(D^{-1} C(p) D\) に適用して、(5.6.45) の多項式 \(p(z)\) の根に関する他の境界を得ることができる。計算上便利な選択として \(D = \mathrm{diag}(p_1, \dots, p_n)\) (すべての \(p_i > 0\))とし、Cauchy の境界 (5.6.47) を次のように一般化できる:
|\tilde{z}| \le \max \left\{ \begin{aligned} & |a_0| \frac{ p_n}{p_1}, \\ & |a_1| \frac{p_{n-1}}{p_1} + \frac{p_{n-1}}{p_n}, \\ & |a_2| \frac{p_{n-2}}{p_1} + \frac{p_{n-2}}{p_{n-1}}, \\ & \quad \dots,\\ & |a_{n-2}| \frac{p_2}{p_1} + \frac{p_2}{p_3}, \\ & |a_{n-1}| + \frac{p_1}{p_2} \end{aligned} \right\}
これは任意の正のパラメータ \(p_1, \dots, p_n\) に対して有効である。
5.6.P34
もし (5.6.45) のすべての係数 \(a_k\) が非零である場合、前問のパラメータを \(p_k = p_1 / |a_{n-k+1}|\) (\(k=2,3,\dots,n\))と選ぶと、(5.6.52) から多項式 \(p(z)\) の根 \(\tilde{z}\) に対する Kojima の境界が導かれる:
|\tilde{z}| \le \max\left\{ \begin{aligned} & \frac{a_0}{a_1}, \; 2\frac{a_1}{a_2}, \; 2\frac{a_2}{a_3} \; \\ & \quad , \dots, \; 2\frac{a_{n-2}}{a_{n-1}}, \; 2 |a_{n-1}| \end{aligned} \right\}
5.6.P35
(5.6.P33) のパラメータを \(p_k = r^k\) (\(k=1,\dots,n\))と選ぶと、(5.6.52) は次の境界を示す:
|\tilde{z}| \le \max\left\{\begin{aligned} & |a_0| r^{n-1}, \\ & |a_1| r^{n-2} + r^{-1}, \\ & |a_2| r^{n-3} + r^{-1}, \\ & \dots,\\ & |a_{n-2}| r + r^{-1}, \\ & |a_{n-1}| + r^{-1} \end{aligned} \right\} \\ \le \frac{1}{r} + \max_{0 \le k \le n-1} \left\{|a_k| r^{n-k-1}\right \}, \\\quad r > 0
5.6.P36
\(A \in M_n\) の場合、エルミート行列
\hat{A} = \begin{bmatrix} 0 & A^* \\ A & 0 \end{bmatrix} \in M_{2n}
は \(A\) と同じスペクトルノルムを持つことを示せ。
5.6.P37
スペクトルノルムはフロベニウスノルムと異なり、\(M_n\) 上の内積から導かれるものではないことを示せ。
5.6.P38
\(A \in M_n\) が与えられたとき、\(\| \cdot \|\) をある行列ノルムとすると \(\|A\| = \rho(A)\) が成り立つのは、\(A\) の最大絶対値の固有値がすべて半単純(セミシンプル)である場合、すなわち \(J_k(\lambda)\) が \(A\) のジョルダンブロックで \(|\lambda| = \rho(A)\) ならば \(k=1\) である場合に限ることを示せ。
5.6.P39
前問の結果はスペクトルノルムの場合にさらに改善できる。スペクトル行列とは、スペクトルノルムとスペクトル半径が等しい行列である。
(a) \(U \in M_n\) がユニタリ行列で \(\alpha \in \mathbb{C}\) の場合、なぜ \(\alpha U\) がスペクトルであるかを説明せよ。
(b) \(A \in M_n\) がユニタリ行列のスカラー倍でない場合、ユニタリ行列 \(U \in M_n\) が存在して \(U^* A U = \|A\|_2 (B \oplus C)\) となることを示せ。ここで \(B=[b_{ij}]\) は上三角行列、\(\|B\|_2 \lt 1\)、すべての \(|b_{ii}| \lt 1\)、\(C\) は対角ユニタリ行列である。さらに、スペクトル行列の最大絶対値の固有値が半単純かつ正規であることを説明せよ。
(c) \(A,B \in M_n\) がスペクトル行列の場合、\(\rho(AB) \le \rho(A)\rho(B)\) であることを示せ。
5.6.P40
(a) 次の行列のスペクトルノルムを計算せよ:
\begin{bmatrix} 1 & 1 \\ 1 & 1 \end{bmatrix}, \quad \begin{bmatrix} 1 & 1 \\ 1 & -1 \end{bmatrix}
これにより、\(M_n\) 上のスペクトルノルムは \(C_n\) 上の絶対ノルムから誘導されるが、\(M_n\) 上では絶対ノルムではないことがわかる。
(b) 次の行列のスペクトルノルムを計算せよ:
\begin{bmatrix} 1 & 1 \\ -1 & 1 \end{bmatrix}, \quad \begin{bmatrix} 1 & 1 \\ 0 & 1 \end{bmatrix}
これにより、行列の要素をゼロにするとスペクトルノルムが増加する場合があることがわかる。
(c) \(A \in M_n\) に対して \(\|A\|_2 \le \||A|\|_2\) を示せ。
(d) \(A,B \in M_n\) が実数かつ非負の要素を持ち、\(A \le B\) ならば \(\|A\|_2 \le \|B\|_2\) であることを示せ。
5.6.P41
\( \|\cdot\| \) を \(C_n\) 上の絶対ノルムとし、それによって誘導される \(M_n\) 上の行列ノルムを \(\|\cdot\|\) とする。さらに
N(A) = \||A|\|
と定義する。
(a) すべての \(A \in M_n\) について \(\|A\| \le N(A)\) が成り立ち、非負成分を持つベクトル \(z\) で \(\|z\| = 1\) かつ \(N(A) = \||A| z\|\) となるものが存在することを示せ。
(b) \(N(\cdot)\) は \(M_n\) 上の絶対行列ノルムであることを示せ。
(c) \(A,B \in M_n\) が実数かつ非負の要素を持ち、\(A \le B\) ならば \(\|A\| \le \|B\|\) であることを示せ。
(d) \(\| \cdot \|\) がスペクトルノルム \(\| \cdot \|_2\) の場合、すべての \(A \in M_n\) について
\|A\|_2 \le \||A|\|_2 \le \sqrt{\text{rank} A} \|A\|_2
が成り立ち、さらに \(A,B\) が実数かつ非負の要素を持ち \(A \le B\) ならば \(\|A\|_2 \le \|B\|_2\) であることを示せ。
5.6.P42
スペクトルノルムは絶対ノルムではないが、絶対ベクトルノルムから誘導されるすべての行列ノルムは、前問の (c) 部で示された弱い単調性を持つ。行列ノルム \(\| \cdot \|\) は正の直交体(positive orthant)上で単調であるとは、\(A,B \in M_n(\mathbb{R})\) かつ \(A \ge B \ge 0\)(成分ごとの不等式)のとき \(\|A\| \ge \|B\|\) が成り立つことをいう。次の証明の詳細を示せ:単調ベクトルノルムから誘導される任意の行列ノルムは正の直交体上で単調である。すなわち、\(A,B \in M_n(\mathbb{R})\) で \(A \ge B \ge 0\) とする。行列ノルム \(\| \cdot \|\) は単調ベクトルノルム \(\|\cdot\|\) から誘導されるとする。このとき
\|B\| = \max_{x \neq 0} \frac{\|Bx\|}{\|x\|} \\ = \max_{x \neq 0} \frac{\| |Bx| \|}{\|x\|} \\ \le \max_{x \neq 0} \frac{\| B|x| \|}{\|x\|} \\ \le \max_{x \neq 0} \frac{\| A|x| \|}{\|x\|} \\ \le \max_{x \neq 0} \frac{\|Ax\|}{\|x\|} \\ = \|A\|
5.6.P43
\(A \in M_n\) とし、\(U^* A U = T\) をユニタリ上三角化(2.3.1)とする。指数関数の級数展開を用いて \(e^T = U^* e^A U\) を示せ。これにより \(\det e^A = e^{\mathrm{tr}\,A}\) となり、\(e^A\) は常に非特異行列であることがわかる。
5.6.P44
\(A = [a_{ij}] \in M_n(\mathbb{R})\) がすべて整数(正・負・ゼロ)であり、\(K = \max |a_{ij}| = \|A\|_\infty\) とする。非零の固有値を \(\lambda_1, \dots, \lambda_m\) とする(重複度を含む)。以下を説明せよ:
(a) 各 \(i=1,\dots,m\) に対して \(|\lambda_i| \le nK\)(整数)である理由。
(b) 特性多項式 \(p_A(t)\) の非零係数はすべて整数であり、よって絶対値は少なくとも 1。
(c) \(p_A(t) = t^{n-m} g_A(t)\)、ここで \(g_A(t)\) は次数 \(m\) の多項式で \(|g_A(0)| = |\lambda_1 \cdots \lambda_m| \ge 1\)。
(d) \(\min_{i=1,\dots,m} |\lambda_i| \ge 1/(nK)^{m-1} \ge 1/(nK)^{n-1}\)。
(e) もし \(A\) が ±1 または 0 の要素を持つ非特異 4×4 対称行列ならば、\(A^{-1}\) の要素の絶対値は 64 を超えず、各列のユークリッドノルムも 64 を超えない。
5.6.P45
\(\| \cdot \|\) を \(C_n\) 上のノルムから誘導された \(M_n\) 上の行列ノルムとし、\(A = XY^*\) (\(X = [x_1 \dots x_k] \in M_{n,k}\), \(Y = [y_1 \dots y_k] \in M_{n,k}\))とする。このとき
\|A\| \le \sum_{i=1}^k \|x_i\| \|y_i\|, \\ \quad \text{k = 1 の場合は等号成立}
5.6.P46
\(A \in M_n\) が非特異であり、行列ノルム \(\| \cdot \|\) がベクトルノルム \(\|\cdot\|\) から誘導される場合、次を示せ:
\|A^{-1}\| = \frac{1}{\min_{\|x\|=1} \|Ax\|}
以下の五つの問題では、\(\| \cdot \|\) は \(M_n\) 上の行列ノルム、\(S_n = \{X : X \in M_n \text{ かつ } X \text{ は特異}\}\) とし、与えられた \(A \in M_n\) に対して
\mathrm{dist}_{\|\cdot\|}(A, S_n) \\= \inf \{\|A - B\| : B \in S_n\}
を \(A\) から \(M_n\) の特異行列集合への距離とする。これが \(\|A^{-1}\|\) と密接に関係していることを示す。
5.6.P47
\(A, B \in M_n\) とし、\(A\) は非特異、\(B\) は特異であるとする。このとき次を示せ:
\|A - B\| \ge \frac{1}{\|A^{-1}\|}
非特異行列は特異行列によって近似可能か?
5.6.P48
(a) \(S_n\) が閉集合である理由を説明せよ。すなわち、\(X_i \in S_n\) (\(i=1,2,\dots\))かつ \( \|X_i - B\| \to 0 \) とすると \(B \in S_n\)。
(b) \(A\) が非特異である場合、\(\mathrm{dist}_{\|\cdot\|}(A, S_n) > 0\) となる理由と、ある \(B_0 \in S_n\) が存在して \(\mathrm{dist}_{\|\cdot\|}(A, S_n) = \|A - B_0\|\) となる理由を説明せよ。
(c) \(A\) が非特異である場合、\(\mathrm{dist}_{\|\cdot\|}(A, S_n) \ge \|A^{-1}\|^{-1}\) となる理由を説明せよ。
5.6.P49
\(\| \cdot \|\) が \(C_n\) 上のノルムから誘導され、\(A \in M_n\) が非特異であるとする。ベクトル \(x_0, y_0 \in C_n\) を \(\|x_0\| = \|y_0\|_D = 1\) かつ \(y_0^* A^{-1} x_0 = \|A^{-1}\|\) となるものとする(5.6.P54参照)。次を定義する:
E = -\frac{x_0 y_0^*}{\|A^{-1}\|}
(a) \(\|E\| = \|A^{-1}\|^{-1}\) を示せ。
(b) \((A+E)A^{-1}x_0 = 0\) となるので、\(A+E \in S_n\)。
(c) これにより、\(\| \cdot \|\) が誘導行列ノルムである場合、任意の非特異 \(A\) に対して \(\mathrm{dist}_{\|\cdot\|}(A, S_n) = \|A^{-1}\|^{-1}\) が成立する。
5.6.P50
\(\| \cdot \|\) が誘導でない行列ノルムの場合、(5.6.26) より、すべての \(A \in M_n\) に対して \(N(A) \le \|A\|\) となる誘導行列ノルム \(N(\cdot)\) が存在する。
(a) なぜ \( \hat{C} \in M_n \) が存在して \(N(\hat{C}) \lt \|\hat{C}\|\) となるかを説明せよ。
(b) なぜ非特異 \(C \in M_n\) が存在して \(N(C^{-1}) \lt \|C^{-1}\|\) となるかを示せ。
(c) これにより、\(\mathrm{dist}_{\|\cdot\|}(C, S_n) \ge \mathrm{dist}_{N(\cdot)}(C, S_n) = N(C^{-1})^{-1} \gt \|C^{-1}\|^{-1}\) が成立する理由を説明せよ。
5.6.P51
任意の非特異 \(A \in M_n\) に対して \(\mathrm{dist}_{\|\cdot\|}(A, S_n) = \|A^{-1}\|^{-1}\) が成立する場合に限り、行列ノルム \(\|\cdot\|\) が誘導ノルムであることを説明せよ。
5.6.P52
スペクトルノルムの場合の (5.6.P49) の構成を示せ。非特異 \(A \in M_n\) を特異値分解 \(A = V \Sigma W^*\)(2.6.3.1)とすると、\(x_0\) を \(V\) の最後の列、\(y_0\) を \(W\) の最後の列としてよい。なぜ \(\sigma_n\) が \(A\) から最も近い特異行列までの距離になるのか?次を示せ:
A + E = V \hat{\Sigma} W^*, \\ \hat{\Sigma} = \mathrm{diag}(\sigma_1, \dots, \sigma_{n-1}, 0)
5.6.P53
最大行和ノルムの場合の (5.6.P49) の構成を示す。行列
A = \begin{pmatrix} 1 & 1 \\ 0 & 1/2 \end{pmatrix}
に対して、\(x_0 = [-1,1]^T\)、\(y_0 = [0,1]^T\) を取ることができることを示せ。なぜ 1/4 が \(\| \cdot \|_\infty\) ノルムにおける最も近い特異行列までの距離になるのか?さらに次を示せ:
A + E = \begin{pmatrix} 1 & 1/4 \\ 1/4 & 1/2 \end{pmatrix}
5.6.P54
(5.6.P49) でベクトル \(x_0\) と \(y_0\) の存在を保証する一般原理は、コンパクト集合のデカルト積がコンパクトであることである。この場合のコンパクト集合は、ノルム \(\|\cdot\|\) およびその双対ノルムの単位球である。
(a) 複素ノルム線形空間を \(\mathbb{C}^n \times \mathbb{C}^n = \{(x,y) : x,y \in \mathbb{C}^n\}\) として、\((x,y)+(\xi,\eta)=(x+\xi,y+\eta)\)、\(\alpha(x,y)=(\alpha x, \alpha y)\)、\(N((x,y))=\max\{\|x\|,\|y\|_D\}\) と定義せよ。
(b) \(B_{\|\cdot\|} \times B_{\|\cdot\|_D}\) はノルム \(N(\cdot)\) に関して閉じていることを示せ。
(c) \(B_{\|\cdot\|} \times B_{\|\cdot\|_D}\) はノルム \(N(\cdot)\) に関して有界であることを示せ。
(d) よって \(B_{\|\cdot\|} \times B_{\|\cdot\|_D}\) はコンパクトである。
(e) \(A \in M_n\) が非特異であると仮定する。実数値関数 \(f(x,y) = |y^* A^{-1} x|\) は \(B_{\|\cdot\|} \times B_{\|\cdot\|_D}\) 上で連続であるため、ある点 \((\hat{x},y_0)\) で最大値を達成する。ある実数 \(\theta\) が存在して \(y_0^* A^{-1} (e^{i\theta} \hat{x}) = |y_0^* A^{-1} \hat{x}|\) となる。\(x_0 = e^{i\theta} \hat{x}\) と取る。なぜ \((x_0, y_0) \in B_{\|\cdot\|} \times B_{\|\cdot\|_D}\) であり、\(\|x_0\| = \|y_0\|_D = 1\) となるか?
5.6.P55
与えられた行列ノルム \(\| \cdot \|\) を \(M_m\) 上で考える。関数 \(N(\cdot) : M_{mn} \to \mathbb{R}\) を次のように定義する:各 \(A \in M_{mn}\) をブロック行列として分割し、
A = [A_{ij}]_{i,j=1}^n, \quad A_{ij} \in M_m
とする。次を定義する:
N(A) = \max_{1 \le i \le n} \sum_{j=1}^{n} \|A_{ij}\|
(a) \(N(\cdot)\) が \(M_{mn}\) 上の行列ノルムであることを示せ。
(b) \(m = 1\) の場合、\(N(\cdot)\) は何になるか?このタイプの行列ノルムの応用は (6.1.P17) を参照。
5.6.P56
\(\| \cdot \|\) を \(M_n\) 上の自己共役行列ノルム(例えば、ユニタリ不変行列ノルム)とする。このとき、すべての \(A \in M_n\) に対して次を示せ:
\|A\|_2 \le \|A\|
5.6.P57
\(A \in M_n\) の固有値を \(|\lambda_1| \ge \cdots \ge |\lambda_n|\) の順に並べ、特異値を \(\sigma_1 \ge \cdots \ge \sigma_n\) とする。次を示せ:
|\lambda_1 \cdots \lambda_r| \le \sigma_1 \cdots \sigma_r, \\ \quad r = 1, \dots, n
(5.6.9)のスペクトルノルムおよび複合行列 \(C_r(A)\) への適用によって示す。参照:(2.6.P33) および (2.3.P12)。
5.6.P58
(a) \(A, B \in M_2\) の例を挙げ、\(\|AB\|_2 \neq \|BA\|_2\)(フロベニウスノルム)となることを示せ。
(b) \(A, B \in M_n\)、\(A\) は正規、\(B\) はエルミート行列とすると、\(\|AB\|_2 = \|BA\|_2\) を示せ。一般化については (7.3.P43) を参照。
Further Readings
誘導ノルム間の上界の問題(5.6.18)に関するさらなる議論は、H. Schneider および G. Strang, "Comparison theorems for supremum norms," Numer. Math. 4 (1962) 15–20 にある。(5.6.P23) の表の上界は、B. J. Stone, "Best possible ratios of certain matrix norms," Numer. Math. 4 (1962) 114–116 から取られており、追加の上界や参考文献が含まれている。多項式の零点を求めるための行列ノルムの使用については、M. Fujii および F. Kubo, "Operator norms as bounds for roots of algebraic equations," Proc. Japan Acad. 49 (1973) 805–808 を参照。Belitskii and Lyubich (1988) の書籍全体が行列ノルムに関する内容である。
行列解析の総本山

コメント