[行列解析8.7.P8]二重確率行列と置換行列

8.正および非負行列

(8.7.P8)

問題

\( n \times n \) の二重確率行列の集合がコンパクトかつ凸であることを踏まえ、ある行列がその集合の極端点であることと、置換行列であることが同値である理由を説明せよ。

ヒント

(8.7.2)

解答例

二重確率行列の集合を \(D\) と定義する。

\(D\) は、成分がすべて非負で、すべての行和および列和が \(1\) である \(n \times n\) 行列の集合である。

1. 集合 \(D\) がコンパクトかつ凸であること

凸性(Convexity)

任意の二重確率行列 \(A, B \in D\) と \(\lambda \in [0, 1]\) に対して、\(C = \lambda A + (1-\lambda) B\) が再び \(D\) に属することを示す。

  1. 非負性:\(A_{ij} \ge 0\) かつ \(B_{ij} \ge 0\) であり、\(\lambda \ge 0, 1-\lambda \ge 0\) であるため、\(C_{ij} = \lambda A_{ij} + (1-\lambda) B_{ij} \ge 0\) である。
  2. 行和が 1:任意の行 \(i\) について、
    \(\sum_{j=1}^n C_{ij} \\= \sum_{j=1}^n (\lambda A_{ij} + (1-\lambda) B_{ij}) \\= \lambda \sum_{j=1}^n A_{ij} + (1-\lambda) \sum_{j=1}^n B_{ij} \\= \lambda \cdot 1 + (1-\lambda) \cdot 1 = 1\)
  3. 列和が 1:同様に、任意の列 \(j\) について \(\sum_{i=1}^n C_{ij} = 1\) が成り立つ。

したがって、\(D\) は凸集合である。

コンパクト性(Compactness)

\(D\) は \(\mathbb{R}^{n^2}\) における閉集合かつ有界集合であるため、ハイネ・ボレルの定理(Heine-Borel theorem)によりコンパクト集合である。

  • 有界性:任意の \(A \in D\) の成分 \(A_{ij}\) は \(0 \le A_{ij} \le 1\) の範囲にあり、すべての成分が有界であるため、\(D\) は有界である。
  • 閉性:行和・列和が \(1\) という条件は線形な等式制約であり、成分が非負という条件は線形な不等式制約である。これらによって定義される集合は閉集合となる。

2. 極端点であることと置換行列であることが同値である理由

\(D\) はコンパクトな凸集合であるため、Krein–Milman の定理により、\(D\) はその極端点の凸包(convex hull)に等しい。

置換行列を \(P\) とし、極端点の集合を \(\text{Ext}(D)\) とする。示したいのは、\(A \in \text{Ext}(D) \iff A\) は置換行列である、ということである。

\(\Leftarrow\) 置換行列ならば極端点である

この方向は、Birchoff の定理の証明の鍵となる部分である。

置換行列 \(P\) が極端点でないと仮定し、\(P = \lambda A + (1-\lambda) B\) (\(A, B \in D, A \neq B, 0 < \lambda < 1\)) と表されるとする。

\(P\) の成分は \(0\) または \(1\) のみである。ここで、\(P_{ij}\) について次の議論を行う。

  1. \(P_{ij} = 0\) の場合:\(0 = \lambda A_{ij} + (1-\lambda) B_{ij}\) となる。\(A, B\) は非負行列であり、\(\lambda \in (0, 1)\) であるため、\(A_{ij}=0\) かつ \(B_{ij}=0\) でなければならない。
  2. \(P_{ij} = 1\) の場合:\(1 = \lambda A_{ij} + (1-\lambda) B_{ij}\) となる。\(A, B\) は行和が \(1\) の非負行列であるため、成分は \(A_{ij} \le 1, B_{ij} \le 1\) である。この等式が成り立つには、\(A_{ij}=1\) かつ \(B_{ij}=1\) でなければならない。

すべての成分について \(A_{ij} = P_{ij}\) かつ \(B_{ij} = P_{ij}\) が導かれ、\(A=P\) かつ \(B=P\) となる。これは \(A \neq B\) という仮定に矛盾するため、置換行列 \(P\) は極端点でなければならない。

\(\Rightarrow\) 極端点ならば置換行列である

極端点 \(A \in \text{Ext}(D)\) が置換行列でないと仮定する。このとき、\(A\) の少なくとも一つの行、例えば行 \(i\) に、\(0\) でも \(1\) でもない成分 \(A_{ij}\) が存在する。すなわち \(0 < A_{ij} < 1\) となる成分が存在する。

二重確率行列の性質(行和・列和が \(1\))と \(A\) が置換行列でないという仮定から、\(A\) の成分の配置において、少なくとも一つのサイクル(またはそれを一般化した集合の組)を見つけることができる。これは、\(A\) からある成分 \(\epsilon > 0\) を加減算することで、二つの異なる二重確率行列 \(A_1, A_2 \in D\) を構成できることを意味する。具体的には、

A_1 = A + \epsilon K, \quad A_2 = A - \epsilon K

となる。ただし、\(K\) は行和・列和が \(0\) となる、ある種の行列である。このとき、\(\epsilon\) を十分に小さくとることで \(A_1, A_2\) の非負性が保たれるようにできる。

この構成により、\(A\) は異なる二点 \(A_1, A_2\) の中点として

A = \frac{1}{2} A_1 + \frac{1}{2} A_2

と表され、極端点の定義に矛盾する。

したがって、\(A\) は \(0\) か \(1\) の成分のみをもち、各行・各列に唯一の \(1\) が存在しなければならない。すなわち、極端点 \(A\) は置換行列でなければならない。\(\square\)


行列解析の総本山

総本山の目次📚

[行列解析]総本山📚
行列解析の総本山。行列解析の内容を網羅的かつ体系的に整理しています。線形代数の学習を一通り終えた方が、次のステップとして取り組むのに最適です。行列に関する不等式を研究するには、行列解析の知識が欠かせません。

記号の意味🔎

[行列解析9.0]主要な記号一覧🔎
行列解析で使用している記号や用語の簡単な説明です。

コメント

タイトルとURLをコピーしました