『確率と計算』 第1章

1 Events and Probability

1.1 Application: Verifying Polynomial Identities

N個の単項式の積を展開するアルゴリズムを考える。そのアルゴリズムから導かれる結果(=多項式)を検査したい。たとえば、

\[ (x - 1) (x^4 + x^3 + 2 x^2 + 2 x - 1) \equiv^{?} x^5 + x^3 -3x + 1 \]

であるかということをたしかめたい。

真面目にやれば、展開後の最高の次数を $d$ とすると $\Theta(d^2)$ の係数同士の掛け算が必要。

じゃあ、 $[1,…,100d]$ の中から uniformly at random (均一的にランダム) に $r$ を選んで(選ぶコストは1ステップとする)、 展開前の式と展開後の式に代入し $F(r)=G(r)$ だったら検査OKとみなす。

ただ、これだと間違えることもある。

  1. $F(x) \equiv G(x)$ で $F(r)=G(r)$ のとき
  2. $F(x) \equiv G(x)$ で $F(r)\not=G(r)$ のとき
  3. $F(x) \not\equiv G(x)$ で $F(r)=G(r)$ のとき
  4. $F(x) \not\equiv G(x)$ で $F(r)\not=G(r)$ のとき

上の 3. のときはよろしくない。

詳しく見ていくと、このとき、 $F(x)-G(x)=0$ という方程式に少なくとも1つの解 $x=r$ がある。

また、最高次数は $d$ なので、この方程式はたかだか $d$ 個の解しか持ちえない。

よって $[1,…,100d]$ から選ぶので $d/100d=1/100$ の確率でそうなる。

1.2 Axioms of Probability

確率空間の定義

確率関数は以下を満たす

\[ \mathrm{Pr} \left( \bigcup_{i\ge1}{E_i} \right) = \sum_{i\ge1}\mathrm{Pr}(E_i) \]

1.1 での間違える確率の議論を定式化して確かめる。

確率を改善するにはどうすればいいか

同じアルゴリズムを繰り返すとき、 $[1,…,100d]$ をランダムに選ぶとき、重複を許すか、許さないか。

それぞれについて、間違える確率を計算する

\[ \mathrm{Pr}(E|F)=\frac{\mathrm{Pr}(E \cap F)}{\mathrm{Pr}(F)} \]

これは事象 $F$ が起こったときに、事象 $E$ が起こる確率(=条件付き確率)と読む。

これをもとに、 $i$ 回目の試行で選ばれた数 $r_i$ が $F(x)-G(x)$ の根になっている事象を $E_i$ とすると、

$k$ 回試行した結果、このアルゴリズムが間違えた答えを出す確率 $P=\mathrm{Pr}(E_1 \cap E_2 \cap … \cap E_k)$ となる。

条件付き確率を使うと、

\[ \mathrm{Pr}(E_1 \cap E_2 \cap … \cap E_k) =\mathrm{Pr}(E_k|E_1 \cap E_2 \cap … \cap E_{k-1})\mathrm{Pr}(E_1 \cap E_2 \cap … \cap E_{k-1}) \]

これを繰り返すと

\[ \mathrm{Pr}(E_1 \cap E_2 \cap … \cap E_k) =\mathrm{Pr}(E_1)\mathrm{Pr}(E_2|E_1)\mathrm{Pr}(E_3|E_2 \cap E_1)…\mathrm{Pr}(E_k|E_1 \cap E_2 \cap … \cap E_{k-1}) \]

たかだか $d$ 個の解しかないので、 $j$ 回目までに $j-1$ 個あれば、

\[ \mathrm{Pr}(E_j|E_1 \cap E_2 \cap … \cap E_{j-1}) \le \frac{d-(j-1)}{100d-(j-1)} \]

のはず。 あとは確率 $P$ の上限も重複ありのときより「厳しく」見積もれる。

1.3 Application: Verifying Matrix Multiplication

今度は正方行列のかけ算の結果を検証したい。簡単さをもとめて、行列の要素は ${0, 1}$ とする。

\[ \bigcup_{i=1}^{n}E_i=\Omega \]

とすると

\[ \mathrm{Pr}(B) =\sum_{i=1}^n\mathrm{Pr}(B\cap E_i) =\sum_{i=1}^n\mathrm{Pr}(B|E_i)\mathrm{Pr}(E_i) \]

1.4 Application: Naïve Bayesian Classifier

1.5 Application: A Randomized Min-Cut Algorithm

1.6 Excercises

Exerciese 1.6

黒白1つずつボールがビンにはいっている。 ビンからボールを無作為に取りだし、色をみる。 その色のボールをビンに入れ、取りだしたボールをビンに戻す。 これを $n$ 個のボールがビンにはいるまで繰りかえしたとき、 ビンの中の白のボールの数は1から $n-1$ で等確率であることを示せ。