オーストラリアで勉強してきたMLデザイナーの口語自由詩

主に、データ分析・機械学習・ベイズ・統計について自由に書く。

確率をつなげる - 結合確率

f:id:yukinagae:20171117105848p:plain

あとちょっとでベイズの定理に入れるがその前に最後の一つ。 (まだ Think Bayes の2ページ目)

あとは結合確率を理解すればベイズの定理にいけるみたいだ。

結合確率は、2つのことが真実であるという確率のことである。AとBが両方とも真である確率を意味し、p(A and B)と書きます。(Think Bayes p.2 から意訳して引用)

2枚のコインを投げて表が出る確率を考えてみる。それぞれのコインが表になる確率は以下のとおりだ。

p(A) = 1枚目のコインが表の確率 = 0.5
p(B) = 2枚目のコインが表の確率 = 0.5

ここまでは簡単。コインは表と裏しかないので、表になる確率は0.5(50%)となる。

では、2枚のコインの両方が表になる場合を考えよう。これが結合確率の例となる。

p(A and B) = p(1枚目のコインが表、かつ2枚目のコインも表の確率)

これは以下の式で書き表せるらしい。

p(A and B) = p(A) x p(B)     (注意!常に正しいわけではない!)

なので、

p(A and B) = 0.5 x 0.5 = 0.25

つまり両方のコインが表になる確率は0.25になる(当たり前!)

念のため全部のパターンを書き出してみる。太字部分が両方のコインが表になる確率である(もちろん他のパターンも同様に0.25になるので面白みはない)

1枚目のコインが表 2枚目のコインが表
1枚目のコインが裏 0.25 = p(A and B) 0.25
2枚目のコインが裏 0.25 0.25

しかし、この式はAとBの事象が独立の場合にしか当てはまらないらしい。だから、「注意!常に正しいわけではない!」と書いてある。

「独立」という言葉は難しすぎるので簡単に言い換えると、1つ目のコインの結果によって2つ目のコインが影響を受けない、ということだ。

つまり、1つ目のコインが表だろうと裏だろうと、2つ目のコインが表になる確率は常に0.5で変わらないということを示している。これを正式に式で書くと以下のようになる。

p(B) = p(B|A)

2つ目のコインが表になる確率 = 1つ目のコインが表/裏になったという情報を元にした場合に、2つ目のコインが表になる確率(条件付き確率)

では、「独立でない」場合はどんな状況だろうか?

今度はコインを投げる人が意図的に投げ方を変えたことを想像してみよう。この人は、1枚目のコインが表だった場合、できるだけ2枚目のコインは裏になるように投げる。これを式にすると以下のようになる。

p(B) != p(B|A)

2つ目のコインが表になる確率 > 1つ目のコインが表になったという情報を元にした場合に、2つ目のコインが表になる確率(条件付き確率)

2つ目のコインが表になる確率 = 1つ目のコインが裏になったという情報を元にした場合に、2つ目のコインが表になる確率(条件付き確率)

これらをまとめると以下の式で説明できる。

p(A and B) = p(A)p(B|A)

もしAとBが独立している場合に限定すると、

p(B) = p(B|A)

p(A and B) = p(A)p(B)

となる。


ふう、やっとここまできた。

次はおそらくベイズの定理になるだろう。

参考資料

  • 書籍: Think Bayes - 日本語で読める(有料)
  • Website: Think Bayes - pdfもhtmlもあるけど英語(無料)