オーストラリアで勉強してきたMLデザイナーの口語自由詩

主に、データ分析・機械学習・ベイズ・統計について自由に書く。

日常の条件付き確率

そのまま Think Bayes を読み進めていると(まだ1ページ目でしかない)、次の用語の定義は conditional probability (条件付き確率)についてだ。そのまま引用する。

A conditional probability is a probability based on some background information. (p. 1 から引用。意図的に重要な箇所を太文字にした)

background information(=背景情報)を元にした確率のことを条件付き確率と呼ぶらしい。

その後に、筆者自身(アメリカ出身)が1年以内に心臓発作になる確率の具体例が続くので、ポイントだけ書く。

  • アメリカの人口は約3億人で、毎年785,000人が心臓発作になる(=ざっくり3%とする)
  • しかし個々人で個体差があるので、筆者自身が心臓発作になるリスクは色々な要素が関係する
    • 筆者は45歳で高コレステロールなので、心臓発作になるリスクは上がるはずだ
    • しかし、低血圧でタバコを吸わないので、心臓発作になるリスクは下がるはずだ
  • 結果として、人口比の心臓発作の確率と筆者自身の心臓発作になる確率には差異があるはずだ

つまり、ここでいう背景情報とは以下の事実のことを指すらしい。

  • 筆者は45歳で高コレステロールなので、心臓発作になるリスクは上がるはず
  • しかし、低血圧でタバコを吸わないので、心臓発作になるリスクは下がるはず

細かく見ていくと、「高コレステロール」というのは事実で、「高コレステロールならば心臓発作になるリスクが上がる」というのは事前情報(知識)のように思える。

念のため、Wikipediaでの定義も見てみる。前回の記事でWikipedia(日本語版)が当てにならなかったのでWikipedia(英語版)の方を確認してみる。経験上、英語版の方が説明も具体例も多くてわかりやすい。

In probability theory, conditional probability is a measure of the probability of an event) given that (by assumption, presumption, assertion or evidence) another event has occurred. (Wikipedia - Conditional probability から引用)

適当に翻訳する。

確率理論において、条件付き確率は何らかのイベントA(仮定・推測・主張・エビデンス)が発生した場合に、別のイベントBが発生する確率のことである。

なんとなくだが、こちらの定義の方が丁寧な印象がある。

イベントA(仮定・推測・主張・エビデンス)というのは、背景情報とほぼ同じに思えるのであえて区別しないようにする。

自分なりの言葉にすると、

条件付き確率とは、何かの事前情報があった場合の確率

と今のところ言ってよいだろう。

具体例で考えてみよう。

またもやあなたはどこかの場所に監禁されている。外部の音は聞こえないが、今回は窓があるものとする。

窓がなかった場合の確率は以下のとおりとする。

  • 今雨が降っている確率は0.5(=降っているかもしれないし、降っていないかもしれない)

だが、今回は窓があるので情報を得るために窓を覗いてみよう。すると、雨が降っていた。この場合の確率は1.0と言っていいだろう。

  • 今雨が降っている確率は1.0(=当たり前!)

これは簡単すぎるので、別の例で考えてみる。同じように窓を除くが今度は雨が降っているかどうか判断できなかったとする。けれど、一人の男性が傘をさしているのだけは見えた。この場合の確率はどうなるだろうか?

単純に考えるならば、前回と同じで1.0だが、本当に同じだろうか。本当に雨が降っていて傘をさしているのだろうか?

  • 既に雨はやんでいるが気づかないで傘をさしている
  • 日傘をさしている
  • etc

などのパターンは一応あり得る。なので、少し自信がないので以下のような条件付き確率にしておこう。

  • 一人の男性が傘をさしていて、今雨が降っている確率は0.8くらい(=まあ雨が降っているだろう)

これが10人傘をさしている場合ならばどうだろうか。さすがに10人も傘をさしていれば、ほぼ間違いなく雨が降っているだろう。

  • 10人が傘をさしていて、今雨が降っている確率は0.999くらい(=ほぼ間違いなく雨が降っている)

これらを条件付き確率と大仰な名前で呼ばれるのは違和感がある。なぜなら、こんなこと誰もが日常で当たり前のようにやっているからだ。私たちはみんな知らない内に条件付き確率を体得していると言っていい。

ただ、今後これらを説明するのに「一人の男性が傘をさしていて、今雨が降っている確率は0.8くらい」と説明するのはめんどくさい。

ここで上手く記号で表現する仕組みがある。

p(A|B) <= B(事前情報)が発生した場合のAの発生する確率

* p はprobability(確率)の略

先程の雨が降っている確率に置き換えよう。

1人の男性が傘をさしている場合

A = 雨が降っている
B = 1人の男性が傘をさしている

p(A|B) = p(雨が降っている|1人の男性が傘をさしている) = 0.8(たぶん)

10人が傘をさしている場合

A = 雨が降っている
B = 10人が傘をさしている

p(A|B) = p(雨が降っている|10人が傘をさしている) = 0.999(自信満々)

ふう、当たり前のことを整理していくのは意外とめんどくさい。

(まだベイズが始まらない)

参考資料

  • 書籍: Think Bayes - 日本語で読める(有料)
  • Website: Think Bayes - pdfもhtmlもあるけど英語(無料)