オーストラリアで勉強してきたMLデザイナーの口語自由詩

主に、データ分析・機械学習・ベイズ・統計について自由に書く。

今更なぜベイズを勉強するのか

まずはベイズについて勉強していこうと思うが、その前にいろいろ考えたり理解しておくことがある。

そもそもディープラーニング全盛の現在、ベイズにまつわることを勉強するべきかどうかというのは自明ではない。

One Size Does NOT Fit All(1つのサイズがみんなに合うわけではない) という言葉がある。(ちなみに大学院のプロジェクトマネジメントの授業で教授がこの言葉をよく言っていた)

つまり、機械学習で言えばケースバイケースで適切な手法を選ぶ必要があると読み替えることができる。

ディープラーニングに関しても決して万能ではない(ように見える)。現状、特に成果が出ているのは、以下の3つの分野のようだ。

  • 画像
  • 音声
  • 言語

ただ他の分野でも今後もっと成果が出る可能性は大いにある。

例えば、コンピュータ将棋の分野ではロジスティック回帰という手法が長く使われていたようで、ディープラーニングの適用は懐疑的だった。しかし、現在はディープラーニングを導入できたということを、ポナンザという将棋ソフトの開発者が述べている。 1

では、ベイズが有効な分野はなんだろうか。

最近知ったのだが、ロボティクスの分野では多くの場合にベイズを元にした手法が多く使われているようだ。例えば、Udacityのロボティクスに関するコースで頻出するカルマンフィルタはベイジアンフィルタというベイズを元にした手法の一種である(らしい)。2

また、安全なAIのためにはディープラーニングに加えて、不確実性を把握するためにベイズ的枠組みが必要だというブログ記事もある。3

個人的なイメージで言うと、ベイズ以外の機械学習の手法は「データをとにかく突っ込んでひたすらチューニング」みたいな印象があり黒魔術感が強すぎる気がする(偏見)。それに比べてベイズの手法は洗練されているように見える(偏見)。


現状わかっているのはこれくらいみたいだ。徐々に理解できるようになればよいと思う。

早速ベイズについて調べてみよう。

ところで、ベイズに関する本を読むと最初に確率の定義が出てくることが多い。それに続いて、条件付き確率や確率分布などの用語が続く。

確率と言えば、天気予報の降水確率30%が思い浮かび、簡単なように思える。

ただ、実際のところ本当に確率について理解しているのだろうか?

つづく

参考資料