オーストラリアで勉強してきたデータサイエンティストの口語自由詩

主に、ベイズ・統計・データ分析・機械学習について自由に書く。

ベイズ

Chapter 3 統計モデリングをはじめる前に 3.3〜3.5 - pythonで『StanとRでベイズ統計モデリング』

3.3 背景知識の役割 背景知識を活用することで内部構造がブラックボックスな問題(逆問題: inverse problem)を解く手がかりとなる. 逆問題の回答は何通りもあり得, 答えが一意に定まらない問題は不良設定問題(ill-posed problem)と呼ぶ. データを活用して…

Chapter 3 統計モデリングをはじめる前に 3.1〜3.2 - pythonで『StanとRでベイズ統計モデリング』

3.1 データ解析の前準備 このあたりのデータ前処理(Data Preparation)のプロセスは一般的なものなので特に深入りしない. データの分布を可視化して確認する点は機械学習のEDA(Exploratory Data Analysis)のプロセスでも重要とされているが, 多くの統計モ…

Chapter 2 ベイズ推定の復習 2.4〜2.7 - pythonで『StanとRでベイズ統計モデリング』

2.4 ベイズ推定とMCMC 伝統的な統計学の手法や最尤推定の問題を解決する一つの手法がベイズ推定(Bayesian inference)とマルコフ連鎖モンテカルロ法(MCMC). ベイズ統計 パラメータを確率変数とみなして確率分布を推定する(伝統的な統計学の点推定と異な…

統計モデリング - pythonで『StanとRでベイズ統計モデリング』

はじめに この本はStan(スタン)というソフトウェアとそのR用のパッケージであるRStan(アールスタン)を使って, 統計モデリングを習得する本である イントロで書籍の目的や内容や流れ, 前提知識や対象読者が記載されていたいりするので意外と大事です. ま…

Stan/R - pythonで『StanとRでベイズ統計モデリング』

はじめに この本はStan(スタン)というソフトウェアとそのR用のパッケージであるRStan(アールスタン)を使って, 統計モデリングを習得する本である イントロで書籍の目的や内容や流れ, 前提知識や対象読者が記載されていたいりするので意外と大事です. ま…

『StanとRでベイズ統計モデリング』をpythonでやってみる

TL;DR 今後は以下の書籍を読んで勉強した内容をブログに書いていこうと思います(`・ω・´) StanとRでベイズ統計モデリング (Wonderful R) StanとRでベイズ統計モデリング (Wonderful R)作者: 松浦健太郎,石田基広出版社/メーカー: 共立出版発売日: 2016/10/2…

PyMC4のcommit読み始めてみる

TL;DR 最近ブログ書けてなかったので、@y_yagiさんのrails commit log流し読みのスタイルをパクってPyMC4というライブラリのcommitを追ってみようと思います。 このライブラリを選んだ理由としては、まだ開発を始めたばかりで52コミットしかないので読みやす…

事後確率の推移をグラフで可視化する - 多面体サイコロ編

TL;DR 多面体のサイコロを投げる例で、事後確率が変わる様子を観察する。 事前確率があるとする(例えば1/6とか)= before_p1 サイコロを投げて結果を見る(実際のサイコロの目を見る、例えば6とか) 事後確率(結果を見た上で推定した確率)= after_p1(一…

ベイズの定理の違う顔

TL;DR ベイズの定理を以下の用語を使い言い換える。クッキーの例で考えると簡単。 事前確率: p(ボウル1) => ボウル1とボウル2の2つのボウルからボウル1を選ぶ確率 事後確率: p(ボウル1 | ヴァニラ) => ヴァニラを見た後に、ボウル1が選ばれた確率 尤度: p(ヴ…

ベイズの定理の結果を馬鹿みたいに確かめる

TL;DR 前回の記事の続き。 yukinagae.hatenablog.com ベイズの定理が感覚的に理解できていない気がしたので、実際にサンプリングして確かめてみる。 理論的に理解するのではなく、本当にその確率になるのかを馬鹿みたいに調べる。 (「馬鹿みたい」というの…

ベイズの定理でクッキー問題の確率を計算する

TL;DR ベイズの定理を使って具体的な問題の確率を求めてみましょう。 p(A|B) と p(B|A) は別物 ベイズの定理を使うと、p(B|A) から p(A|B) を求めることができる クッキー問題(Think Bayes p.3〜p.4参照) クッキーが入った2つのボウルがあるとします。しか…

プログラマーのための実践的ベイズ

学習の仕方は様々あり、各人によって適した方法は異なる。ある人は本を読んで学び、ある人は数式から理解し、ある人は絵やイメージから全体像をつかむ。 ならば、私達プログラマーはどのように物事を理解するのか手っ取り早いだろうか? もちろんコーディン…

ベイズと機械学習の甘い関係

TL;DR 機械学習はデータから学習してモデルを構築して予測する 多くの機械学習の手法はビッグデータから学習する必要がある ベイズ + 機械学習の場合には事前情報(ドメイン知識)で少量のデータでも学習できる 内容 前回までで以下のベイズの定理を求めるこ…

ベイズの定理をあまりにも簡単に導き出す

条件付き確率と結合確率を理解すると、あとはベイズの定理をそのまま理解できる。 まずは、イベントAとイベントBが両方起きる確率は順番を変えても一緒であることを確認(当たり前!)。 p(A and B) = p(B and A) 当たり前のことも念のため具体例で考える。 …

日常の条件付き確率

そのまま Think Bayes を読み進めていると(まだ1ページ目でしかない)、次の用語の定義は conditional probability (条件付き確率)についてだ。そのまま引用する。 A conditional probability is a probability based on some background information. (…

君は確率を本当に理解しているか?

もちろん理解しているはずがない。 わかっているようで、わからないことが世の中にはたくさんある。 特に数学や統計では日常生活とは異なる用語の使い方をしている可能性もあるので、一つひとつの言葉から理解していこう。 本当は常に書籍や適切なサイトを参…

今更なぜベイズを勉強するのか

まずはベイズについて勉強していこうと思うが、その前にいろいろ考えたり理解しておくことがある。 そもそもディープラーニング全盛の現在、ベイズにまつわることを勉強するべきかどうかというのは自明ではない。 One Size Does NOT Fit All(1つのサイズが…