オーストラリアで勉強してきたデータサイエンティストの口語自由詩

主に、ベイズ・統計・データ分析・機械学習について自由に書く。

機械学習

プログラマーのための実践的ベイズ

学習の仕方は様々あり、各人によって適した方法は異なる。ある人は本を読んで学び、ある人は数式から理解し、ある人は絵やイメージから全体像をつかむ。 ならば、私達プログラマーはどのように物事を理解するのか手っ取り早いだろうか? もちろんコーディン…

【環境構築】anaconda / pyenv / virtualenv のインストール

概要 機械学習やデータ分析に必要なpython環境をインストールする手順です。 目的 ローカル環境でjupyter notebookを使用して、pythonの機械学習やデータ分析のツールが使えること。 環境 Mac OS Sierra v10.12.6 (Windowsユーザには申し訳ないがMacでの手…

ベイズと機械学習の甘い関係

TL;DR 機械学習はデータから学習してモデルを構築して予測する 多くの機械学習の手法はビッグデータから学習する必要がある ベイズ + 機械学習の場合には事前情報(ドメイン知識)で少量のデータでも学習できる 内容 前回までで以下のベイズの定理を求めるこ…

今更なぜベイズを勉強するのか

まずはベイズについて勉強していこうと思うが、その前にいろいろ考えたり理解しておくことがある。 そもそもディープラーニング全盛の現在、ベイズにまつわることを勉強するべきかどうかというのは自明ではない。 One Size Does NOT Fit All(1つのサイズが…

そろそろブログを書き始めよう

長い間本やブログを読んだりオンラインコースで勉強したり、インプットは多かったけれどアウトプットが少なかったことに気づき、試しにブログ記事を始めてみる。 特に機械学習やデータ分析周りのビッグウェーブに乗っていきたいので、その辺りについて書いて…

機械学習・データ分析のプロセス手法の決定版

TL;DR 銀の弾丸はない けれど試行錯誤してやってみた結果、以下の手法がオススメ乁( ˙ ω˙乁) 問題定義 (Define the Problem) データ準備 (Prepare Data) + EDA (Exploratory Data Analysis) アルゴリズムを色々試す (Spot Check Algorithms) 改善 (Improve R…