オーストラリアで勉強してきたデータサイエンティストの口語自由詩

主に、ベイズ・統計・データ分析・機械学習について自由に書く。

データ分析

Chapter 3 統計モデリングをはじめる前に 3.3〜3.5 - pythonで『StanとRでベイズ統計モデリング』

3.3 背景知識の役割 背景知識を活用することで内部構造がブラックボックスな問題(逆問題: inverse problem)を解く手がかりとなる. 逆問題の回答は何通りもあり得, 答えが一意に定まらない問題は不良設定問題(ill-posed problem)と呼ぶ. データを活用して…

Chapter 3 統計モデリングをはじめる前に 3.1〜3.2 - pythonで『StanとRでベイズ統計モデリング』

3.1 データ解析の前準備 このあたりのデータ前処理(Data Preparation)のプロセスは一般的なものなので特に深入りしない. データの分布を可視化して確認する点は機械学習のEDA(Exploratory Data Analysis)のプロセスでも重要とされているが, 多くの統計モ…

機械学習・データ分析のプロセス手法の決定版

TL;DR 銀の弾丸はない けれど試行錯誤してやってみた結果、以下の手法がオススメ乁( ˙ ω˙乁) 問題定義 (Define the Problem) データ準備 (Prepare Data) + EDA (Exploratory Data Analysis) アルゴリズムを色々試す (Spot Check Algorithms) 改善 (Improve R…