オーストラリアで勉強してきたMLデザイナーの口語自由詩

主に、データ分析・機械学習・ベイズ・統計について自由に書く。

データ分析

英語記事のサマリ - PyMC開発者のThomas Wieckiさんにインタビューした記事

気分転換にベイズや確率プログラミングに関する英語記事や論文の翻訳サマリをさっくり書いていく予定. 第一回目はPyMC3の開発者のインタビュー記事. TL;DR PyMC3の開発者であり, かつQuantopian という投資会社で働いている Thomas Wiecki へのインタビュー…

Chapter 3 統計モデリングをはじめる前に 3.3〜3.5 - pythonで『StanとRでベイズ統計モデリング』

3.3 背景知識の役割 背景知識を活用することで内部構造がブラックボックスな問題(逆問題: inverse problem)を解く手がかりとなる. 逆問題の回答は何通りもあり得, 答えが一意に定まらない問題は不良設定問題(ill-posed problem)と呼ぶ. データを活用して…

Chapter 3 統計モデリングをはじめる前に 3.1〜3.2 - pythonで『StanとRでベイズ統計モデリング』

3.1 データ解析の前準備 このあたりのデータ前処理(Data Preparation)のプロセスは一般的なものなので特に深入りしない. データの分布を可視化して確認する点は機械学習のEDA(Exploratory Data Analysis)のプロセスでも重要とされているが, 多くの統計モ…

機械学習・データ分析のプロセス手法の決定版

TL;DR 銀の弾丸はない けれど試行錯誤してやってみた結果、以下の手法がオススメ乁( ˙ ω˙乁) 問題定義 (Define the Problem) データ準備 (Prepare Data) + EDA (Exploratory Data Analysis) アルゴリズムを色々試す (Spot Check Algorithms) 改善 (Improve R…