- データを抜く・トラッキングデータDBを立てる
- リーグスタッツで予測値と実測値の補正パラメータを作る
- トラッキングデータの欠損値fill上、推定分布と実際のデータ分布にdiffが生まれるため
- Statcastデータのクリーニング|Student_analysis|note
- クリーニングしても(おそらく)分布は変わらないので、上振れ補正を入れることにする
- 選手単位で分布パラメータ(代表値・歪度・尖度)を取得して、パフォーマンス予測
pybaseballはBaseball Savantの不正CSVをちゃんとハンドリング出来ないので、使わない- オレオレスクリプトを書く
- 分布出して、シミュレーションを何回か回して、実測値との相関を見る
- 十中八九、上振れする
RC27* 162で出す?ここは検討する、、
- コツコツやるだけ