ソース
提供されたPDFソースで扱われている具体的な「ストーリー」(回帰分析の応用例、研究、データセットの事例)を以下に箇条書きでまとめます。これらの事例は、回帰モデルの構築、解釈、予測、および因果推論の課題を説明するために用いられています。
- 選挙結果の予測と経済成長:経済成長率から大統領選挙の投票結果を予測するモデルの事例 [26, 39, 93–99, 115, 120]。
- 議会選挙の予測における不確実性:1988年の議会選挙データを用いて、予測の不確実性を評価する事例。
- 世論調査の調整(ポスト層化):CBSニュースの世論調査を単一の要因(政党支持)で調整する事例。
- Xboxアンケート調査:2012年大統領選挙のXboxアンケート結果と、それを母集団に一般化するためにポスト層化(Poststratification)を行う事例 [39, 293, 294, 316–320]。
- 支持率と政治的イデオロギー:一般社会調査(General Social Survey)のデータを用いて、収入や政党支持と共和党への投票確率の関係をロジスティック回帰で分析する事例。
- 死亡率の傾向と調整:45~54歳の非ヒスパニック系白人の死亡率の傾向を、年齢調整の重要性と関連付けて論じる事例。
- 死刑判決の遅延:上訴裁判所における死刑判決の遅延に関する、データが打ち切られている(Censored data)事例。
- 協同組合の選挙:統計的有意性(Statistical significance)の解釈の問題を例証する、55,000人の住民が関わる協同組合選挙の事例 [63–65, 75, 76]。
- 身長と収入の関係:身長と収入の関係を線形回帰で分析し、その結果を因果的効果として解釈する危険性について警告する事例 [6, 39, 84, 87, 189–195, 225]。
- 母親と娘の身長:回帰の概念の歴史的な起源を説明する、母親の身長と娘の身長の相関データ(平均への回帰) [85–88, 90, 118, 128]。
- 回帰への回帰のパラドックス:フライトスクールの教官の訓練の事例を用いて、パフォーマンスのばらつきと因果関係の混同を説明する事例。
- 子供のテストの成績と母親のIQ:子供のテストの成績を母親のIQや学歴(mom_hs)で予測する多変数線形回帰の事例 [131–135, 156, 161, 185, 218]。
- 教師の評価と魅力度:教師の魅力度と授業評価の関係に関する分析(演習問題として言及)。
- マイル走の世界記録:1マイル走の世界記録の推移を線形モデルでグラフ化する事例。
- メスキートの葉の重さ:木の葉のサイズと重さの関係を予測し、対数変換の適用と交差検証によるモデル選択を行う事例 [200–206, 225]。
- ヒ素汚染と井戸の切り替え:バングラデシュのヒ素汚染地域における、住民が井戸を切り替える確率を、ヒ素濃度や安全な井戸までの距離からロジスティック回帰で予測する事例 [232–238, 246–249, 253, 254]。
- アパートのゴキブリ発生数:ゴキブリの発生数を予測するために、ポアソン回帰および負の二項回帰(過分散を考慮)を用いる事例 [268–270, 284]。
- HIVリスク行動データ:HIV感染リスクに関連する危険な行動のデータセットを用いたポアソン回帰の演習事例。
- 投票戦略の実験(順序付きロジスティック回帰):実験経済学における「ストーラブル・ボート」(Storable votes)に関する順序付きカテゴリデータ(ordered categorical data)の分析事例 [272–278]。
- 国連平和維持活動(Peacekeeping):平和維持軍の展開が内戦の再発を遅らせる効果を評価する観察研究の事例 [7–8, 17, 30]。
- 銃規制研究:観察データから政策的結論が導かれた、銃規制に関する研究の事例 [8–9, 17, 30]。
- 教育テレビ番組『エレクトリック・カンパニー』の効果:教育テレビ番組『エレクトリック・カンパニー(Electric Company)』の視聴が生徒のテストの成績に与える因果的影響を評価した無作為化実験の事例 [6, 28, 39, 364–372]。
- ジャマイカの幼児介入実験:幼児期の介入が後の収入に与える効果を、対数スケールで分析するベイジアン分析の事例。
- 保育プログラムの評価:米国の児童保育プログラムの因果効果を、観察データ(IHDPデータ)を用いて評価する事例。特に交絡因子や傾向スコアマッチング(Propensity score matching)の課題について議論される [336, 374–379, 394–405, 416]。
- セサミストリート研究:テレビ番組『セサミストリート(Sesame Street)』の視聴奨励(encouragement design)がテストの成績に与える因果効果を、操作変数(Instrumental variables)を用いて推定する事例 [357, 421–426, 428]。
- チリの学校プログラム(回帰不連続デザイン):学校の成績の閾値に基づいて特定プログラムへの参加が割り当てられる回帰不連続デザインの分析事例 [433–440]。
- 母親の就労と子供の発達:母親の就労が子供の発達に与える影響を、群内変動を利用して識別する事例。
- 心臓ステントの効果:心臓ステントが運動時間(exercise time)を改善する効果を、確率モデリングとシミュレーションを用いて示す事例。
- ゴルフのパッティング成功確率:パッティングの距離と成功確率の関係を、物理的なモデルに基づいて非線形回帰(Stanを使用)でモデリングする事例 [461–464, 471]。
- 同性婚支持率の時系列変化:年齢層ごとの同性婚支持率の傾向を、平滑化手法(LoessやSpline)を用いて分析する事例。
- ヒューマン・ディベロップメント・インデックス(HDI):米国の州ごとのHDIが、実際には州の平均収入を神秘的に変換したものでしかないことをグラフ比較で示す事例。
- 米国の失業率の時系列分析:米国の年間失業率の時系列データに適合したモデルから、予測チェックを行うためにデータを複製する事例。