Skip to content

Instantly share code, notes, and snippets.

Show Gist options
  • Select an option

  • Save genkuroki/2d8909d56aeaa58747dcef962787edfd to your computer and use it in GitHub Desktop.

Select an option

Save genkuroki/2d8909d56aeaa58747dcef962787edfd to your computer and use it in GitHub Desktop.

ソース


ご提供いただいたPDFソース「Active Statistics」内で扱われているストーリーを、授業の学期および週ごとに以下に箇条書きでまとめます。この本は、応用回帰分析と因果推論のための、ストーリー、アクティビティ、問題、デモンストレーションを集めた教材です。

パート2:ストーリー、アクティビティ、問題、デモンストレーション

第3章:第1学期 (Week 1〜13)

ストーリー名 内容の概要 参照元
1 ウィキペディアの実験 (Wikipedia experiment) 寄付増加を目的としたオンライン実験のコンサルティング経験。推定された処置効果が非現実的なほど大きかった原因を、データの問題(図の形式や前提の誤り)から解明しようとする。
1936年リテラリー・ダイジェスト誌の世論調査 (Literary Digest poll of 1936) 無作為抽出(ランダムサンプリング)を用いなかったために失敗した大規模調査の有名な事例。統計的調整によってデータの問題を部分的に修正できる可能性についても触れる。
2 国連平和維持活動 (United Nations peacekeeping) 国際平和維持活動の有効性に関する研究。無作為化されていない観測研究であり、処置前変数(事前処置の指標)に基づいて処置群と対照群の事前の違いを調整する必要性を示す。
少女とスポーツ (Girls and sports) 州レベルの相関(例:Title IX施行とスポーツ参加)から、個人レベルの因果的結論を導き出すことの難しさを検討する。
3 スポーツファンの政治的志向 (Political leanings of sports fans) 政治コメンテーターの主張を検証するために、単純なデータ探索とグラフィックから何を学べるか、また加工されたデータの解釈の難しさを示す。
比較を用いてグラフを描き直す (Use comparisons to redraw a graph) 公開された心理学実験のグラフを取り上げ、比較を強調する形で描き直すことで、視覚的なパターンをより明確に捉える方法を説明する。
4 パンデミックにおける死亡率 (Death rate in the pandemic) 2020年の死亡率に関する報道(1918年のパンデミックを超えたという主張)を取り上げ、加重平均(ウェイト付き平均)の特性を理解し、年齢調整などのデータの要約方法が重要であることを示す。
ゴルトンの巨人 (Galton’s giants) フランシス・ゴルトンの「遺伝的天才」に関する研究を題材に、回帰の概念(平均への回帰)を歴史的背景とともに議論する。
5 彼らは誤った標準誤差を出した (They got the wrong standard error) 保険金請求のデータから推定された不確実性(誤差の範囲)に関する事例。不確実性の計算における単純な公式の無分別な使用の危険性を示す。
非現実的に大きな効果の主張 (Claims of implausibly large effects) 社会科学や生物学で報告された非現実的に大きな効果の主張(例:幼児期介入と成人所得、幸運のゴルフボール)を複数取り上げ、過大な推定値や、帰無仮説有意性検定(NHST)における選択バイアス(「分岐するデータの庭 (garden of forking data)」の問題)を議論する。
6 一卵性双生児の人口における割合 (Proportion of identical twins in the population) 一卵性双生児の割合を人口データから推定するために、シミュレーションを使用して応用問題に取り組むことの必要性を示す。
イノベーションのプロセスをシミュレーションする (Simulate a process of innovation) 統計的シミュレーションの使用を実証する応用例。イノベーションの導入によって利益率が上下するプロセスをモデル化し、シミュレーションを設定する際の前提条件の重要性を強調する。
7 経済から選挙を予測する際の傾き (Slope when predicting elections from the economy) 米国大統領選挙の結果(現職政党の得票率)を最近の経済成長から予測する単純な回帰モデルを分析し、回帰分析の背景を理解する。
クリントン/トランプの投票と世論調査、および平均への回帰の予測 (Clinton/Trump vote vs. polls, and predictions to the mean) 記憶クイズのデモンストレーションを使い、「平均への回帰」の概念を説明し、回帰モデルの有用性を議論する。
8 52 + 12^2 = 13^2 (アフリカの国々 in the U.N.) 分散の構成要素を加算する統計の分野を示し、標準偏差が二乗の尺度で加算されるという数学的規則を、国連加盟国の数に関する例を通じて説明する。
身長に対する収入の回帰分析 (Regression of earnings on height) 収入を身長で予測する回帰モデル(正の相関)の解釈と、このパターンに対する潜在的な理論的説明について議論する。
9 いいえ、ロナルド・レーガンは「福音派から圧倒的な支持」を得たわけではない (No, Ronald Reagan did not win “overwhelming support from evangelicals”) ジャーナリズムの主張をファクトチェックするために、回帰を純粋な記述目的で使用する例。宗教宗派ごとの共和党得票率の時系列プロットを用いて、データの傾向を記述する。
女の子を持つと保守的/リベラルになるのか? (Does having a girl make you more conservative/liberal?) 娘を持つことが親の政治的イデオロギーに与える影響に関する矛盾する研究結果を議論し、データの解釈やメディア報道の問題点を示す。
10 ランダムな試験の公平性 (Fairness of random exams) 中間試験の2つのバージョン(問題は同じだが順序が異なる)が機能的に同一であるかどうかの実験。結果が曖昧であったため、データを解釈する上での事前期待(ベイジアン的視点)の重要性を示す。
選挙予測における不確実性 (Uncertainties in election forecasts) 選挙予測の事例を取り上げ、予測の不確実性の伝播の原則を議論する。さまざまなグラフが、データと不確実性の異なる側面をどのように表示できるかを示す。
11 選挙における現職の優位性 (Incumbency advantage in elections) 米国下院議員選挙における現職の優位性の効果を、回帰分析と多重予測変数を用いて推定し、異なる時期の推定値を比較する。
容姿と教育評価 (Beauty and teaching evaluations) 教員の魅力と授業評価を予測する多重回帰モデルの係数を解釈する。回帰の係数の解釈に関する例として機能する。
12 実際の試験の点数と推測された試験の点数 (Actual vs. guessed exam scores) 学生に実際の点数と推測した点数を比較させることで、探索的分析から学ぶこと、自己評価のバイアス(過信)、そして回帰の概念を教える。
野球分析のためのモデルチェック (Model checking for baseball analytics) 統計的モデルの仮定を検討することの重要性を、外部の反例(意味をなさない示唆)を見つけ、そこからモデルの内部的な欠陥(暗黙の仮定)を特定するという形で示す。
13 世界人口の対数 (Logarithm of world population) 世界人口の時系列データに線形モデルを当てはめるために、対数変換を使用する。対数スケールでの線形モデルの解釈に焦点を当てる。
需要の価格弾力性 (Price elasticity of demand) 対数-対数スケールでの線形モデルが、需要の価格弾力性のような概念とどのように関連するかを実証し、係数の解釈を議論する。

第4章:第2学期 (Week 14〜26)

ストーリー名 内容の概要 参照元
14 偏りのある標本と信頼区間のカバレッジ (Biased samples and coverage of intervals) 現実世界の調査にはバイアスがあり、標本が母集団を完全に代表していない場合、統計的推定値の不確実性区間(信頼区間)の「カバレッジ」がどのように影響を受けるかを検討する。
才能がありすぎる問題? (The problem of too much talent?) スポーツチームのトップタレントが多すぎるとパフォーマンスが低下するという誤った研究結果を取り上げ、データに適合しない回帰モデル(この場合は二次回帰)の誤った解釈の危険性を示す。
15 期末試験の項目応答分析 (Item-response analysis of final exams) 期末試験の各問題の正答確率を全スコアに対してロジスティック回帰でフィッティングし、データの表示とモデルの適合からデータエラーや試験問題の問題点を発見する。
調査の無回答確率 (Survey nonresponse probabilities) 調査の無回答率(ウェーブ2追跡)を年齢に対してロジスティック回帰で分析する。データの偏り(ヒストグラムの奇妙なパターン)を可視化し、モデルがデータにうまく適合しない事例を示す。
16 「ホワイトハウスへの鍵」と可能な限り連続的な結果をモデル化することの優位性 (“Keys to the White House” and why it’s better to model continuous outcomes when possible) 大統領選挙の勝者を予測する二分的なルール(「ホワイトハウスへの鍵」)を議論し、代わりに連続的な結果(得票率の差)をモデル化する方が優れているという原則を強調する。
大衆のアヘン (Opiate of the masses) 政治的投票行動に関する競合する二つの概念モデル(「大衆のアヘン」対「ポスト物質主義」)を、所得と宗教的出席の交互作用項を含むロジスティック回帰を用いて分析し、データ削減ツールとしてのモデルの有用性を示す。
17 銃所有のパターン (Patterns of gun ownership) 銃所有(二項データ)と銃の数量(カウントデータ)を予測するための一般化線形モデル(ロジスティック回帰、負の二項回帰)の係数解釈を議論する。
ソーシャルネットワークの構造 (Structure in social networks) 社会的ネットワークの構造を理解するために、負の二項回帰を過分散のあるカウントデータ(知っている人の数)に適用した研究を紹介し、過分散自体が社会的構造を学ぶための重要な情報源となることを示す。
18 マルチバース、統計的有意性フィルター、フィードバックループ (The multiverse, the statistical significance filter, and the feedback loop) データのコーディングや分析の選択肢(168通りの組み合わせ)が結果に与える影響(マルチバース分析)を示し、統計的有意性のフィルターが効果量を過大評価し、研究における悪循環(フィードバックループ)を引き起こす可能性を指摘する。
幸運のゴルフボールと非現実的な効果量 (Lucky golf balls and implausible effect sizes) 非常に大きな効果を主張した「幸運のゴルフボール」実験を再検討し、研究者が統計的に有意な結果を得るために用いた可能性のある分析上の自由度(「分岐するデータの庭」)について議論する。
19 州レベルの意見を推定する (Estimating state-level opinion) 回帰と事後層別化(MRP)のより高度な使用法を紹介し、小さな地域(州レベル)の世論を推定する際に、モデルの構築とベイジアン事前分布の導入がどのように役立つかを説明する。
環境持続可能性指数と欠測データ (Environmental Sustainability Index (ESI) and missing data) 環境持続可能性指数(ESI)のデータにおける欠測値補完の問題を示し、ナイーブなデフォルトの補完モデルの問題点を診断する方法(可視化)を通じて、統計分析が測定プロセスにどのように関わるかを実証する。
20 変動する処置効果(コロナウイルス事例) (Varying treatment effects) コロナウイルス治療薬の臨床試験設計の事例。処置効果が患者の特性(治療なしで生存するか死亡するか)によって大きく異なりうるというシナリオを提示し、効果量の変動を考慮することの重要性を示す。
投票順序効果 (Ballot-order effects) 投票用紙上の候補者名の順序が選挙結果に与える因果効果に関する研究をレビューする。潜在的アウトカムモデル(もし別の順序だったらどうなっていたか)の考え方を強調する。
21 害虫駆除実験:乗法的な処置効果の推定 (Pest control experiment: estimating a multiplicative treatment effect) ゴキブリが蔓延するアパートでの害虫駆除実験を取り上げ、対数スケールでの線形モデル(乗法的な効果)の因果推論への応用を議論し、処置前後の測定の重要性を示す。
ソーシャルペナンブラと小さな効果 (Social penumbras and small effects) ソーシャルペナンブラ(知人の輪)に関する調査データを使用し、ペナンブラへの加入が政治的態度に与える影響を回帰モデルで分析する。効果量が非常に小さい場合の測定の課題と統計分析の限界を示す。
22 心臓ステント研究における見かけ上のゼロ効果 (Apparent null effects in a study of heart stents) 心臓ステントの臨床試験(ORBITA)の事例をレビューする。当初ゼロ効果が報告されたが、処置前変数を調整することで有意性が高まる可能性を議論し、小さな実験における帰無仮説の解釈の難しさを考察する。
新入生の誤謬 (The freshman fallacy) 統計的有意性フィルターや柔軟な分析ルール(分岐する小道の庭)によって、実際には効果が小さいか存在しない研究から、見かけ上大きく変動する効果が報告される問題(例:排卵と服装の選択)を議論する。
23 政策実験の遡及的対照評価 (Retrospective controlled evaluation of a policy experiment) アフリカのミレニアム・ビレッジ・プロジェクト(MVP)の遡及的評価の事例。観測研究におけるマッチング法を用いた因果推論の課題と、複雑な介入の効果を推定する難しさについて議論する。
郵便局のモデリング (Postal service modeling) 郵便料金の弾力性推定に関するコンサルティング事例。調査サンプリングの問題から始まり、最終的に観測データを用いた弾力性推定(例:燃料費が郵便コストに与える影響)のための観測研究の重要性に焦点が移った。
24 死刑の抑止効果 (Deterrent effect of the death penalty) 死刑が殺人率に与える因果効果に関する研究をレビューし、観測データから因果的結論を導き出す際の複雑さと、トレードオフを伴う意思決定(抑止効果と冤罪のリスク)について議論する。
回帰不連続デザインの失敗例 (Regression discontinuity mishaps) 回帰不連続デザイン(RD)が適切に機能しない複数の事例(例:中国の石炭暖房政策、選挙前の医療利用)を紹介し、モデルの仮定が重要であること、そして統計分析がどのように誤りを生み出しうるかを示す。
25 葉の芽吹き日の非線形パターン (Nonlinear patterns in leafout dates) 樹木の葉の芽吹き日と気温の関係に関する生物学のデータを取り上げ、非線形データに対して線形モデルを当てはめ続けると、科学的結論を誤らせる可能性のある人工的なパターン(アーティファクト)が生じることを示す。
州知事選挙と寿命 (Governors’ elections and lifespans) 知事選挙の当選が寿命を延ばすという主張を含む研究を、Loess回帰などの非線形モデルを用いて探索的に分析し、元のモデルの適合が不適切であった可能性について議論する。
26 国際開発における無作為化比較試験の浮沈 (Randomized trials in international development) 国際開発における無作為化比較試験(RCT)の歴史的な浮き沈みをレビューし、因果推論の基準としてのRCTの重要性を再確認するとともに、社会科学における観測研究の立ち位置を議論する。
ハーバード大学の研究:ノースカロライナ州は北朝鮮より非民主的か? (Is North Carolina less democratic than North Korea?) 選挙の公正さに関する専門家指数に基づく論争の的となった研究を批判的に検討する。北朝鮮のような国の回答率が極端に低いことなど、データ収集とデータ品質の根本的な問題に焦点を当てる。
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment