FC2ブログ

Entries

伊藤公一郎『データ分析の力』


統計的因果分析の入門書としてとても良く書けている。間違いなく、この分野に興味があれば最初に手に取るに適している。数式はほとんど用いずに、因果分析の基本的な考えを述べている。

因果分析がなぜ必要なのかから始まり、最良の方法である(p.113)ランダム化比較試験(RCT)を詳説。RCTを用いることができない場面で使える手法として、RDデザイン、集積分析を述べる。さらにパネル・データ分析(差の差法)を紹介。その後、主にアメリカ政府のデータ分析において因果分析が活かされた実践的事例。最後に因果分析への過度な期待を戒めるデータの性質についての但し書きと参考文献。

因果分析は間違いなくデータ分析の次の主要なフィールドで、とてもスリリング。ビッグデータが流行りの昨今だが、因果関係の見極め方においてはデータの量が増えても根本的な解決にはならない。私たち自身がデータを見極める力を備える必要がある(p.7)。データをたくさん集めても因果関係の解明には役立たないと、経済学では1980年ごろから言われ始めた(p.48f)。因果分析にはあまり派手さはなく、着実な理論的分析だ。しかしそのインパクトは大きい。ビジネスでも政策決定でも、我々が知りたいのは相関関係でなく因果関係なのだから。

説明は平易でわかりやすい。私は先にもっと理論的な解説でこの分野に触れていたので、とてもすんなりと読めた。説明のレベルを禁欲的に抑えている。例えばRCTは基本的にはくじ引きとして解説されている(p.91-94)。実際は各特徴量の分布が等しくなるようにしなければならないので、くじ引きではRCTを満たす集団を得るのは難しい。こうしたきちんとした話はのちになって出てくる(p.107-111)。RCTは基本中の基本でありながら、案外に守られている例は多くない。実験を行うとき、実験に協力してくれる人を集めて集団を形成する。これは自己選択のバイアスがかかる。自己選抜を含むグループ分けは、実際はビジネスでも政策決定でもよく使われている。本来はRCTを用いるべきところ(p.65-67)。

RDデザインと集積分析の解説もわかりやすい。ただ、RDデザインと集積分析の違いが見えにくい。デザインでは変数が操作できないものである(年齢とか)のに対して、集積分析では操作可能であるところにあるという(p.157f)。しかし分析の内容は同じように書かれており、これは説明としてとても分かりにくい。集積分析はだいぶ数式が必要なようで、何か裏があるのだろう。また、パネル・データ分析(差の差法)は発想がなかなか面白いけれども、パネルデータ分析の弱みが二つある(p.193f, 198f)。平行トレンドの仮定が多くの状況では成り立たないこと、および、しばしば介入開始前のデータが揃っていないこと。

自発参加型のRCTには外的妥当性(結果の外挿)が弱いという指摘がある。この場合には集団にバイアスがかかる。こうした場合、パネルデータ分析の方が外的妥当性が確保できるケースもあるという。それは強制的に外的要因によってもともと分けられてしまった集団を使うからだ。内的妥当性からはRCTは王様だが、外的妥当性を考えるとRCTがいつでも最も優れた分析手法とは言えないとの指摘は頭によく入れておく(p.242-249)。

ビジネスでも政策決定でも、エビデンスに基づくことが重視されつつある。証拠に基づく政策決定(evidence-based policy making)はオバマ前大統領の基本的な考えだった。ただ、単に数字やデータを示すことがエビデンスではない。ある政策が結果にどう影響したかという、因果関係を科学的に示すデータ分析こそが必要だ(p.207)。こうした企業内や政府内での意思決定に資するデータ分析を行うには、二つの成功の鍵があるという。データ分析専門家との協力関係を築くこと、データへのアクセスを開くこと(p.208-213)。

因果分析の実際例は著者の経験もあって、アメリカ政府での例が主。アメリカだけでなく日本でも、資源エネルギー庁が新エネルギー導入促進に関して、2009年にRCTを用いたフィールド実験による政策分析を行ったとある(p.234-236)。結果は特に記されていないのはなぜだろう。

著者は経済学者なので、因果分析の参考文献は計量経済学の基本的テキストになっている。ただ実験計画という意味では広く科学的な方法論であるし、医療分析の分野でもよく使われる。理論的にも統計的因果分析として独立したフィールドになりつつあるか。計量経済学の枠内で見るのはもったいない気がする。
スポンサーサイト
この記事にトラックバックする(FC2ブログユーザー)
http://exphenomenologist.blog100.fc2.com/tb.php/948-7f117f0d

トラックバック

コメント

コメントの投稿

コメントの投稿
管理者にだけ表示を許可する

Appendix

プロフィール

坂間 毅 (Sakama Tsuyoshi)

Author:坂間 毅 (Sakama Tsuyoshi)
数学の哲学を専攻して研究者を目指し、20代のほとんどを大学院で長々と過ごす。
しかし博士号は取らずPh.D. Candidateで進路変更。
哲学と特に関係なくIT業界に住んでいる。

別館:アマゾンのレビューページ

最新トラックバック

検索フォーム

QRコード

QRコード