よんだほん

本の内容をすぐ忘れちゃうので、記録しておくところです。アフィリエイトやってません。念のため。

データ分析の力 因果関係に迫る思考法

 経済学部だった。でも数字は嫌いだった。計量経済学はもう名前からしてヤバいと思って授業すら取らなかった(必修じゃなくて良かった・・・)。ところが社会に出てみると(というか公共政策業界に身を置くと)、エビデンスがなければ話にならない。しかもそのエビデンスは、定性的なものよりも定量的なもののほうが納得感を得られる傾向にあると思う(本来アカデミックな世界では、定性と定量のどっちが優れているとかは無いと思うのだが)。

 この本は「思考」法とはあるものの、その多くは計量経済学の分析手法の紹介である。その上で、データ分析に注意すべき視点が紹介されているという構成かと思う。なお、数式を使わず、言葉のみでその考え方を丁寧に表現しているので、非常にとっつきやすく、読みやすい。各章にまとめも記載されている。筆者が狙っているとおりだが、入門書として、とても良いと思う。

 公共部門は、データをたくさん持っているがその分析はあまりできていないのが正直なところだろう。あるいはデータのとり方が、あまり分析には適した形になっていないケースもみられると思う(これは実体験に近い)。個人情報等の壁もあろうが、可能な範囲でデータを収集しておくと、後ほど役に立つ、なんてこともありそうだ。その意味で、普段の仕事の仕方が問われるところだと思う。

 以下メモ。ビジネスにも公共政策にも使える分析手法なのだが、個人的都合上、「公共政策」を主語としてメモしておきたい。

1 データ分析手法
(1)ランダム化比較実験(RCT)
 実際に実験を行う手法。政策を反映させるグループ(介入グループ)と、そうでないグループ(比較グループ)を作る。(この際、恣意的なグループ分けにならないよう注意)。政策介入後、グループ間を比較して、差が発生していれば、その政策の効果がそこに現れているとする手法。実際に実験をする手法なので、非常にコストがかかったり、実現不可能な場合がある。
(2)RDデザイン
 実際に実験できない場合に使う手法①:データの中の境界線を使い、その境界線の両側でどのような違いが生まれているかを見出す。書籍内で紹介されていたのは、例えば70歳を境に自己負担額が変わる高齢者の病院受診率への影響など。
(3)集積分
 実際に実験できない場合に使う手法②:階段状のデータを使い、その階段ごとにどのようなデータの集積があるか見出す。書籍内で紹介されていたのは、自動車の重量と、排気ガス規制に関する因果関係。
(4)パネルデータ分析
 実際に実験できない場合に使う手法③:同じトレンドを持つ複数のグループの、複数期間のデータを使い、介入が起きた場合に、一方のグループのトレンドに変化があれば、政策効果があった(因果関係があった)と見なす手法。実際には、「同じトレンド」を持つデータが該当するケースは少なく、利用できないことが多い。

2 データ分析で何に注意しなければならないのか、限界があるのか
・相関関係は、因果関係とは違う。因果関係を分析するのが、RCT等の手法。
・特にRCT以外の分析手法について、データ分析をどこまで完璧に行ったとしても、あくまでそのデータ元の条件で分析されたのであって、それが他の事例に適用するかはまた別(他の市町村でうまくいったことが、自分のまちでうまくいくかは別問題みたいな話)。
・データをできうる限りオープンにしていくことが必要。
・抱え込んだデータがあっても分析できなければ意味はない。単にデータや数字があってもそれはエビデンスにはならない。