因果関係とはなんだろうか? 因果だから、原因と結果の関係である。では、原因が結果に与える因果効果は、どう定式化すべきだろうか。ルービンの因果モデル(RCM: Rubin causal model)によれば、原因Xがあったときの結果Y、原因Xがなかったときの結果Yの差が、因果効果である。
$$因果効果=Y_{原因Xあり}-Y_{原因Xなし}$$
ここで因果推論の根本問題(Fundamental Problem of Causal Inference)が発生する。因果効果が直接観察できないという問題だ。なぜなら、時間の不可逆性のために「Xあり」または「Xなし」のどちらかしか観測できないからだ。
因果関係の問題は、起こらなかった別の可能性をどう考えるかという問題に帰着させる。起こらなかった別の可能性を考えることは、定性的には反実仮想(counter fanctual)と言え、定量的には潜在アウトカム(potential outcome)の推定と言える。起こらなかった別の可能性がわかれば、現実と比較してやり、その差が因果効果となる。
処置と対照
思考実験する際は、原因ありの処置(treatment)もしくは介入(intervention)、原因なしの対照(control)を比較する。
個別処置効果(ITE)
因果推論の究極目標は、個別の事例についての個別因果効果(ICE: individual causal effect)の推定である。個別処置効果(ITE: individual treatment effect)とも言われる。次の式で表現できる。iは、個別のデータ番号を意味する。しかし、これはどう頑張っても観測も推定もできない。
$$個別処置効果ITE=Y_{i,原因Xあり} -Y_{i,原因Xなし}$$
平均処置効果(ATE)
実際は、母集団についての平均因果効果(ACE: average causal effect)の推定を目指す。平均処置効果(ATE: average treatment effect)とも言われる。次の式で表現できる。ATEは観測できないが、推定できる。処置の有無をランダムに割り付け(assignment)すればよい。
$$平均処置効果ATE$$
$$=E \left[Y_{i=1,2,・・・n,原因Xあり }-Y_{i=1,2,・・・n,原因Xなし } \right]$$
処置群の平均処置効果(ATT)
母集団には、処置群と対照群がある。推定対象を処置群に限定した平均処置効果を、処置群の平均処置効果(ATT: average treatment effect on the treated)と言う。
ATEとATT
因果推論の目的によって、ATEかATTのどちらを測るべきかが変わる。例えば、貧困層に教育給付金を配布する処置で、どれくらい成績が伸びるかという因果効果を推定したい時は、ATTを測るべきだ。貧困層が処置群だ。国民全体への教育給付金配布の「平均処置効果ATE」は、そこまで高くないかもしれない。しかし、貧困層に限った教育給付金配布の「処置群の平均処置効果ATT」は、高いはずだ。そして、貧困層に限定した政策として実施したい政府としては、ATTを知りたいはずだ。