原本: A Survey on Causal Inference (acm.org) 因果推論(コーサク推論)は、統計学、コンピュータサイエンス、教育学、公共政策、経済学など、多くの分野で長年にわたり重要な研究トピックです。近年、観察データから因果効果を推定することは、ランダム化比較試験と比較して、膨大な利用可能なデータと低予算の要求により、魅力的な研究方向になりつつあります。急速に発展している機械学習分野の恩恵を受け、観察データに対する因果効果推定手法がさまざまに考案されています。この調査では、因果推論のフレームワークとしてよく知られている「潜在的効果」フレームワークに基づく因果推論手法の包括的なレビューを提供します。手法は、潜在的効果フレームワークの3つの仮定すべてを必要とするかどうかによって、2つのカテゴリに分けられます。各カテゴリについて、従来の統計学的手法と最近の機械学習を用いた強化手法の両方について議論し、比較を行います。また、広告、レコメンデーション、医療などへの応用事例も紹介しています。さらに、ベンチマークデータセットやオープンソースコードについてもまとめており、研究者や実践者が因果推論手法の探索、評価、適用を行うことを容易にします。 1. Introduction 日常会話では、相関関係と因果関係は混同して使われることがよくありますが、実際には解釈が大きく異なります。相関関係は、2つの変数間に一般的に見られる関係を示します。例えば、2つの変数が共に増えたり減ったりするような傾向があれば、相関関係にあると言えます [7]。一方、因果関係は原因と結果の関係であり、原因がある程度結果を引き起こし、結果は原因に依存しているような関係です。因果推論とは、効果の発生条件に基づいて因果関係を結論付けるプロセスです。因果推論と相関関係の推論との主な違いは、前者が原因を変えたときに効果変数の反応を分析する点にあります [104, 150]。「相関関係は因果関係を示唆しない」というのは有名な言葉です。例えば、ある研究では、朝食を食べる女の子の方が朝食を食べない女の子よりも体重が軽いという結果が出たため、朝食はダイエットに効果があると結論付けました。しかし、実際にはこの2つの事象は相関関係にすぎず、因果関係ではない可能性があります。朝食を毎日食べる女の子は、...
コメント
コメントを投稿