DAGに出会った。
なんとなく向きのあって、回ってくることがない、グラフ(点と辺で結ばれているもの)であることは、わかっている。
これが因果関係とどう関係があるか、ということは全く確認していない。
そこを出発点とする。
始めましょうか。
- こちら。
と置く
- Vは頂点の集合、Eは矢(有向辺)の集合
- 頂点は変数、矢は何らかの因果関係
- Acyclic:同時に起こることはない、将来が過去に影響を及ぼさない
- 想定:
- 頂点がない。
- 全てが共通する何かから生み出されている
- 考えることがない
- 辺がない。
- 因果関係がない、零
- 頂点がない。
- Vは頂点の集合、Eは矢(有向辺)の集合
- 単語
- 3つ組の状態
- Chain、Folk、Inverted Folk
- 親、子、先祖
- 直接あるいは間接的に影響を及ぼした変数
- 道
- 因果的な道
- 非因果的な道
- 合流点Collider
- 2つ以上の矢が投射している頂点(変数)
- 3つ組の状態
- NPSEM
- ノンパラな構造方程式モデル
- 関数型を仮定しない、子雲合効果でも、どんな相互作用でも
- 尤度関数
- D分離
- A、B、Cが頂点の集合であり、以下の条件を満たす時、条件付独立となる。
- 手順1:Aの頂点からBの頂点までの道を全て調べる。
- 手順2:それぞれの道が”Blocked”か確認する
- 手順3:もし全ての道が”Blocked”なら
- AはBからCによってd分離されるという。
- 道が”Blocked”であること
- 以下の2つの場合のみ
- パターン1.Cに属する合流点でない頂点を含む
- パターン2.Cに属さない合流点を含み、合流点の子孫をCが含まない
- イメージとしては、
- パターン1は、間の点が確定すると、グラフを分けられる
- パターン2は、間の点が確定してないけど、それはCによってエンタングルする感じではない。
- Backdoor基準
- M構造、Mバイアス
- Frontdoor基準
- A、B、Cが頂点の集合であり、以下の条件を満たす時、条件付独立となる。
- Instrumental Variable(操作変数)
- d分離を使って定義づけしているがよくわからない。
- 違う文献をあたる。
- 操作変数についてはこちら。
- 通常の回帰では、疑似相関という問題がある。
- バナナを食べる量とリンゴを食べる量に正の相関があるとする。
- フルーツが好きな人は両方食べ、そうでない人はどちらもあまり食べない、という話。
- 疑似相関でない、真の影響(効果)を推定するため、片方について影響し、もう片方には影響しない、かつ、交絡因子にも関係しないものを考える。
- 知らず知らずのうちにリンゴを食べさせるとする。(これが、操作。)リンゴを食べる量は増えるが、フルーツの好きさは変化しない。
- これにより、バナナの食べる量が増えたなら、直接的な効果があった、ということになる。
- 通常の回帰では、疑似相関という問題がある。
- Concluding Remarks(結びの言葉)
- 潜在的結果
- 因果構造を考える時に便利。
- 因果の発見
- これを考えると何が嬉しいの?という意見がある。
- 確かに、基本的な道具を手に入れたら、使い方を知りたい。肌で感じることは大事。
- こちら。
- 疾病などの健康アウトカムに関する因果関係を調べたい。
- しかし、交絡因子多くて複雑。
- なので、研究仮説をわかりやすい仕方で提示する方法が欲しい
- 反事実モデル
- グラフィカルモデル
- DAG
- 思考の整理、伝達効率を上げる。
- DAG
- 拾えてなかった単語
- 裏口パスBackdoor path
- EからYの非有向パスで、Eに隣接している矢がEに向かって指しているもの
- Berkson’s paradox
- こちら。
- 合流点バイアス
- 合流点において、層別化、選抜されていることによっておこるバイアス。
- 選択バイアスの一種。
- 暗記能力と計算能力の二つを考える。そして、両者は独立であるとする。今、我々は教室にいる。
- そもそも暗記も計算もできない人は、教室にいない。
- すると、(ある意味選ばれた集団なので、バイアスがかかり、)暗記能力と計算能力との間に、見かけ上、負の相関がある。
- 裏口パスBackdoor path
一旦なんとなくわかったことにする。
DAGと推定の部分がまだ触れていないが、確率をグラフ上でいじることはわかった(つもり)なので良し。
バイバイ!