ただのメモ

他の人に見せても良い方のメモ

Directed Acyclic Graph

DAGに出会った。

なんとなく向きのあって、回ってくることがない、グラフ(点と辺で結ばれているもの)であることは、わかっている。

これが因果関係とどう関係があるか、ということは全く確認していない。

そこを出発点とする。

始めましょうか。

  • こちら。
  •  G = (E, V)と置く
    • Vは頂点の集合、Eは矢(有向辺)の集合
      • 頂点は変数、矢は何らかの因果関係
    • Acyclic:同時に起こることはない、将来が過去に影響を及ぼさない
    • 想定:
      • 頂点がない。
        • 全てが共通する何かから生み出されている
        • 考えることがない
      • 辺がない。
        • 因果関係がない、零
  • 単語
    •  3つ組の状態
      • Chain、Folk、Inverted Folk
    • 親、子、先祖
      • 直接あるいは間接的に影響を及ぼした変数
      • 因果的な道
      • 非因果的な道
    • 合流点Collider
      • 2つ以上の矢が投射している頂点(変数)
  • NPSEM
    • ノンパラな構造方程式モデル
    • 関数型を仮定しない、子雲合効果でも、どんな相互作用でも
    • 尤度関数 P(X_1, \cdots X_J )= \prod_{j=1}^J P(x_j | pa(X_j))
  • D分離
    •  A、B、Cが頂点の集合であり、以下の条件を満たす時、条件付独立となる。
      • 手順1:Aの頂点からBの頂点までの道を全て調べる。
      • 手順2:それぞれの道が”Blocked”か確認する
      • 手順3:もし全ての道が”Blocked”なら
      • AはBからCによってd分離されるという。
    • 道が”Blocked”であること
      • 以下の2つの場合のみ
      • パターン1.Cに属する合流点でない頂点を含む
      • パターン2.Cに属さない合流点を含み、合流点の子孫をCが含まない
    • イメージとしては、
      • パターン1は、間の点が確定すると、グラフを分けられる
      • パターン2は、間の点が確定してないけど、それはCによってエンタングルする感じではない。
    • Backdoor基準
    • M構造、Mバイアス
    • Frontdoor基準
  • Instrumental Variable(操作変数)
    • d分離を使って定義づけしているがよくわからない。 
    • 違う文献をあたる。
    • 操作変数についてはこちら
      • 通常の回帰では、疑似相関という問題がある。
        • バナナを食べる量とリンゴを食べる量に正の相関があるとする。
        • フルーツが好きな人は両方食べ、そうでない人はどちらもあまり食べない、という話。
      • 疑似相関でない、真の影響(効果)を推定するため、片方について影響し、もう片方には影響しない、かつ、交絡因子にも関係しないものを考える。
      • 知らず知らずのうちにリンゴを食べさせるとする。(これが、操作。)リンゴを食べる量は増えるが、フルーツの好きさは変化しない。
      • これにより、バナナの食べる量が増えたなら、直接的な効果があった、ということになる。
  • Concluding Remarks(結びの言葉)
    • 潜在的結果
    • 因果構造を考える時に便利。
    • 因果の発見
  • これを考えると何が嬉しいの?という意見がある。
    • 確かに、基本的な道具を手に入れたら、使い方を知りたい。肌で感じることは大事。
  • こちら。
  • 疾病などの健康アウトカムに関する因果関係を調べたい。
    • しかし、交絡因子多くて複雑。
    •  なので、研究仮説をわかりやすい仕方で提示する方法が欲しい
      • 反事実モデル
      • グラフィカルモデル
        • DAG
          • 思考の整理、伝達効率を上げる。
      • 拾えてなかった単語
        • 裏口パスBackdoor path
          • EからYの非有向パスで、Eに隣接している矢がEに向かって指しているもの
        • Berkson’s paradox
          • こちら。
          • 合流点バイアス
            • 合流点において、層別化、選抜されていることによっておこるバイアス。
          • 選択バイアスの一種。
          • 暗記能力と計算能力の二つを考える。そして、両者は独立であるとする。今、我々は教室にいる。
          • そもそも暗記も計算もできない人は、教室にいない。
          • すると、(ある意味選ばれた集団なので、バイアスがかかり、)暗記能力と計算能力との間に、見かけ上、負の相関がある。

一旦なんとなくわかったことにする。

DAGと推定の部分がまだ触れていないが、確率をグラフ上でいじることはわかった(つもり)なので良し。

バイバイ!