情報幾何学(導入~計量テンソル場g)

こちらのペイパーを区切りながら進める。

導入

情報幾何学の概観

  • 情報幾何学の基礎的な構造、情報幾何的多様体(情報多様体)を統計(ベイズ仮説検定)や機械学習(統計混合クラスタリング)について扱う。ノイズのあるメッセージ伝達を考える、情報理論と類似し、データとモデル族の間の連結を考える、情報科学がある。情報科学は、いわばデータから情報をモデルに蒸留させる手法を探す。情報科学情報理論を含み、確率統計や機械学習、AI、数理計算などを含む
  • 情報幾何の重要なことや、分野の定義を与える。情報幾何は現代幾何の手法で、情報の世界を探索する方法だ。確率分布間の距離の普遍性や、統計多様体について扱う。もっと狭い定義は、情報幾何は、意思決定の幾何学といえる。統計問題は統計決定問題と言える。(パラメータがどれが最も良いかを決める、など。)

    f:id:medical-science:20210829213515p:plain

    類似度は、距離とも似た考えで、データとモデルへのフィットの良さの指標に出来て、モデル間の散らばりを測ることもできる。また、幾何を使えば、「図」の不変性を扱え、同時に直観的な理解に繋がる。さらに、透過性を扱える。

微分幾何学の基礎

多様体

  • D次元多様体Mは、位相空間で、局所的にD次元ユークリッド空間のふるまいをするもの。幾何的物体や実在物(関数や微分作用素)は、多様体M上にあり、座標系とは切り離して考えれるけど、アトラスやチャートで表現される。(局所的には座標が大事) 情報幾何では、たいてい、一つのチャートで多様体を埋め尽くせる。 C^k多様体は、チャート変換が C^kの関数の多様体。k=∞なら、滑らかという。任意の点で、接平面(場合により接超平面)は局所的に多様体を線形近似出来る。任意の滑らかな多様体で、計量テンソルg、と、アフィン結合∇、の2つの独立な構造を決めれる。計量テンソルは、内積空間を決める(これは、距離のや角度の定式化にもつながる)。アフィン結合が決めるものに、1)共分散作用素で、ベクトル空間Xに対応してベクトル空間Yの微分∇xYを出す。2)平行移動∏c∇は、接平面間を移動させる曲線上のベクトルを決める。3)∇geodesics γ∇は、自己平行曲線を決め、ユークリッドぽさを出す。4)多様体の曲率、歪み

計量テンソル

  • 多様体Mの接バンドルは、全ての接平面の集合 TM = \{(p,v) , p \in M , v \in T_p\} 。これは、D次元多様体のとき、2D次元多様体になる。接ベクトルvは方向微分の役割。vfは滑らかな関数fの微分。ベクトルは、微分幾何的には、点の上での滑らかな曲線とみる。接平面多様体としてみる。
  • 滑らかなベクトル場Xは、接平面の交差区域とみなせる。 X \in \Gamma (TM) Γ(TM)は滑らかなベクトル場の空間である。BはD次元ベクトル空間の基底集合で、極大線形独立ベクトル集合。接空間はベクトル空間の代数構造をもってる。XをD個の基底達Bで、局所座標系で表せる。ここで、Bの基底を微分演算子にしたら、contravariant vector(反変ベクトル)になる。内積を定義できる。内積空間では、(直角を定義できるから、基底に対応する)逆基底なんかも作れる。

    f:id:medical-science:20210830145745p:plain

     v^i, v_iは、反変ベクトル、共変ベクトル。 g_{ij}, g^{*ij}は、計量テンソル、双対計量テンソル(要は、単位共変(反変)ベクトル同士の内積)。計量テンソル g_p : T_pM × T_pM \rightarrow \mathbb{R} は、2共変テンソル場で、 g= \Sigma g_{ij} dx_i \otimes dx_jである。テンソルは、多重線形写像に関わるものとして考える。反変ベクトルは、ベクトル空間にあり、共変ベクトルは、双対共ベクトル空間にある。(詳しくは踏み込まない)
  • Gを計量テンソルとすると、双対計量テンソルは、Gの逆行列。共変ベクトルは、計量テンソル×反変ベクトルで和をとると出来る。反変ベクトルは、双対計量テンソル×共変ベクトルで和をとると出来る。
  • 計量テンソル場gは、接バンドル上で、滑らかな対称正定値双線形形式を定める。 g_p(u, v) \in \mathbb{R} \\ u, v \in T_p 。g(u, v)が0なら、2つのベクトルが直交しているという。チャートの局所座標系を使って、計量テンソルを、行列代数を使って、 g(u,v) = (u)_B^T ×G_{x(p)}×(v)_B = (u)_{B*}^T×G_{x(p)}^{-1}×(v)_{B*}を作れる。G×G*=I なので、接平面Tp上で、マハラビノス距離を得られて、 M_G(u,v) = \sqrt{\Sigma_{i=1}^D \Sigma_{j=1}^D G_{ij}(u^i-v^i)(u^j-v^j)} 。内積は、 u^iv_i = u_iv^iなどと書ける。(気持ち的には、共分散の形を思い出したい)
  • 計量g’が計量gと、等角であることを、

    f:id:medical-science:20210831004326p:plain

    とした。(これは、三角形のCosを求める時、内積を二辺の長さの積で割り算したら、出てくるもの、に似ている)。

ここまで、反変ベクトルや共変ベクトル、接バンドルなど、初めての単語も多く、まだ完全に消化出来ていないが、徐々にわかると信じて、次に進むとする。

バイバイ!