こちらのペイパーを区切りながら進める。
導入
情報幾何学の概観
- 情報幾何学の基礎的な構造、情報幾何的多様体(情報多様体)を統計(ベイズ仮説検定)や機械学習(統計混合クラスタリング)について扱う。ノイズのあるメッセージ伝達を考える、情報理論と類似し、データとモデル族の間の連結を考える、情報科学がある。情報科学は、いわばデータから情報をモデルに蒸留させる手法を探す。情報科学は情報理論を含み、確率統計や機械学習、AI、数理計算などを含む
- 情報幾何の重要なことや、分野の定義を与える。情報幾何は現代幾何の手法で、情報の世界を探索する方法だ。確率分布間の距離の普遍性や、統計多様体について扱う。もっと狭い定義は、情報幾何は、意思決定の幾何学といえる。統計問題は統計決定問題と言える。(パラメータがどれが最も良いかを決める、など。)
類似度は、距離とも似た考えで、データとモデルへのフィットの良さの指標に出来て、モデル間の散らばりを測ることもできる。また、幾何を使えば、「図」の不変性を扱え、同時に直観的な理解に繋がる。さらに、透過性を扱える。
微分幾何学の基礎
- D次元多様体Mは、位相空間で、局所的にD次元ユークリッド空間のふるまいをするもの。幾何的物体や実在物(関数や微分作用素)は、多様体M上にあり、座標系とは切り離して考えれるけど、アトラスやチャートで表現される。(局所的には座標が大事) 情報幾何では、たいてい、一つのチャートで多様体を埋め尽くせる。
多様体は、チャート変換が
の関数の多様体。k=∞なら、滑らかという。任意の点で、接平面(場合により接超平面)は局所的に多様体を線形近似出来る。任意の滑らかな多様体で、計量テンソルg、と、アフィン結合∇、の2つの独立な構造を決めれる。計量テンソルは、内積空間を決める(これは、距離のや角度の定式化にもつながる)。アフィン結合が決めるものに、1)共分散作用素で、ベクトル空間Xに対応してベクトル空間Yの微分∇xYを出す。2)平行移動∏c∇は、接平面間を移動させる曲線上のベクトルを決める。3)∇geodesics γ∇は、自己平行曲線を決め、ユークリッドぽさを出す。4)多様体の曲率、歪み
計量テンソル場
- 多様体Mの接バンドルは、全ての接平面の集合。
。これは、D次元多様体のとき、2D次元多様体になる。接ベクトルvは方向微分の役割。vfは滑らかな関数fの微分。ベクトルは、微分幾何的には、点の上での滑らかな曲線とみる。接平面は多様体としてみる。
- 滑らかなベクトル場Xは、接平面の交差区域とみなせる。
Γ(TM)は滑らかなベクトル場の空間である。BはD次元ベクトル空間の基底集合で、極大線形独立ベクトル集合。接空間はベクトル空間の代数構造をもってる。XをD個の基底達Bで、局所座標系で表せる。ここで、Bの基底を微分演算子にしたら、contravariant vector(反変ベクトル)になる。内積を定義できる。内積空間では、(直角を定義できるから、基底に対応する)逆基底なんかも作れる。
は、反変ベクトル、共変ベクトル。
は、計量テンソル、双対計量テンソル(要は、単位共変(反変)ベクトル同士の内積)。計量テンソル
×
は、2共変テンソル場で、
である。テンソルは、多重線形写像に関わるものとして考える。反変ベクトルは、ベクトル空間にあり、共変ベクトルは、双対共ベクトル空間にある。(詳しくは踏み込まない)
- Gを計量テンソルとすると、双対計量テンソルは、Gの逆行列。共変ベクトルは、計量テンソル×反変ベクトルで和をとると出来る。反変ベクトルは、双対計量テンソル×共変ベクトルで和をとると出来る。
- 計量テンソル場gは、接バンドル上で、滑らかな対称正定値双線形形式を定める。
。g(u, v)が0なら、2つのベクトルが直交しているという。チャートの局所座標系を使って、計量テンソルを、行列代数を使って、
を作れる。G×G*=I なので、接平面Tp上で、マハラビノス距離を得られて、
。内積は、
などと書ける。(気持ち的には、共分散の形を思い出したい)
- 計量g’が計量gと、等角であることを、
とした。(これは、三角形のCosを求める時、内積を二辺の長さの積で割り算したら、出てくるもの、に似ている)。
ここまで、反変ベクトルや共変ベクトル、接バンドルなど、初めての単語も多く、まだ完全に消化出来ていないが、徐々にわかると信じて、次に進むとする。
バイバイ!