物理は体系だっていて、かなり厳密なスタイルだ。
生物はモゾモゾしていて、体系がまだない。
もしかしてだが、チャンスは生物にあるのかもしれない。
参考文献はこちら。
統計多様体と指数型分布族
(確率分布を要素と持つ多様体)
測度空間で、
が測度空間上の確率密度関数の集合
その部分集合Mで、という座標系を用意すると、Mは統計多様体っぽくなる(十分な滑らかさが厳密には必要)。
例えば、Gauss分布の集合は、平均と分散の2つのパラメータについて、2次元多様体と思える。
また、他の分布についても、全体での積分値が1になるという制約があることを考慮する。
(無限次元Banach多様体については、後に記述する)
次に統計的多様体の中の、特徴である指数型分布族について
統計的多様体Mについて、
という形で表せたら、指数型分布族であるという。
正の確率分布全体は、指数型分布族である。
指数型分布族のパラメータの塊を、自然座標系という。
Fisher計量
統計多様体について
を成分とする行列を、Fisher情報行列という。この行列が多様体の各点において定まる。
ここで、
言い換えると、確率密度関数の対数のパラメータによる偏微分を全てのパラメータに対して用意し、それらの積の期待値を成分にする行列。
この行列は半正定値である、2階共変テンソルとなっている。このRiemann計量をFisher計量という。
実は、Fisher計量の定義の仕方は別の方法もある。
という性質もあり、これによってある球面の計量に一致する。
Fisher計量の不変性があって、データや測度(dominating measure)の変換に対して、Fisher計量が不変である。つまり、最初の測度空間の部分を変更しようとしまいと、パラメータに依存しないなら、Fisher計量は変わらない、ということ。
α接続について
今までは統計多様体とその局所的な情報であるFisher計量について見てきた。
この局所的な情報同士がどう繋がっていくかが、全体の理解のために必要である。
affine接続、共変微分、接続係数
"""
∇に対し、affine座標系であるとは、接続係数が0となること。∇平行
∇が平坦であることは、∇-affineであること。
"""
各点の接ベクトルを考える写像を、ベクトル場という。
m個の関数を使って、
と変換する。
ここで、2つのベクトル場を、1つのベクトル場に対応させる写像を考える。(共変微分)
において、接続係数で表現できるとき、あファイン接続という。
こういう接続の仕方によって、ちょっとだけ離れた2点の接空間の間の線形な対応が得られる。
ここで、接続係数をαなるパラメータで特徴づけた形を考える。そういう接続の仕方をα接続という。
その要素に、e接続やm接続がある。
双対性とKL divergenceがある。