データの統計的処理をするときに、人間に理解させるため・あるいは何かを強調するために、変数の数を絞り込む。
全ての変数を探索するコストがない時は、そうせざるを得ないが、得られるデータから直接的に因果構造や理解の枠組みを推定できるようにモデルを組みたい。
生物の過程が遷移現象の塊なのだとしたら、それが平衡状態で従っている分布は、エネルギーと分配関数によってモデルすることが出来る。
Quantitative trait locus, QTLとは、ある表現型の(定量的な)ばらつきに関連するDNAの領域のこと。
それで、expression quantitative trait locus, eQTLとは、mRNAの発現量のばらつきを説明づけるDNAの領域のこと。
1塩基多型(SNP, single nucleotide polymorphism)と
他の面白い文献
Gが遺伝子の配列の情報
Zが遺伝子の発現量のデータ
Yが表現型のデータ
で、
でカーネルを構成する。
そのカーネルを用いて、どれくらい表現型が近しいかをChi-square testで測る。
ここで、RNAを発現するかしないかや、どれくらい発現しているかに応じて、エネルギーが定義されているなら、
それに応じて、発現している細胞がどんな分布をしているかが、先ほどの統計力学的な世界観では出来る。