- 木構造を上手く埋め込む方法について勉強する。
- こちら。
- その前に、医療行為について考えてみる。
- 医者(たち)は、患者が来た時、検査や診察をする
- 患者にまつわるあらゆる情報の組が、高次元空間にあるとする
- 一つ一つの検査・診察は、その高次元空間の部分空間を指定する
- 例えば、
- 男か女かという情報と、年齢という情報の組が作る空間は、2次元空間にあるとする。
- そこで、医者が、男か女かを聞く。患者は男という。
- その時、男という情報が確定して、患者の情報の組の片方が指定される。
- それにより、後は、年齢という情報の作る、1次元空間のみを考えることになる。
- その空間が膨大なので、木にしたり、して、気にすることの数を制限している。
- 病気が高次元空間にあり、詐病が原点にある。とすると、座標の取り方はどうしたらよいか。どこにどんな病気があるか。各病気は、点か、広がりか、付加的構造はあるか?ということが気になる。
- 例えば、
- 木にしたときに、もとの空間では、どんな配置だっただろうか、ということが気になることがある。
- 葉の距離が気になるとき
- 木での距離と、高次元空間での距離との違い
- 葉の距離が気になるとき
- 一つ一つの検査・診察は、その高次元空間の部分空間を指定する
- 患者にまつわるあらゆる情報の組が、高次元空間にあるとする
- まえおきが長くなったが、とりかかるとする。
- 次元削減
- 概要
- 高次元データがある。
- そのデータは、固有の低次元での表現がある。
- 低次元での表現は、もとの構造を保持している
- 大概、全ての構造を保持するのは、無理。
- なの上手く埋め込む方法について勉強する。
- こちら。
- その前に、医療行為について考えてみる。
- 医者(たち)は、患者が来た時、検査や診察をする
- 患者にまつわるあらゆる情報の組が、高次元空間にあるとする
- 一つ一つの検査・診察は、その高次元空間の部分空間を指定する
- 例えば、
- 男か女かという情報と、年齢という情報の組が作る空間は、2次元空間にあるとする。
- そこで、医者が、男か女かを聞く。患者は男という。
- その時、男という情報が確定して、患者の情報の組の片方が指定される。
- それにより、後は、年齢という情報の作る、1次元空間のみを考えることになる。
- その空間が膨大なので、木にしたり、して、気にすることの数を制限している。
- 病気が高次元空間にあり、詐病が原点にある。とすると、座標の取り方はどうしたらよいか。どこにどんな病気があるか。各病気は、点か、広がりか、付加的構造はあるか?ということが気になる。
- 木にしたときに、もとの空間では、どんな配置だっただろうか、ということが気になることがある。
- 葉の距離が気になるとき
- 木での距離と、高次元空間での距離との違い
- 高次元データがある。
- 概要
- まえおきが長くなったが、とりかかるとする。
- 次元削減
- 埋め込みの混雑問題
- Force based
- SNEとその類い
- 近い点には、引力を、遠い点には、斥力を与えることで、近さ、遠さを保持した埋め込みをする
- 斥力と引力とのバランスを保つのが難しい
- 斥力が弱いと、混ざるし、
- 斥力が強いと、塊ができすぎる
- クラスタリングは、混ぜるか離すかの制御が難しい。
- SNEとその類い
- Tree Preserving Embedding
- 単語を拾う
- アルゴリズム
- 初期化
- 合体させるくらすたーの組を作る
- 合体させる
- 指標を更新する
- 合体させたクラスターに対してultrametric distanceを見つける
- 埋め込む
- 埋め込みしたものをを返す
- 描こうと思ったが、階層的クラスタリングの勉強がまだなので、その時にする。
バイバイ!