生存時間解析の話で、生存関数とハザード関数の二つが登場する。
両者の関係についてざっくり理解したい。こちら。
生存関数というのは、生存時間を変数にとって、その変数以上、生きられる確率はいくらかを表す。
例えば、仮に1)0歳から100歳までしか生きられないし、2)死亡率が一定の生き物がいたら、
その生存関数は0歳の時は1で、100歳の時0となる、一次関数となる。
ハザード関数は、生存時間は変数にとって、その変数時点まで生きたとして、その瞬間に死ぬ確率、確率密度関数を表す。
例えば、さっきの生き物なら、ハザード関数に50歳を代入したら、50歳まで生きて、50歳で死ぬ確率、となる。
50歳まで生きられる確率は、0.5。50歳から50+Δt歳の間に死ぬのは、Δt / 100
よって、求める値は、
この生き物だと、年を追うごとに、ハザード関数が上昇していく。
気持ち的には、
大域的に、集団全体を描写するときには、生存関数みたいな、何歳以上生きてるのがどれくらい、というのが使えて、
局所的な、今何歳なんだけどどれくらい死にやすいかな、というのが使える、
というイメージ