生存関数とハザード関数

生存時間解析の話で、生存関数とハザード関数の二つが登場する。

両者の関係についてざっくり理解したい。こちら。

 

生存関数というのは、生存時間を変数にとって、その変数以上、生きられる確率はいくらかを表す。

例えば、仮に1)0歳から100歳までしか生きられないし、2)死亡率が一定の生き物がいたら、

その生存関数は0歳の時は1で、100歳の時0となる、一次関数となる。

 

ハザード関数は、生存時間は変数にとって、その変数時点まで生きたとして、その瞬間に死ぬ確率、確率密度関数を表す。

例えば、さっきの生き物なら、ハザード関数に50歳を代入したら、50歳まで生きて、50歳で死ぬ確率、となる。

50歳まで生きられる確率は、0.5。50歳から50+Δt歳の間に死ぬのは、Δt / 100 

よって、求める値は、 \lim_{\Delta t \rightarrow 0} 0.01 \Delta t / 0.5 \Delta t = 0.02

この生き物だと、年を追うごとに、ハザード関数が上昇していく。

 

気持ち的には、

大域的に、集団全体を描写するときには、生存関数みたいな、何歳以上生きてるのがどれくらい、というのが使えて、

局所的な、今何歳なんだけどどれくらい死にやすいかな、というのが使える、

というイメージ