上一篇文章有介紹存活分析(Survival analysis)的使用時機,但我們常常在期刊文章上看到畫所謂的「存活曲線」,我將在這一篇短文簡單介紹一下Kaplan-Meier curve

 

 

我們先看一下以下這張圖,第一欄(Week of follow-up)是duration time亦即病人存活的時間;第二欄(Number of followed)則是在某一時間點時本研究剩餘的有效樣本,亦即所有樣本扣除已經死亡(或發生Event)或者設限(Censor,例如中途轉院)者;第三欄(Number of Event occurs)則是代表在某一時間點時有多少人死亡;第四欄(Number of Censored)則是代表在某一時間點時有多少Censor,表示在那個時間點這位病人尚未發生事情,這時間代表他至少存活了這麼久的時間;第五欄(Conditional Probability)是在某一時間點的條件存活機率,等於這時間點死亡人數除以這時間點剩餘的樣本數;第六欄(Survival Function)則是累積到這個時間點為止的存活機率,上一個時間點存活機率乘以這一個時間點的條件存活機率(Conditional Probability)就剛好等於這一個時間點的存活機率,因此亦即叫作為累積存活機率(Cumulative Survival Probability)。

 

 

那麼我們可以看到,一直到第五週時,既沒有人發生event(死亡)也沒有人退出研究(censor),因此條件存活機率與存活機率都是100(我也想要上統計課程)

在第六週的時候同時發生了eventcensor兩件事情,有3個病人不幸地在第六週死亡了,以及有一位病人在第六週的時候轉院了(或者這位病人進入研究的時間比較晚,因此第六週的時候我們的研究剛好終止了,但是這位病人當時還是存活的),此時我們可觀察到條件存活機率是18/21=0.86,亦即這時間點的條件存活機率是86%,可注意到Censor的人既沒有在分子扣除也沒有在分母扣除,因此根據定義則第六週的累積存活機率是0.86(第六週的條件存活機率)*1.00(第五週的累積存活機率)=86%,也就是說累積至第六週為止的生存機率是86%;

在第七週的時候又有一位病人死亡了,此時需注意到因為第六週時有一位病人是Censor的狀態,因此在這一個時間點必須先將這個病人從這個研究移除,因此待會計算的分子與分母都必須扣除1,因此原先有效樣本為21人,但因為第六週同時有4個人退出研究(3個人死亡,1個人Censor),因此在第七週的有效樣本只剩下17個人,又由於這一週有一個病人死亡,因此第七週的條件存活機率是16/17=94%,根據定義第七週的累積存活機率為0.94(第七週的條件存活機率)*0.86(第六週的累積存活機率)=81%,也就是說累積至第七週為止的生存機率是81%;

 

 

 

此時我們可將第一個欄位存活時間(Week of follow-up)以及第六欄累積存活機率(Survival Function)在Excel畫圖,就是各位常常在Paper上看到的存活曲線了,例如我在Time=6往上畫一條線會與存活曲線交叉,再往左可以對到累積存活機率(Cumulative Survival),因此可以知道每一個時間點的累積存活機率是多少。

 

 


 

我們現在已經瞭解了 Kaplan-Meier curve如何繪製,但是當我有兩組或多組的時候,我能夠比較「哪一組比較危險」嗎?可以的,但這個我會在下一篇再介紹。

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 晨晰部落格新站 的頭像
    晨晰部落格新站

    晨晰統計部落格新站(統計、SPSS、BIG DATA討論園地)

    晨晰部落格新站 發表在 痞客邦 留言(5) 人氣()