近來在醫學期刊上有一種統計分析越來越受矚目,它叫作「存活分析」(Survival analysis),我將在這一篇短文簡單地介紹一下存活分析的使用時機以及推薦的參考書目,之後會再作進階的介紹。

 

 

當我們的依變項(Dependent variable)是連續變項(Continuous)的時候,我們都知道可以作T-test, One-way ANOVA, Correlation, Linear Regression符合常態分佈的統計方法去分析其他自變項(Independent variable / Covariate)對依變項的差異(difference)或者是預測(Prediction);當我們的依變項是兩類的名目變項時(Binary),通常我們則會選擇Chi-square, Contingent table correlation, Cochran-Mantel-Haenszel (CMH), Logistic regression不需符合常態分佈的統計方法去分析其他自變項對依變項的差異或者是預測。但你知道嗎,在醫學統計上,常常依變項同時具有連續又具有二元類別的性質,我們用以下這一張圖作說明(引用至Lang (2006). How to Report Statistics in Medicine):

 

 


 

由圖可知,Y軸為五個受試者的編號,共包括五個獨立的樣本;X軸則是時間軸,時間從1月開始一直直到10月份研究者截止收案,我們茲將每位受試者的情形一一作說明:

 

第一位受試者:從1月開始進案(例如開刀定義為進案的條件),而不幸地,他在7月的時候expired掉了(醫學術語,表示死亡),因此我得到的訊息是這位病人最終有死亡(發生event),且存活了7個月

第二位受試者:4月進案但9月死亡,因此有發生event且存活5個月;

第三位受試者:3月的時候進案(開刀),但是截至研究者10月份截止收案的時候,3號病人尚未死亡,請注意我是說「尚未死亡」,表示說他10月之後或許會死亡,但是沒關係,至少我們得到的訊息是這位病人至少存活了7個月(因為從3月到10月,一共7個月),因此這種類型的資料叫作右設限資料(right censored),這種資料類型即為存活分析的最大特色。

第四位受試者:5月進案,在10月截止收案時他還活著,因此知道他至少存活了5個月。

第五位受試者:2月進案,但是他後來因故退出研究或消失了,譬如在醫學研究上最容易發生的就是他「轉院」了,因此院方再也收集不到這個病人的資料,但是如果去調閱病歷資料時,可以發現最後一次回診的資料是在8月份的時候,因此表示這個病人在8月份的時候還活著,因此我們得到的訊息是這位病人至少存活了6個月(因為從2月到8月,一共6個月),這也叫作右設限資料,因為病人8月之後有無死亡我們並無從得知。

 

 

因此聰明的讀者就知道為什麼我在一開始說:「依變項同時具有連續又具有二元類別的性質」了,因為「存活時間」就是連續變項,而「有無死亡」就是二元的名目變項,而存活分析可以同時處理這兩種性質的資料。那麼有人會問,為什麼不可以直接用T-test or Linear regression直接對「存活時間」作分析呢,以及為什麼不要直接以Logistic regression對「有無死亡」作分析呢?以下待我詳解:

 

 

T-test or Linear regression解之:例如你用T檢定分析男性與女性的存活時間誰比較短,如果男性的存活時間平均數顯著地比女性短,因此宣佈男性比較危險,請注意,當你用T檢定時,並無考慮「這個人有無死亡」,如果剛好女性都是「存活很久,但是都死亡」,那麼你的T檢定結論就徹底錯誤囉!

 

 

Logistic regression解之:呈上例,發現男性相較於女性的死亡勝算比(Odds Ratio, OR)為1.5倍且達顯著水準,表示男性比女性更危險。結論上基本無誤,但是有沒有想過一個狀況,假設有兩個死亡的個案,有一個是存活時間3天後死亡,另一個是存活時間300天後死亡,在Logistic regression裡頭會把這兩個人視為一樣(因為都是死亡),但在存活分析裡則會把這兩個人提供的存活時間也納入考量,因此存活分析的精準程度會優於Logistic regression

 

 

所以各位讀者看到這邊,應該就知道存活分析的適用時機,之後有機會我會再介紹存活分析的進階應用,包括Kaplan-Meier curve, Log-rank test, Cox proportional regression等,最後推薦David KleinbaumSurvival analysis: A self-learning text,是一本應用性與原理性都兼顧到的好書,非常推薦。

 

 

arrow
arrow
    全站熱搜

    晨晰部落格新站 發表在 痞客邦 留言(2) 人氣()