close

 

在先前的兩篇文章已經有介紹存活分析(Survival analysis)的使用時機以及如何繪製存活曲線圖(Kaplan-Meier curve),但實務上只畫出一組的Kaplan-Meier curve似乎不夠,因為我們通常都想比較不同組別的存活狀況是否具有差異,例如實驗組與控制組是否有差異,我們意圖想證明實驗組相較於控制組有「較長的存活時間&較低的死亡機率」。

 

 

 

以下圖為例,這是一個心臟內科的data、X軸是月份,CABG指的是血管繞道手術,PCI指的是介入性治療也就是支架置放術,一共收集了190名的病患,在病人各自進行了PCICABG治療後開始計算病人的存活時間,由圖可知藍色是CABG組的Kaplan-Meier curve而綠色是PCI組的Kaplan-Meier curve。「看起來」好像是PCI組的存活曲線比較低,亦即累計的生存機率就比較低,這是否就是代表「PCI組比CABG組危險」?答案:當然不是,大家一定要記住,Kaplan-Meier curve算是一種「描述性統計」(Descriptive statistics),也就是說它本身並沒有「推論」的性質,那我們怎麼能比較「兩組的存活時間&死亡風險是否具有顯著差異」呢?答案就是:Log rank test

 

 

 

 

 

 

我們看下面這一張圖的「Time=1」,也就是在第一個月的時候,PCI組有A1人死亡、PCI組有B1人活著、CABG組有C1人死亡、CABG組有D1人活著,因此這是一張2*2的卡方分析表,所以可以計算出一個卡方值,來代表「第一個月的時候兩組在死亡是否有差異」;接著在「Time=2」的時候,扣除在第一個月死亡的人以及在第一個月Censor的人數之後,我們又可以計算出一個卡方值,來代表「第二個月的時候兩組在死亡是否有差異」,需注意第二個月的總人數是第一個月的總人數減掉第一個月的死亡人數跟Censor人數;接著我們一直計算出每一個月的卡方值,一直到第60個月(由上面的圖可知,這190位病人裡頭,最長存活時間的為60個月)。(我想要上統計課)

 

 

承上,也就是說我們會得出非常多個卡方值,此時我們就使用一種結合列聯表的統計方法叫作CMHCochran-Mantel-Haenszel)把這些很多個月份的卡方值合併成一個卡方值,當組別是兩組的時候,這個卡方值會服從1個自由度的卡方分配,若算出來的卡方大於3.84,亦即在雙尾情況之下的顯著性小於0.05,你就有充分證據可以宣稱「PCI組比CABG組危險」囉!

 

 

 

 

 

 

 

 

因此截至目前為止,你已經學會了Survival分析大部分方法,不過如果當「自變項是連續變項」時怎麼辦呢?以及當我的「自變項2個以上」的時候還能作存活分析嗎?答案是可以Cox proportional hazard regression來處理,我會再下一篇文章針對這個重要的統計模型作介紹。

 

 

arrow
arrow
    全站熱搜

    晨晰部落格新站 發表在 痞客邦 留言(7) 人氣()