在先前的兩篇文章已經有介紹存活分析(Survival analysis)的使用時機以及如何繪製存活曲線圖(Kaplan-Meier curve),但實務上只畫出一組的Kaplan-Meier curve似乎不夠,因為我們通常都想比較不同組別的存活狀況是否具有差異,例如實驗組與控制組是否有差異,我們意圖想證明實驗組相較於控制組有「較長的存活時間&較低的死亡機率」。
以下圖為例,這是一個心臟內科的data、X軸是月份,CABG指的是血管繞道手術,PCI指的是介入性治療也就是支架置放術,一共收集了190名的病患,在病人各自進行了PCI或CABG治療後開始計算病人的存活時間,由圖可知藍色是CABG組的Kaplan-Meier curve而綠色是PCI組的Kaplan-Meier curve。「看起來」好像是PCI組的存活曲線比較低,亦即累計的生存機率就比較低,這是否就是代表「PCI組比CABG組危險」?答案:當然不是,大家一定要記住,Kaplan-Meier curve算是一種「描述性統計」(Descriptive statistics),也就是說它本身並沒有「推論」的性質,那我們怎麼能比較「兩組的存活時間&死亡風險是否具有顯著差異」呢?答案就是:Log rank test
我們看下面這一張圖的「Time=1」,也就是在第一個月的時候,PCI組有A1人死亡、PCI組有B1人活著、CABG組有C1人死亡、CABG組有D1人活著,因此這是一張2*2的卡方分析表,所以可以計算出一個卡方值,來代表「第一個月的時候兩組在死亡是否有差異」;接著在「Time=2」的時候,扣除在第一個月死亡的人以及在第一個月Censor的人數之後,我們又可以計算出一個卡方值,來代表「第二個月的時候兩組在死亡是否有差異」,需注意第二個月的總人數是第一個月的總人數減掉第一個月的死亡人數跟Censor人數;接著我們一直計算出每一個月的卡方值,一直到第60個月(由上面的圖可知,這190位病人裡頭,最長存活時間的為60個月)。(我想要上統計課)
承上,也就是說我們會得出非常多個卡方值,此時我們就使用一種結合列聯表的統計方法叫作CMH(Cochran-Mantel-Haenszel)把這些很多個月份的卡方值合併成一個卡方值,當組別是兩組的時候,這個卡方值會服從1個自由度的卡方分配,若算出來的卡方大於3.84,亦即在雙尾情況之下的顯著性小於0.05,你就有充分證據可以宣稱「PCI組比CABG組危險」囉!
因此截至目前為止,你已經學會了Survival分析大部分方法,不過如果當「自變項是連續變項」時怎麼辦呢?以及當我的「自變項2個以上」的時候還能作存活分析嗎?答案是可以Cox proportional hazard regression來處理,我會再下一篇文章針對這個重要的統計模型作介紹。

感謝關於long rank test 與Kaplan-Meier curve 的說明。可否能進一步說明...在SPSS 裡的點選順序..可以給一個範例?..以免自行操作有或跟老師presen操作失誤或被老師狂.電...
你好: long rank test 與Kaplan-Meier curve的SPSS操作,你可於網路上搜尋,會有很多相關的教學資料哦,我們部落格主要目標並不是在教學統計軟體操作教學,而是概念上的澄清,加油喔!
Hello Robert Wang: 這個網址有詳細的資訊,不過是用語法作的,你可以參考: http://www.ats.ucla.edu/stat/spss/examples/asa2/chap2.htm
請問 "若算出來的卡方大於3.84,亦即在雙尾情況之下的顯著性小於0.05" 這裡的3.84 跟 0.05是怎麼得到的
你好: 因為統計學家們證明,當自由度為1的時候,卡方值如果等於3.84,則雙尾p值會是0.05; 若卡方值大於3.84,則雙尾p值會小於0.05。 p
老師您好,有問題想麻煩您幫忙,我現在手上有一組資料120個病人,分成二組,實驗組有介入一項治療而對照組沒有,想用存活分析二組存活率是否有差異。我的問題是:結束時間我可以自己定義嗎?假設定義為60天可以嗎(收案至60天內病患若發生死亡event=1)?本來想定義結束時間在病人出院,可是有些病人因為照顧因素而在醫院多住很久,會導致病人住院天數差異較大,想知道自己定義結束時間合理嗎?另外,這60天內病人就算早已出院,只要有回來門診存活時間是不是都算60?感謝喔^^
你好:第一個問題答案是可以的,可以自訂60天的存活時間,也就是對個別病人而言,最長存活時間就是60天;第二個問題也是正確的,由於病人未發生event因此存活時間是60天。
在先前的兩篇文章已經有介紹存活分析( ...《詳全文》
您好!讀過您的文章後,概念清楚許多,感謝您的分享。有個問題想向您請教:如果兩組生存曲線呈現交叉形狀(圖形有點像y=1(-1
您好: 這種狀況有可能是該變項違反了proportional hazard的假設,可以在Cox model裡將其設定為time-dependent covariate,有可能可以得到更精確的估計結果。
*****
*****