存活分析在生物醫學上的應用~公衛科 陳明岐副教授
存活分析 (survival analysis) 是現今被廣泛應用在生物醫學研究上的一種統計方法。事實上,存活分析的方法論,並非只能處理與死亡有關的資料 ( 因“存活”二字所導致的誤解 ),只要清楚地定義觀測的“起始點”與該“事件(event)”發生的時間點,則“存活時間”(survival time, 簡寫為 T) 便已形成,並可以進一步計算“存活函數”或“存活機率”(survival function or survival probability,簡寫為 S(t) = P(T > t))。舉幾個例子來說:(1)對於不同的手術方法,其手術後到產生併發症的時間長短是否與手術方法有關?此例中時間的“起始點”便是手術當天,而“事件”則是併發症發生的時間點;(2)男性或女性,誰訂閱某一雜誌的時間較長?其中時間的“起始點”便是雜誌訂閱的第一天,而“事件”則是停止訂閱的那一天。此兩個例子便說明了存活分析的應用範圍,不只包含生物醫學,商業行銷的研究也適用。除此以外,“事件”也不一定要與死亡有關。因此,此分析方法亦被稱之為 failuretime data analysis。總之,研究某段時間長短的影響因素,存活分析的確是一種選擇。
然而處理時間長短,並非是存活分析的主要特色。例如:某研究者想比較兩種不同的手術方法下,病人自術後到產生併發症(事件)時間是否有差異。若所有病人皆產生併發症,且其發生的時間點亦有記錄,一般常見的 two- sample t- test (若兩組的存活時間皆服從常態分佈)或 the Wilcoxon rank sum test ( the Mann-Whitney test ) 皆是合適的統計方法。然而,一般在臨床上常見的,卻是有些人在研究結束前,根本就沒產生併發症,或是研究進行中,病人轉院而不知其是否有併發症的發生,在此情況下,其所謂的存活時間是被“設限”(censored) 的。舉例來說:若有人手術後到研究結束前,共8天中根本就沒產生併發症,則其存活時間就是8+ (亦即 T > 8 天),也就是說,如果研究可以繼續觀察下去的話,其併發症的發生一定是在8天後的某一天 (或根本沒發生),只是現在觀察不到。對於 censored survival time,若只佔一小部分,也許研究者可以選擇把它們捨棄不用,但若 censoring rate 太高,或資料得來不易,研究者就必須考慮此些censored data 的部分貢獻,因為“捨棄不用”與“知道 T > 8”在分析上的價值是完全不同的。一般的 two-sample t-test 或 the Wilcoxon rank sum test ( the Mann-Whitney test ) 是無法處理 censored data。因此,存活分析的方法論就在此突顯出其特別之處。總之,當存活時間出現censoring 而無法被忽視時,研究者就必須採用存活分析的方法。
在了解存活資料的特性後,下列將由兩個例子來說明,存活分析在基礎醫學與臨床研究的應用:
(一)線蟲 ( Caenorhabditis elegans ) 的生命週期 (life span)。線蟲是目前生命科學研究上重要的模式動物之一,也是第一個完成基因定序的多細胞生物。它的成蟲約僅1毫米長,全身透明,構造簡單,光學顯微鏡下活體觀察可達到單一細胞的解析程度。此外,它生長快速,可大量養殖,並且容易製造突變株(資料提供:解剖科柳文卿副教授)。因此,當以線蟲生命週期的長短做為量測某一基因或藥物作用之指標時,存活分析就可以派上用場。如表一列出的例子,即是根據存活時間T的長短排列,並把censoring的線蟲考慮進去,進而計算出來的存活機率 (此方法稱為 The Kaplan-Meier Method or product-limit method)。若一開始總共有11隻線蟲,第一隻死亡的線蟲共活了12天,於是活超過12天的機率就是10/11(即 P ( T > 12天) = 10/11),並依此類推到第四隻死亡的線蟲。第五隻死亡的線蟲在被觀察了19天後不見了,那這隻線蟲的存活時間 T=19+ ,也就是至少活了19天。當我們要去計算活超過20天的機率 (或稱“存活機率”, P ( T > 20天) )時,這隻被 censored 的線蟲,就不應該出現在分母中,因為我們只確定它活超過19天。所以其機率不是單純的計算剩下的4隻 (共11隻,即4/11),而是 0.5090。此方法非常繁瑣,建議以統計軟體計算以避免計算錯誤。
(二)葉等(2003)的論文主要探討的問題之一,是 「臨床上有哪些因素會影響病人在接受心臟大主動脈的手術後 (“起始點”),到其降主動脈瘤 (descending aorta aneurysm formation) 再度形成而需要第二次開刀的時間 (“事件”) 長短?」。也就是說,哪些因素會延長再度需要開刀的時間呢?在觀察的10年中,有病人需要(或已經)開刀,有些則沒有。此研究中採取 log-rank test 來比較兩條 Kaplan-Meier survival curves (“有”或“無”假性通道開放, with/without patent false lumen) 的病人其“descending aorta aneurysm formation free”的長短,並得到結論為“無假性通道開放”的病人,是比較不容易再開刀的,也就是說,其 disease free time 是比較長的。
總之,只要研究變數是“時間”並且有定義清楚的“起始點”與“事件”, 不論是否與死亡有關,存活分析都是可以廣泛被應用的方法論。
留言列表