Cox proportional hazard modelCox 比例危險模式,接下來簡稱 Cox model)是目前非常廣泛使用的存活分析的方法,下圖灰色長條對應左邊的 Y 軸,至 2018 年為止,每年已有超過 1 萬個文件可在 PubMed 搜尋到。

 

1.jpg

 

然而 Cox model 本身有一些模型的假設,其中最重要、也是最被常期刊審查者所問到的就是比例危險假設(proportional hazard assumption; 以下簡稱 PH assumption)。這個假設的意思是:我們所得到的迴歸係數(危險比)在各個時間點是恆常的。

舉例而言,我們現在解釋變項是治療組別(新藥組 vs. 舊藥組),假設我們跑 Cox model 得到危險比(hazard ratio; HR)為 1.5 倍(迴歸係數為 0.405),那麼 PH assumption 是假設這個 1.5 倍的危險比在每一個時間點都一樣。然而,這個假設不盡然每次都會成立。

檢視 PH assumption 主要分成主觀的圖形檢查以及客觀的統計檢定,主觀圖形檢查大致上可分成兩種,首先是「log (-log) survival curve」,一般是透過沒有 PH assumption Kaplan-Meier 所估計的存活曲線再去作兩次的對數轉換。第二種圖形檢查方式則是檢視 Cox model 所預測的存活曲線以及實際資料的Kaplan-Meier 之間的落差。有興趣的讀者可以參考 Kleinbaum and Klein 的著作第四章,裡頭有詳細說明以及常用統計軟體的語法,包括 SPSSSASSTATA R1

本篇文章筆者預計介紹的是以客觀的統計檢定來評估 PH assumption。目前最常使用的也有兩種方法,第一種是「Schoenfeld residual」的相關法,第二種是「Interaction with survival time」。

 

111.jpg

 

  • 檢視 Schoenfeld residual 與發生事件時間的相關

Schoenfeld residual 可以用在多變項 Cox model,也就是在方程式中可以一次放多個的解釋變項。需注意,Schoenfeld residual 是只有發生事件的研究對象才會有,而且每個解釋變項都會有一個 Schoenfeld residual

Schoenfeld residual 是指第 i 個發生事件的研究對象在第 t 個時間點時,他/她的解釋變項的值去減掉在第 t 個時間點時仍在追蹤中研究對象的解釋變項的加權平均數,而權重為個別仍在追蹤中研究對象的危險(hazard)。

中文很繞口,Kleinbaum and Klein 書中原文為:Suppose subject i has an event at time t. Then his/her Schoenfeld residual for explanatory variable is his/her observed value of explanatory variable minus a weighted average of the explanatory variable for the other subjects still at risk at time t. The weights are each subject’s hazard.

假使某個解釋變項的 PH assumption 確實成立,那麼此解釋變項的 Schoenfeld residual 應該會與發生事件時間之間沒有相關性才對。也就是說,如果呈現這些殘差和發生事件時間的散佈圖,它們應該要呈現一種無序的狀態。

具體的步驟如下,首先跑一個 Cox model,針對每一個發生事件者的每一個解釋變項都得到 Schoenfeld residual;第二步,針對發生事件者的存活時間遞增排序,最早發生事件者排 1、接著排 2…以此類推。然後直接用 Pearson’s correlation 檢定 Schoenfeld residual 與排序後存活時間的相關是否顯著。

 

  • Scaled Schoenfeld residual

Grambsch and Therneau 1994 年進一步提出 scaled Schoenfeld residual,他們文章證明如果在 Cox PH model 中所得到的迴歸係數確實與存活時間沒有相關性(另外一種講法是,迴歸係數的大小不隨著時間而改變),那麼 scaled Schoenfeld residual 的平均數會等於零2

如果將圖形描繪出,假使 PH assumption 確實成立,那麼 scaled Schoenfeld residual 與存活時間的點應該會散佈在 Y=0 的附近,而且呈現隨機分佈的型態,Grambsch and Therneau 則是提供一個卡方檢定,該檢定的虛無假設是隨機分佈,若得到一個不顯著的卡方值,就代表無法拒絕 PH assumption

Schoenfeld residual 的詳細技術細節可以參閱 Schoenfeld 的原文3,或是網路的介紹,例如 https://reurl.cc/7ynZ6D 或是 https://reurl.cc/0DQVYK 都有深入淺出的介紹。

 

  • Interaction with survival time

除了 Schoenfeld residual 的方式,另外還有一種方式是在 Cox model 中,增加解釋變項與存活時間的交互作用項。在交乘項中的存活時間,比較常見的作法是會先做自然對數轉換,也就是 ln (survival time) * X

此外,可以同時間考慮多個交互作用項,也就是說可以一次檢定多個解釋變項是否符合 PH assumption。實際使用上,這個作法有個相對於 Schoenfeld residual 有優勢的地方,就是若同時檢定了多個交互作用項,可以使用聯合檢定去看「整體而言,整個模式是否符合 PH assumption」。

若聯合檢定不顯著,那就代表無法拒絕 PH assumption;倘若聯合檢定顯著,那麼可以再使用 backward elimination 把不顯著的交互作用項剔除,即可知道是哪些交互作用達顯著1。或是更簡單的作法,就看每一個交互作用項個別是否顯著。

上述在模式中新增與存活時間的交互作用的作法,雖然使用上方便,但是這個檢定比較敏感,通常會得到比較顯著的結果。

之後筆者會再撰寫上述方法在免費的 R 軟體如何實現,以及介紹當 PH assumption 違反時,應該如何因應。

 

參考文獻
1.Kleinbaum DG, Klein M. Survival analysis. New York: Springer; 2010.
2.Grambsch PM, Therneau TM. Proportional hazards tests and diagnostics based on weighted residuals. Biometrika. 1994;81(3):515-526.
3.Schoenfeld D. Partial residuals for the proportional hazards regression model. Biometrika. 1982;69(1):239-241.
 

arrow
arrow
    全站熱搜

    晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()