在先前的三篇文章已經有介紹存活分析(Survival analysis)的使用時機、如何繪製存活曲線圖(Kaplan-Meier curve),以及如何比較「組別」之間的存活曲線是否有顯著差異(Log-rank test),但當「自變項是連續變項」或「當自變項超過2個以上」的時候怎麼辦?在存活分析眾多方法之中,有一個最廣為應用的迴歸模型:即為Cox proportional hazard model

 

 

要認識Cox proportional hazard model,就必須把它的統計式(也可說為迴歸方程式)列出來,下圖統計式所謂的「HR」就是「Hazard Ratio」,表示在某個時間點之下會發生event的風險比,因此HR(x)就是表示在給定X值的情況之下會發生event的風險比,所謂的X值指的就是自變項(Independent variable/Covariate)的數值,例如年齡50歲就是一個X。不過我們可以從最右側的公式發現,其實它跟Linear regression的迴歸方程式很相近,只是左邊的所要求的數值有差別。

 

 

 

 

由於目前還不是我們所要的迴歸方程式,因此我們繼續轉換公式,經過一系列的轉換,我們可發現現在迴歸方程式已經很好解釋了,最後一行的公式的等號左邊的log裡頭的東西代表「在某個時間點之下給定X值的event風險比」,等號右邊的log的東西表示「在某個時間點之下,當所有predictors0時的危險比」,不過就跟所有的迴歸模式一樣,這就是截距項(Intercept),一般我們是不解釋截距項的,重點是右邊的迴歸方程式就跟Linear / Logistic regression一樣。  (我想要上統計課)

 

 

 

那麼迴歸係數數值如何解釋呢,假使說X1是連續變項(年齡),那麼年齡增加1歲時則危險比會變成Exp(β1)單位,因此也可以說增加1歲則危險比會增加Exp(β1)-1倍,不過需注意,如果年齡增加10歲那麼危險比會如何變化呢?這邊很容易會有同學搞錯,假設迴歸係數β=0.35,那麼Exp(0.35)=1.42,也就是說當年齡增加1歲時則風險比為原本的1.42倍(或者是說當年齡增加1歲時風險比增加了1.42-1=0.42倍),不過年齡增加10歲時的風險比可不是直接將10*1.42=14.2喔!而是Exp(10*β1),也就是Exp(10*0.35)=33.1倍,而這個數字會剛好等於原本的Exp(0.35)10次方!

 

 

也就是說在Cox model裡,增加1歲時的危險比為Exp(β1),但增加n歲時的危險比是Exp(β1)n!這種風險比呈現加乘(multiplicative)性的效應,是跟Logit model一樣的。

X2為例,X2=1代表男性,X2=0代表女性,此時的Exp(β1)就代表男性相對於女性的風險比,若HR顯著超過1則表示男性的風險比較高!

 

 


 


 

太好了,目前為止已經介紹了四篇關於Survival analysis的介紹文章,但其實要告訴大家,Survival analysis本身有很多的統計模式,像我們這一篇介紹的是最基礎的Cox model, 因此各位如果有興趣針對Survival analysis作研讀,在此推薦三本比較容易入門書(根據難易度排列,從簡單到難)

Singer, J. D., & Willett, J. B. (2003). Applied longitudinal data analysis: Modeling change and event occurrence New York, USA: Oxford University Press.

Kleinbaum, D. G., & Klein, M. (1996). Survival analysis: A self-learning text (2nd ed.). New York: Springer.

Hosmer, D. W., & Lemeshow, S. (1999). Applied survival analysis: Regression modeling of time to event data. NY, USA: John Wiley & Sons, Inc.

 

 

 

arrow
arrow
    全站熱搜

    晨晰部落格新站 發表在 痞客邦 留言(10) 人氣()