當我們有一群樣本在某一事件上的發生與否(Event or not),而且還知道持續多久的期間(Duration)才發生Event,此時我們可根據樣本此兩個依變項,畫出樣本的存活曲線(survival curves),而使用的方法為Kaplan-Meier

 

 

另外我們可以依照樣本的特徵去分群,另外可以用Log-rank去檢定不同群體在存活曲線上是否存在顯著的差異。

 

 

資料介紹

 

    資料檔是關於194個犯人的犯罪史資料,從他們離開監獄後(事件的出生),多久會再回到監獄(事件的死亡)作為研究焦點。資料中包含的變項有id(個人編號)、months(事件出生到死亡的時間)、censor(是否為censor的個案)、personal(人身犯罪)。

 

 

請以months做為依變項進行Survival Analysis,分別做出以下的Survival Function Curve

 

(1)請考量censor的情況,以KM法(Kaplan-Meier)畫出總樣本的S(t)

(2)personal作為分群(strata)的依據,以KM法(Kaplan-Meier)畫出兩群的S(t),以及兩群的同質性檢定(Log-rank test)。

 

 

在此資料中,我們必須先知道兩個變項

Duration:一位受訪者從受到觀察到事件結束的時間(事件結束的原因可能脫離了觀察或事件已發生),在以上的資料Duration為變項months

CensorCensor=1代表在研究期間事件未發生或脫離了觀察(亦表示Event=0);Censor=0代表在研究期間事件發生了(亦表示Event=1

 

 

1)語法

此處語法不再詳細介紹讀取資料檔與顯示資料檔的語法!!

以下2個語法的差別只在「personal作為分群」中多了STRATA personal;

其他全部一樣

PROC LIFETEST    執行存活分析

DATA=survival      資料集名稱為survival

METHOD=KM PLOTS=(S);     所用的方法為Kaplan-Meier

TIME months*censor(0);    指定樣本的Duration以及Event情形,當censor0時,表示樣本Event

 

第二段的語法多了STRATA personal;

表示要把資料依照personal作分群的動作!!

 

**************不分群*****************;

/*KM 存活時間曲線圖*/

PROC LIFETEST DATA=survival METHOD=KM PLOTS=(S);

TIME months*censor(0);

RUN;

************personal作為分群*************;

/*KM 存活時間曲線圖 drug分層*/

PROC LIFETEST DATA=survival METHOD=KM PLOTS=(S);

TIME months*censor(0);

STRATA personal;

RUN;

 

 

 

2)報表 (給我一堂統計課)

 

1.不分群

在報表中最重要的是圖,以及統計的摘要結果

由摘要表可知,在11.6632個月時,已有25%的人發生Event;在28.2875個月時,已有50%的人發生Event;在36個月時,已有75%的人發生Event。全部樣本平均存活時間為24.4041個月。

 


 

2.personal分群

由於Log-rank的卡方值為1.2437,未達顯著水準,表示兩組的人在存活分析上明顯地差異。

 



 

arrow
arrow
    全站熱搜

    晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()