前我們已經介紹time-dependent covariate的使用時機,現在我們就開始示範資料的輸入方式,仍以CABG手術為例子。

2列出四位病人的資料輸入方式,可以注意到第一位病人的資料筆數有兩筆,第一筆資料是從CABG術後(1月)到發生BSI日期(2月),第二筆資料是從發生BSI日期(2月)到病人死亡日期(5月)。首先,先關注第一筆資料,由於第一筆資料的「終點」是發生BSI2月,因此在這一筆資料上面所輸入的變項應該要算是「起點」的變項,也就是CABG術後(1月)時的變項,既然如此,由於第一筆資料尚未發生BSI感染,因此BSI這個變項就要輸入「0」,因為病人沒有死亡因此Death也為「0」;到了第二筆資料時,病人有發生BSI感染了,而且病人最後死亡,因此BSI輸入「1」且Death也為「1」。此時我們可注意到,BSI這個變項是自變項,但是它在兩筆資料的數值是會改變的(第一次是0,第二次是1),因此這就算一種「time-dependent covariate」的形式。

接著檢視第二位及第三位病人的資料,我們發現沒有特別之處,因為由於此兩位病人皆沒有發生過BSI感染,因此資料筆數都只有一筆,既然資料只有一筆,那也就沒有所謂的「會隨時間變化的變項」的存在了。

最後檢視第四位病人的資料,他/她也有兩筆資料,第一筆資料是尚未發生BSI感染的資料,從1月到5月;第二筆資料是已經發生BSI之後的那一次資料,從5月到11月,不過由於此位病人在研究截止的11月份時仍然安好無恙,因此兩筆資料的Outcomedeath)皆為「0」。

目前為止我們已經很清楚像BSI感染這種time-dependent covariate要怎麼在資料裡輸入,不過這種狀況的「Survival time」(存活時間)的輸入方式也與傳統方式有所不同,一般大家所知的存活時間就是一個欄位,定義為「從追蹤到發生事件或最後一次追蹤的時間」,而在time-dependent covariate的狀況下,存活時間的定義仍然沒有改變,但是卻是「需要兩個欄位來定義存活時間」。

存活時間分別為Start and Stop(或TL and TR,分別表示time of left, time of right),不管是如何稱呼,左邊的欄位定義為「這一筆資料的起始時間」,右邊的欄位定義為「這一筆資料的結束時間」。以圖2的病人1為例,第一筆資料是1月到2月(尚未發生BSI那一次),TLTR分別為01,而10則是一個月,代表從1月到2月;第二筆資料則是2月到5月(已經發生BSI那一次),此時的TLTR分別為14TL1是因為第二筆資料的起點是第一筆資料的終點,TR4則是因為41是三個月,代表從2月到5月。至於其他三位病人的TLTR就依此類推,不過要注意到每一個人的第一筆資料的TL一定是從零開始,也就是說,無論每一個人第一筆資料的起始日期是幾月,TL都是零。

附帶一提的是,圖2最後面有兩個變項,都是有無使用抗生素(Antibiotics),TIC指的是time-independent covariate,可注意到同一位病人的所有資料一定都相同;反之TDC指的是time-dependent covariate,跟BSI一樣可允許同一位病人的多次資料是可以改變的(有時候是1,有時候又是0)。

 

g  

2CABG術後四位病人的資料輸入方式

 

 

arrow
arrow
    全站熱搜

    晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()