三、MethodsItem no. 4-9

第二個部分是方法,多達 9 項(4-12),是 TRIPOD 最主要的內容,所以筆者分成兩篇撰述,以下分別解釋。

4a」描述資料來源,例如是單一機構收案的世代、登錄資料或是其他資料來源。這邊值得注意的是,如果有用外部驗證(External validation),那麼用於外部驗證的資料來源也要交代,通常會是另外一家醫院或是其他國家的資料做為外部驗證使用。「4b」則是關於研究收案的起迄時間,倘若是追蹤型研究(結果變項是預後),那麼也要交代追蹤的截止日期。

5a」提供研究收案的主要情境,例如是在醫院收案的話,必須交代是住院收案或是門診收案。另外,也要提供收案機構的數量以及所在位置。「5b」是關於收案對象的收案與排除條件必須詳細說明,建議可以用流程圖作為說明。「5c」提供主要的治療/介入,對於診斷型結果變項(橫斷面)一般比較不適用,對於預後型結果變項(帶有追蹤時間)通常也只有辦法提供收案當時的用藥與治療情形。

6a」必須清楚地定義結果變項,包含評估的方式以及時間點。在診斷型結果變項來說,必須確認預測變項與結果變項評估的時間點是在同時間點,或是預測變項的評估時間點早於結果變項,否則可能會有因果錯置的偏差。「6b」則是關於結果變項評估的盲性,這邊指的是要確保結果變項的評估不會受到預測變項的影響,尤其是具有主觀性的結果變項,例如特定的死亡原因。理想化的情況是,在研究中結果變項的評估必須獨立施測,例如由兩名以上的評估者或是有一個評估委員會,但根據筆者的經驗,很少研究可以作到這一點。

7a」仔細描述預測變項的評估方式與時間點。「7b」則是關於用於多變項預測模式的預測變項與其他共變項(Covariates)之間是否具有盲性,尤其是當預測變項是具有主觀性的評估性質時,例如影像、心電圖與病理報告檔,不過根據筆者經驗,也是很少研究可以作到這一點。相較之下,客觀的預測變項就不會受到這一點的限制,例如年齡、性別與量化的抽血/尿液檢驗結果。

8 點是關於樣本數的估算。這邊要分成幾個情況來提,如果是回溯型的資料類型,例如像是已經完成的臨床試驗或是例行性蒐集的資料(Routinely collected data,例如登錄研究或是健保資料庫),在該研究尚未開始之前,資料就已經蒐集完畢,這種情況就應該直接用所有資料去分析。只有在計畫型的前瞻性預測研究(亦即該研究的收案,一開始就是為了作預測模型),才需要用正式的統計公式作樣本數計算。

9 點是關於遺漏值的處理。遺漏值大概有幾種主要處理方式,第一種是使用完整資料(complete-case analysis),或又稱為「listwise deletion」,只保留全部預測變項都是有效數值的筆數,這種作法雖然簡單,當被刪除筆數到一定比例時,留下來的樣本可能不足以代表所有樣本,也可能會得到具有偏差的模型結果。TRIPOD 鼓勵研究人員使用多重插補(Multiple imputation)後的完整資料來分析。關於遺漏值的處理,可以參考筆者與同事撰寫的幾篇文章(https://reurl.cc/AKzKWehttps://reurl.cc/NpEpmphttps://reurl.cc/QjOjk5以及https://reurl.cc/qO3Ojp)。

 

1.jpg

2.jpg

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 晨晰部落格新站 的頭像
    晨晰部落格新站

    晨晰統計部落格新站(統計、SPSS、BIG DATA討論園地)

    晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()