四、結果變項的定義(Definitions of outcomes)
在醫學研究上,許多結果變項都是被人工二元分類,例如慢性腎病(CKD)定義可能是eGFR < 60 mL/min/1.73m2,那麼如果切點改為55或50,本研究主要發現是否會因而改變。當然可以用比較有臨床意義的作法,例如將Outcome定義改為CKD stage 4-5(eGFR < 30),然後觀察原本結論是否仍然適用。
在這邊讀者要延伸到暴露條件(分組條件),例如我們定義病人「規律用藥」,可能是在收案之前一個月內開過14天的藥,如果這是主要分析的分組條件,倘若我們把定義限制到必須使用28天以上,此時結論是否會因而改變,這也是符合敏感度分析的測試原則。
五、多中心的集群效果(Clustering or correlation and multi-center trials)
臨床試驗往往可能是多中心(Multi-center)或至少是多個場域(Site),例如介入處置的單位是病房、社區等等,而且可能是3階以上的多階層,例如醫院→病房→病人。
此時會有個集群效應(Cluster effect),即在同一個集群之中的個案的相似度會比較高(相較於不同集群之間的個案之間的相似度)。目前統計方法已經充分可以處理集群效應,若是階層只有2層時可以使用GEE(筆者曾經寫過數篇關於GEE的介紹)。
或是階層較為複雜,具有3層或以上的結構時,可以採用Linear mixed model(LMM),這部分筆者也曾經介紹過,請參考https://goo.gl/6gMfhL、https://goo.gl/Cwifne以及https://goo.gl/gsbgfV。
六、競爭風險因子(Competing risks in RCTs)
倘若結果變項是Time to event outcome,此時標準作法是使用存活分析,通常是Cox proportional hazard model。不過由於臨床上常常有「競爭風險因子」,例如對於膀胱癌的復發來說,追蹤過程死亡或先進行根治性膀胱全切除手術都是與它競爭的風險因子。目前採用subdistribution hazard model已經是大家廣為認同的作法。
這部分筆者也曾經專文介紹過,請參考https://goo.gl/za2MEx、https://goo.gl/8hBa22與https://goo.gl/SehG1v。
七、基線變項分佈不均(Baseline imbalance)
隨機試驗如果確實作到隨機分派,基本上兩組人在某些基本特性有差異,可以視為是因為機遇(by chance)而發生的。
倘若是觀察性研究,那麼這個問題就變得很重要了,甚至是影響是否得到顯著結論的最重要因子。目前處理基線變項分佈不均的方法中,以傾向分數(Propensity score)最為普遍,總算有四種作法,分別是統計調整(adjustment)、分層分析(Stratification analysis)、配對(Matching)與加權(Inverse probability of treatment weight, IPTW),其中又以最後兩種為主流方法。可參考臺北醫學大學陳錦華老師關於傾向分數的簡介:http://biostat.tmu.edu.tw/page/epaper/2stat.pdf
八、分佈的假設(Distributional assumptions)
多數的統計分析都是在某種分配假設之下的結果。例如結果變項是連續變項時,我們假設符合常態分佈(Normal distribution),可以套用不同的分配假設再加以估計結果是否不同。或是有母數與無母數統計之間的結果比較。或是傳統方法與貝氏方法的比較。
表1、臨床試驗常見敏感度分析之時機與範例
面向 / 項目 |
敏感度分析的方式 |
1、極端值(Outliers) |
(a) 報告標準化z值或以盒型圖呈現 (b) 保留與排除極端值資料,兩種都分析看看 |
2、違反臨床試驗的計畫書(Protocol violation in RCTs)註1 |
同時執行 (a) 意向分析(Intention-to-treat analysis, ITT) (b) 根據治療分析(As-treated analysis, AT) (c) 符合計畫書分析(Per-protocol analysis, PP) |
3、遺漏值 |
(a) 以完整資料分析 (b) 使用單獨填補方法或多重插補並且再次分析 |
4、結果變項的定義 |
以不同切點或是定義對Outcome重新分析 |
5、多中心的集群效果(Clustering effect)註2 |
(a) 忽略與考慮集群效果,兩種都分析看看 (b) 以不同的方法考慮集群效果 |
6、競爭風險因子 |
(a) 對每一個事件作存活分析 (b) 使用subdistribution hazard model |
7、基線變項分佈不均(Baseline imbalance) |
執行 (a) 基線特性作統計控制與不作統計控制都呈現 (b) 以不同的控制方法比較結果(例如傾向分數方法) |
8、分佈的假設(Distributional assumptions) |
在不同的分佈假設條件之下進行分析 (a) 結果變項的分佈(例如負二項跟Poisson) (b) 有母數與無母數方法的比較 (c) 傳統方法與貝氏方法的比較 |
資料來源:筆者修改與翻譯自https://goo.gl/ZhuNAQ
註1, 觀察性研究不適用;
註2, 不一定是multi-center,若是臨床試驗的單位是「病房」或「小組」,那麼此時的集群單位不是醫院;
(全文完)
留言列表