世界知名醫學期刊美國醫學協會雜誌(Journal of the American Medical Association, JAMA,2016年Impact Factor:44.4)於2010年所刊登文章中,每2篇中已有1篇會報告敏感度分析(Sensitivity analysis)的結果,這篇報告刊登在2013年的PLOS ONE(https://goo.gl/oLRNkT),也可見讀者於2017/8時的介紹(https://goo.gl/38dwwi)。
那麼,什麼是敏感度分析呢,筆者的定義是「本研究的發現是否會在某些操作條件之下而改變」。2013年有一篇發表在BMC Medical Research Methodology(https://goo.gl/ZhuNAQ),專門介紹臨床試驗的敏感度分析細節,裡頭提到敏感度分析定義包括「a method to determine the robustness of an assessment by examining the extent to which results are affected by changes in methods, models, values of unmeasured variables, or assumptions」以及「a series of analyses of a data set to assess whether altering any of the assumptions made leads to different final interpretations or conclusions」。
該文章系統地整理敏感度分析所包含的面向、細目與實際檢測方式,筆者擷取其精華並翻譯如表1。以下筆者根據其八大點,逐點進行解析與分享本身實際經驗。
一、極端值(Outliers)
這邊指的是尺度型(Scale)的連續變項(Continuous variable),可能是共變項或結果變項。例如當健檢資料的serum creatinine高達15 mg/dL以上時,我們可以先將這些極端值的個案直接刪除,然後比較刪除前後的主要結論是否有所變動。
然而在實務上,我們更常用的方法是「直接修改不合理的值」,例如剛剛的creatinine例子,可以修改上限值為6 mg/dL,或是用97%或99%的trimmed means替代也可以。當極端值的筆數頗多的時候,直接修改上限值或下限值可能會對於結果有較大影響,此時也可考慮此變項是否適合對數轉換(Log-transformation),也可緩解極端值分佈的狀況。
二、違反臨床試驗的計畫書(Protocol violation in RCTs)
關於ITT、AT與PP的介紹可以參考NEJS的說明(https://goo.gl/LdqwgK)。由於PP是把遵從度最好的個案都保留下來,因此會得到比較樂觀的療效估計。反之ITT會得到最保守的估計。
三、遺漏值(Missing value)
無論是橫斷面研究或追蹤時間,遺漏值一直是一個很重要的議題。實務來說,最簡單的作法是把個案分成兩個組別,第一組是具有完整回應資料(Complete response)的人,第二組是具有任何一筆遺漏值的個案,然後簡單地比較兩組是否在某些特性上具有顯著差異,並主動地把這些結果提供在內文(通常是放在附錄),如此提供了一個機會,讓讀者能客觀評價,遺漏值對於此研究的主要結果可能具有何種影響。
也可以應用目前廣泛被接受的資料插補方法:多重插補(Multiple imputation)。然後再比較完整資料分析與插補後資料分析的結論是否異同,即可評估遺漏值對於本研究主要發現的影響。
表1、臨床試驗常見敏感度分析之時機與範例
面向 / 項目 |
敏感度分析的方式 |
1、極端值(Outliers) |
(a) 報告標準化z值或以盒型圖呈現 (b) 保留與排除極端值資料,兩種都分析看看 |
2、違反臨床試驗的計畫書(Protocol violation in RCTs)註1 |
同時執行 (a) 意向分析(Intention-to-treat analysis, ITT) (b) 根據治療分析(As-treated analysis, AT) (c) 符合計畫書分析(Per-protocol analysis, PP) |
3、遺漏值 |
(a) 以完整資料分析 (b) 使用單獨填補方法或多重插補並且再次分析 |
4、結果變項的定義 |
以不同切點或是定義對Outcome重新分析 |
5、多中心的集群效果(Clustering effect)註2 |
(a) 忽略與考慮集群效果,兩種都分析看看 (b) 以不同的方法考慮集群效果 |
6、競爭風險因子 |
(a) 對每一個事件作存活分析 (b) 使用subdistribution hazard model |
7、基線變項分佈不均(Baseline imbalance) |
執行 (a) 基線特性作統計控制與不作統計控制都呈現 (b) 以不同的控制方法比較結果(例如傾向分數方法) |
8、分佈的假設(Distributional assumptions) |
在不同的分佈假設條件之下進行分析 (a) 結果變項的分佈(例如負二項跟Poisson) (b) 有母數與無母數方法的比較 (c) 傳統方法與貝氏方法的比較 |
資料來源:筆者修改與翻譯自https://goo.gl/ZhuNAQ
註1, 觀察性研究不適用;
註2, 不一定是multi-center,若是臨床試驗的單位是「病房」或「小組」,那麼此時的集群單位不是醫院;
留言列表