在本系列前一篇文章中,筆者介紹了傳統方法的基本作法,接著在本文中將介紹當代的主流方法(最主要會介紹兩種:雙變量模型與階層模型),以及說明這些主流方法可以克服哪些傳統作法不合理的假設。
主流方法1-雙變量模型
由於單變量模型(Univariate model)無法考慮敏感度與特異度必定為負相關的事實,進而分開估計。因此 Van Houwelingen et al. 於 1993 年首次提出雙變量模型(Bivariate model),而由 Reitsma et al. 2005 的文章開始受到眾多研究人員注意及廣為引用3,4。
雙變量模型的基本架構如下:
先將敏感度與特異度轉換為 logit 值(ln [p/(1-p)]),θsen 跟 θspe 是符合雙變量常態分佈的向量,公式的 N 是指 Normal distribution,Σ 則是共變異數矩陣。
共變異數矩陣中左上右下的對角線代表「跨研究」的敏感度與特異度的變異數,此即為隨機效果的意思,亦即雙變項模型允許不同研究的敏感度與特異度可以不一樣。ρ 則是代表敏感度與特異度的相關性,此數值應該永遠為負值,因此可知雙變項模型在此考慮了敏感度與特異度之間的相關性。因此可知,這兩點已經突破了傳統 Mose-Littenberg SROC 的重大限制。
當我們得到一個異質性高的結果,亦即敏感度與特異度的變異數很大時(一般可用I2 或 τ2 評估),我們可以直接在方程式右邊加上研究層級(study-level)的解釋變項/共變數 Z(連續型或類別型都可以),Z 等於從1, 2, …到 k 個共變數,θSenk 跟 θSpek,則是第 k 個共變數的迴歸係數。
研究者可以將不同切點數值的選擇當成當共變數(例如分成 <100, 100-300 以及 >300),因為每一個研究的閾值大都不一樣,因此當閾值的分組也當成共變數時,模型也算是考慮了閾值的效果。
一般來說,當該研究只有一個標記或檢驗(marker or index test)時,雙變量模型是最被高度推薦的分析方式5。另外當研究主要感興趣的結果變項不是敏感度/特異度,而例如是 positive and negative likelihood ratio(LR+ 與 LR-)或其他統計量時,雙變量模型相較於其他主流方法具有估計上的優勢5。
主流方法2-階層模型
接著介紹彈性更大的階層模型(hierarchical model),首先先從 2×2 的交叉表看起:
下標 i 代表有 i 個研究,在階層模型中則以 yi01 與 yi11 作為結果變項而開始模式的開展,以下為第一層模型的公式:
下標 j = 1 代表是有疾病那一組,j = 0 則代表無疾病那一組,因此這公式表示 yij1 服從機率為 πij 及 樣本數為 nij 的二項分佈。
πi1 與 πi0 都是機率,分別是第 i 個研究的敏感度(真陽性)與偽陽性,與雙變量模型一樣,先將機率轉為 logit值,方程式右邊再用一系列的參數估計。
Xij 是二元虛擬變項,代表病人真實疾病的狀態,-1/2 為有疾病,1/2 為無疾病;θ 稱為 cutpoint parameters 或 positivity criteria,可注意到 θ 數值越大則結果變項數值也越大,而方程式左邊的結果變項是真陽性與偽陽性,因此 θ 用來估計真陽性與偽陽性之間的消長(tradeoff)。
α 稱為 accuracy parameter,因為它用來衡量真陽性與偽陽性之間的差異;β 則是 scale parameter,用來允許標記或檢驗為陽性與陰性的兩個族群在結果變項具有變異,此為固定效果。
值得注意的是,公式中的 θ 與 α 皆有下標 i,這代表這兩個參數允許有隨機效果,因此每一個研究的真陽性與偽陽性之間的消長被允許是可以不一樣的,這其實隱含了階層模型考慮了閾值效應(threshold effect)。
接著來看第二層的公式:
θi 與 αi 皆服從平均數分別為 θ 與 α 的常態分佈,並允許有變異數 σθ 與與 σα。至此階層模型以大致交代完畢,但倘若想要考慮共變數的效果,則可以輕易地在方程式上加上研究層級(study-level)的共變數 Zk:
與雙變量模型一樣,此時 θk 與 αk 皆為共變項 Zk 的迴歸係數,不過是固定效果。值得注意的是,θ 與 α 可以放不一樣的共變數,可以一個不放而另外一個放,或是兩個都放但是放的共變數都不一樣。
小結
上述的雙變量模型與階層模型乍看之下差異很大,但事實上當模型不包含共變數效應的時候,此兩模型具有等價關係。然而此兩模型都可以得到合併的敏感度/特異度、DOR 以及 SROC,研究者又該如何選擇?
目前建議當結果變項焦點在於敏感度/特異度時,使用雙變量模型是標準作法也是文獻最常使用的方法;當結果變項聚焦在 SROC 時,則目前推薦使用階層模型估算,即為 HSROC5,6。
兩個主流模型的共變數效果探討的事情不太一樣,雙變量模型要看共變數對於合併後敏感度/特異度的效果(或差異),然而在階層模型則是看 HSROC 在考慮共變數之前與之後的落點位置與形狀的差異5。
本系列文章僅限制於頻率學派(frequentist)的討論,上述兩個主流模型目前的估計方法已有許多的貝氏(Bayesian)學派的延伸,有興趣的讀者可以參考文末的參考文獻5。
參考文獻
1. Moses LE, Shapiro D, Littenberg B. Combining independent studies of a diagnostic test into a summary ROC curve: data‐analytic approaches and some additional considerations. Statistics in medicine. 1993;12(14):1293-1316.
2. Rutter CM, Gatsonis CA. A hierarchical regression approach to meta‐analysis of diagnostic test accuracy evaluations. Statistics in medicine. 2001;20(19):2865-2884.
3. Reitsma JB, Glas AS, Rutjes AW, Scholten RJ, Bossuyt PM, Zwinderman AH. Bivariate analysis of sensitivity and specificity produces informative summary measures in diagnostic reviews. Journal of clinical epidemiology. 2005;58(10):982-990.
4. Van Houwelingen HC, Zwinderman KH, Stijnen T. A bivariate approach to meta‐analysis. Statistics in medicine. 1993;12(24):2273-2284.
5. Biondi-Zoccai G. Diagnostic Meta-Analysis: A Useful Tool for Clinical Decision-Making. Springer; 2018.
6. Takwoingi Y, Partlett C, Riley RD, Hyde C, Deeks JJ. Methods and reporting of systematic reviews of comparative accuracy were deficient: a methodological survey and proposed guidance. Journal of Clinical Epidemiology. 2019;121:1-14.