統合分析(meta-analysis)普遍被應用在各種學科與領域,然而其中診斷型統合分析(meta-analysis for diagnosis)這個分支,無論在方法學的開展或普遍性的應用都是以醫學領域為主,主要用在於一個「標記」(marker)對於一個疾病或狀態(通常是二元變項)的區別/鑑別能力(discrimination)的評估。
下圖列出在 PubMed 搜尋診斷型統合分析的相關論文,很明顯發表的文章越來越多,顯示此方法的重要性。
由於此類型文章發表越來越多,因此在方法學上的發展也越發成熟,筆者將於本系列文章略述此學門在方法學上的演進,未來也會撰寫一系列以 R 軟體進行診斷型統合分析的實作分享。
診斷型統合分析的主要結果變項
首先研究者要先釐清此診斷型統合分析的主要結果變項(outcome or endpoint為何,一般來說最主要有三種結果變項:(一)敏感度/特異度(sensitivity/specificity),(二)診斷勝算比(diagnostic odds ratio [DOR])以及(三)曲線下面積(area under the curve, AUC)。
敏感度是以有疾病者(或某種狀態)為分母,而該標記數值的切點(大於或小於某個閾值 [threshold])顯示為陽性的機率;特異度則是以無疾病者為分母,而該標記數值的切點顯示為陰性的機率。兩個統計量當然希望越接近 1 越好,但這兩個統計量會因為閾值的選擇而必然呈現負相關。
再者是以 DOR 作為結果變項,由於每一個研究的標記數值切點(高於多少 vs. 低於多少對疾病/狀態(有疾病 vs. 無疾病)都是一個 2×2 的交叉表,因此可直接計算出勝算比,越大的勝算比可代表此標記數值切點對實際疾病/狀態的差異性越大,因此原則上勝算比越大是越理想。
最後則是 AUC,在個別的研究中,每一個標記(通常是連續變項)對疾病/狀態可描繪出一條接受者操作特徵曲線(ROC curve),是以該標記從數值最小到數值最大以各種二分法的方式,得到每一個切點之下的敏感度與特異度所建構的圖形。
綜上,在診斷型統合分析中,我們關心的結果變項即是匯總/合併所有研究之後的敏感度/特異度、DOR 以及 AUC。由於通常無法取得原始資料,研究人員只能取得作者報告的標記數值切點(例如根據 Youden’s index),因此此時 AUC 只能透過個別研究所報告的標記數值切點相對應的敏感度(X軸)與 1 減特異度(Y軸)建構出 ROC 圖,此時稱為 summary ROC(SROC)。
傳統方法
當感興趣的結果變項為敏感度/特異度時,由於此兩者皆為比例(proportion),因此可直接使用隨機效果的統合分析得到一個合併後的敏感度與特異度,不過注意,這裡是完全將敏感度與特異度視作為獨立,進而個別分析,這種方法稱為「Univariate model」(單變量模型),意思是一次只考慮一個統計量,但筆者在前文有提過:「這兩個統計量會因為閾值的選擇而必然呈現負相關」,因此這種假設兩者獨立的作法已經不合時宜。
當感興趣的結果變項為 DOR 時,目前仍可接受使用隨機效果的統合分析將個別研究的 DOR 合併成一個。不過在接下來要介紹的主流方法也都可以計算出 DOR,因此仍然不建議研究者以 Univariate model 作為彙整 DOR 的方法。
當感興趣的結果變項為 SROC 時,傳統方法為 Moses 與 Littenberg 於1993 年所提出的作法1,一般又稱為 Moses-Littenberg SROC。此作法是以 logit-transformed 過後的敏感度與特異度之間建構出一個簡單線性迴歸模型,而加以繪製一條敏感度與特異度之間直線關係,由於畫圖時再將 logits 轉回去比例(百分比),因此變成一條曲線,公式如下:
其中 TP 為真陽性,FP 為偽陽性,logit(p) = ln(odds of p) = ln (p/(1-p)),p 為比例/機率。
接著配適簡單線性迴歸,b 為直線關係的迴歸係數,由於 Di 跟 Si 都是 logits,因此還原成敏感度與特異度時,直線關係會變成曲線關係。
值得注意的是,此傳統 SROC 無論是截距項「a」或迴歸係數「b」都是固定效果,因此沒有辦法允許每個研究具有變異性,尤其是沒有辦法考慮 Si 的隨機效果,可能會造成參數估計、SROC 的點估計以及 SROC 的信賴區間的偏差2。
留言列表