在前兩篇文章中,我們介紹了曲線下面積(Area under the curve, AUC)與integrated discrimination improvement(IDI)的定義以及使用上的限制。為了回答此問題:「A這個生物標記或預測模型,所增加的預測能力若使用在臨床上,究竟是否可以改變治療決策?」,Pencina(2008)首次提出net reclassification improvement(NRI)這個指標以及展示它的統計檢定1。
在使用NRI之前,必須有個很重要的前提,亦即關於該事件的預測機率已有明確的風險分組。例如根據Third Adult Treatment Panel(ATP III)將10年冠心病的風險(10-year risk of coronary heart disease)明確分為3組:0%–6%、6%–20%及>20%,針對不同風險分組會有不同的治療決策,例如0-6%只要保持定期追蹤,6%–20%則是改變生活方式與藥物治療,而>20%則可能要接受更積極的監測與治療。
在Pencina(2008)的論文中,使用以下公式來說明NRI的組成。方程式4的pup,events表示分母為實際發生事件者,分子為新模式(相較於舊模式)正確增加發生事件者的預測機率,而且是提升了風險分組,例如從0-6%(舊模式)提升到6%–20%或>20%(新模式)都是屬於此類。方程式5的pdown,events表示分母為實際發生事件者,分子為新模式(相較於舊模式)錯誤減少發生事件者的預測機率,而且是降低了風險分組,例如6%–20%或>20%(舊模式)反而變成0-6%(新模式)都是屬於此類。我們當然希望pup,events越高越好(最大值是100%),而pdown,events越低越好(最小值是0%)。
方程式6的pup,nonevents表示分母為實際沒有發生事件者,分子為新模式(相較於舊模式)錯誤增加沒有發生事件者的預測機率,而且是上升了風險分組,例如0-6%(舊模式)變成6%–20%或>20%(新模式)都是屬於此類。方程式7的pdown,nonevents表示分母為實際沒有發生事件者,分子為新模式(相較於舊模式)正確減少沒有發生事件者的預測機率,而且是降低了風險分組,例如6%–20%或>20%(舊模式)變成0-6%(新模式)都是屬於此類。我們當然希望pdown,nonevents越高越好(最大值是100%),而pup,nonevents越低越好(最小值是0%)。
而整體NRI就等於(pup,events-pdown,events)-(pup,nonevents-pdown,nonevents),因此可知整體NRI的最大值也是2(200%)。除了整體NRI之外,也可分別計算發生事件者的NRIevent以及沒有發生事件者的NRInonevent。追求高的NRIevent是為了透過所增加的正確風險分類,更能早期積極治療可能會發生事件的病人,而追求高的NRInonevent是為了透過所降低的正確風險分類,能避免對不會發生事件的病人做太積極或侵入性的治療,也可減少醫療浪費。
綜合這一系列的三篇文章,建議研究者未來可同時報告AUC的差異(DeLong test)、IDI與NRI,讓讀者能從更多面向來評估結果。
(全文完)
參考文獻
1. Pencina MJ, D'Agostino Sr RB, D'Agostino Jr RB, Vasan RS. Evaluating the added predictive ability of a new marker: from area under the ROC curve to reclassification and beyond. Statistics in medicine 2008; 27:157-172.