在之前文章中,我們提到了在以下幾種情況,過去常以Receiver Operating CharacteristicROC)的曲線下面積(Area under the curve, AUC)作為主要的統計方法以及其限制1-2

假設已知有個表現良好的生物標記B(或是一組危險因子,例如Framingham Risk Score),此時我們提議(proposed)的生物標記或預測模型(或一組危險因子)為A,可能會有以下幾種的比較。

  • A的表現比已知的生物標記B更好(head to head comparison
  • A+B的綜合表現比B單獨更好(nested model
  • A加上baseline risk score之後,預測有增值效果(incremental value
  • A加上baseline risk scoreB加上baseline risk scorehead to head comparison

因此Nancy Cook博士於2007年提出風險重新分組(Clinical Risk Reclassification)的概念2,而Michael Pencina2008年在醫學統計指標性期刊「Statistics in Medicine」正式提出另外兩種重要的指標,分別為net reclassification improvementNRI)以及integrated discrimination improvementIDI3,且正式提出這兩個指標的統計檢定。

首先我們先介紹IDI,在Pencina2008)論文中,使用以下公式來代表IDI的涵義。pnew,events指的是實際發生事件者在新模式的預測成為事件者機率(predicted probability of event),pold,events指的是實際發生事件者在舊模式的預測成為事件者機率,pnew,nonevents指的是實際沒有發生事件者在新模式的預測成為事件者機率,pold,nonevents指的是實際沒有發生事件者在舊模式的預測成為事件者機率。

 

2.jpg

 

這裡指的「新模式」是我們要提議的那個生物標記(或預測模型)的模式,譬如A+B比上B,如此B就是「舊模式」。IDI的概念非常直觀,倘若A這個生物標記(或預測模型)真的更能有效預測事件發生,那麼它應該要能增加實際上發生事件者的預測成為事件者機率,因此pnew,eventspold,events應該要是正數;反之,A應該也要更能有效預測事件沒有發生,因此pnew,noneventspold,nonevents應該要是負數。於是IDI也可以下列公式表示:

 

1.jpg

 

IDI可能的最大值是2200%),一般來說,如果5-7%被會被認為是「實質地」(substantially)提升風險重新分組1。然而無論是ROCIDI都無法一個臨床問題,即儘管A這個生物標記(或預測模型)更能預測事件的發生(對於發生事件者)及更能預測事件沒有發生(對於沒有發生事件者),但都無法直接回答此問題:A所增加的預測能力若使用在臨床上,究竟是否可以改變治療決策?

為了回答上述問題,Pencina2008)提出了另外一個指標,即net reclassification improvementNRI3,我們將於本系列的下一篇文章介紹。

 

參考文獻

1.McGeechan K, Macaskill P, Irwig L, Liew G, Wong TY. Assessing new biomarkers and predictive models for use in clinical practice: a clinician's guide. Archives of Internal Medicine 2008; 168:2304-2310.

2.Cook NR. Use and misuse of the receiver operating characteristic curve in risk prediction. Circulation 2007; 115:928-935.

3.Pencina MJ, D'Agostino Sr RB, D'Agostino Jr RB, Vasan RS. Evaluating the added predictive ability of a new marker: from area under the ROC curve to reclassification and beyond. Statistics in medicine 2008; 27:157-172. 
 

arrow
arrow
    全站熱搜

    晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()