三、使用「pROC」比較兩個預測變項的曲線下面積

接著安裝並呼叫「pROC」(compare ROC)套件,由於更換了套件,因此此時要再 attach 一次資料集「proteinuria」。

再來創造「roc1」物件,括號前面的「proteinuria$AKI」表示資料集「proteinuria」中的「AKI」這個變項是結果變項;括號後面的「proteinuria$SOFA」則是資料集「proteinuria」中的「SOFA」這個變項是預測變項。

roc2」物件的預測/解釋變項則是「proteinuria$Proteinuria」,這邊要注意大小寫的問題,「$」後面的「Proteinuria」是資料裡頭的變項是大寫的 P

最後用『roc.test』比較 roc1 roc2 的曲線下面積(area under the curve),其中「method」有 "delong", "bootstrap", "venkatraman" 等方法,其中以 "delong" 最常使用。

 

1.jpg

 

報表下方會有 roc1SOFA)跟 roc2Proteinuria)的曲線下面積分別為78.9% 65.9%。報表上方有 DeLong’s test,可看到 p-value 達顯著水準,表示單獨比較 SOFA Proteinuria 對於結果變項的區別能力時,是 SOFA 的表現比較好。

 

2.jpg

 

可注意到上方報表並沒有標準誤或信賴區間的資訊,因此需要額外再以『var』指令得出曲線下面積的變異數。下方報表可見 roc1SOFA)的變異數為 0.0007645237,將其開根號即為標準誤差(SE),計算出來為「0.027650022」,再跟 78.9% 加減 1.96 倍的SE即為 95% 信賴區間,計算得出為『0.735137557 to 0.843525643』,即73.5% to 84.4%

 

3.jpg

 

四、使用「PredictABEL」得到整個模式的預測機率

大家可注意到在上述使用「pROC」的示範中,是單獨比較 SOFA Proteinuria 這兩個解釋/預測變項的區別效果,但我們有興趣的可能是『兩個模型之間的差異』,如下所示。

Model 1: SOFA + Age + Male + DM + SBP

Model 2: Proteinuria + SOFA + Age + Male + DM + SBP

在此我們安裝且呼叫「PredictABEL」套件,重新讀入資料、宣告 data.frame 以及 attach 資料

 

4.jpg

 

以下語法中的「cOutcome」右邊的 2 代表從資料由左至右第二個欄位是結果變項(AKI);「cNonGenPred1」則是自變項的組合,共五個,「cNonGenPred2」則有六個自變項。cNonGenPredCat1」跟「cNonGenPredCat2」則是宣告類別變項,例如三類或三類以上的類別變項。若是連續變項或兩類的類別變項,在「cNonGenPred」裡頭定義即可。而下方的「cGenPred」跟「cGenPredsCat」則是 genetic predictors,通常我們不會使用到,輸入「0」即可。

 

5.jpg

 

執行之後,會發現畫面右上方的多了一個「Values」區塊,裡頭會羅列上述定義的數值。

 

6.jpg

 

接著使用「fitLogRegModel」指令配適 binary logistic model,分別創造 riskmodel1 riskmodel2 的物件。

 

7.jpg

 

再來使用「predRisk」指令得到上述兩個多變項模式的預測機率,物件分別命名為 predRisk1 predRisk2,執行之後會發現右上角出現新的數值。接著再利用 data.frame 將這兩個數值變更為資料框架,命名為 pred1 pred2,執行之後就會發現右上角資料集清單出現了兩個新的資料。

 

8.jpg

 

再來使用「cbind」將「proteinuria」資料集跟剛剛新創造的「pred1」及「pred2」資料集合併,並命名為「data1」,執行語法後可看到畫面右上方多出一個「data1」資料集。

 

9.jpg

 

資料整併完成後,使用第三步驟「pROC」的指令創造 roc 物件以及用 roc.test 比較兩個物件的曲線下面積。

 

10.jpg

 

可見模式一(沒有Proteinuria)以及模式二(有Proteinuria)的 AUC 分別是82.4% 以及 84%。不過 DeLong’s test 僅達邊緣顯著,且 AUC 的增加也只有 1.6%,並不具有臨床顯著性。

 

11.jpg

arrow
arrow
    創作者介紹
    創作者 晨晰部落格新站 的頭像
    晨晰部落格新站

    晨晰統計部落格新站(統計、SPSS、BIG DATA討論園地)

    晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()