插補遺漏資料值(multiple imputation)-操作

1)點選「多重插補(multiple imputation)」→「插補遺漏資料值」

2)在「變數」的選單下,將需要用到的變數丟入右方「分析各個變數」

需要用到的變數在插補過程中將被進行補值,或是用來當預測變項來預測遺漏值之項目。

3)「插補」

用來指定所插補的資料集個數,一般建議為3~10之間,SPSS軟體預設為5個。

4)「資料集名稱」

將插補完成的資料給予資料集名稱。

 

1.jpg

 

5)「方法」

在「方法」的選單下,建議保持軟體預測的自動,由軟體根據資料的形式選擇適合的插補方式。

 

2.jpg

 

6)在「限制」的選單下,選點選「掃瞄資料」

可顯示每個變數的遺漏狀況,以及連續變項的觀察範圍。

7)「角色」

可以用來指定變數插補過程中將只被進行補值,或是用來只當預測變項來預測遺漏值之項目,或是同時含有兩種身分。

8)「範圍」

根據插補完的資料集,有時會遇到不合理的插補情形(譬如說負的收入值),此時可指定變數的最大值與最小值,來調整插補範圍;不過當限制越多時,會較難疊代出插補結果,此部分要再調整。

9)「捨入」

主要用來調整數值的小數位數:【1】四捨五入為整數;【0.1】四捨五入到小數點第1位;【0.01】四捨五入到小數點第2位。

10)「排除含有大量遺漏值的變數」

當某一變項的遺漏值過多時,可設定不做任何處理,此時可限定遺漏比例超過多少就不進行處理。

11)「最大觀察值取樣」&「最大參數取樣」

當指定了變項的範圍,在插補的程序中會不斷的抽出數值,直到合乎範圍再進行插補,當抽取特定次數後尚未尋獲合理的插補值,則會出現錯誤訊息;此時可以將「最大觀察值取樣」&「最大參數取樣」提高,讓程式變更其他的模式參數組合,並提高抽取的次數。

 

3.jpg

 

12)在「輸出」的選單下,預設勾選「插補模式」

可顯示每個變數在插補時所使用的模式。

13)「含有插補值變數的敘述統計」

在輸出檔顯示插補完結果的敘述統計,讓使用者比對插補前後的結果。

14)「建立疊代歷程」

若勾選「建立疊代歷程」並儲存資料集,可以檢視插補的歷程。

 

4.jpg

創作者介紹

晨晰統計部落格新站(統計、SPSS、BIG DATA討論園地)

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()