這篇文章要來教大家實用的資料處理-合併資料,過去在接收客戶的資料時,常常遇到客戶將資料建檔在不同的資料集中,有些是按照不同的測驗階段分別建立,有些則按照問卷不同部分分別建立,但無論如果建立檔案,最後都必須整併在同一個檔案之下才方便進行分析,此時就需要用到合併資料的功能。此次示範的兩個檔案(如下圖),一個為國語成績,共7名樣本,編號為ID1至ID7,另一個為數學成績,共7名樣本,編號為ID4至ID10,因此兩個檔案的交集樣本為ID4至ID7,共4名樣本,在操作選項中,有4種不一樣的設定,下面將一一說明。
操作(無關鍵變數):
(1)無論採用何種設定,養成一個習慣,所有檔案必須先對樣本編號進行排序動作,先對編號按下右鍵,選擇「遞增排序」,每一個即將合併的資料集都必須先排序完再存檔。
(2)習慣上會選擇一個當主要檔案(此處選擇國語成績.sav),並在此資料集的頁面中進行資料合併的操作動作,此時這個檔案稱為作用中資料集,其他檔案稱為非作用中資料集,點選「資料」à「合併檔案」à「新增變數」。至於另一功能「新增觀察值」,是用於不同受訪樣本的資料輸入在不同檔案時,可利用「新增觀察值」將樣本合併在同一檔案。
(3)筆者的習慣會先將需要合併的檔案都先打開,因此可以在開啟的資料集中看到「數學成績.sav」,若沒有事先打開,則必須從下方的外部SPSS Statistics資料檔去瀏覽找到欲進行合併的檔案,不過如同步驟1提到必須在合併前將每個資料檔進行編號排序的動作,因此先將所有資料檔開啟的動作會較為順手。
(4)當兩個資料集有相同的變項時,會將非操作檔案(也就是非作用中資料集=數學成績.sav)的變項暫放在被排除的變數,ID後面括號(+)的加字號即是指非操作頁面的檔案(也就是非作用中資料集=數學成績.sav),在畫面下方也有註解。
(5)在右邊的新作用中資料集(N)代表兩個檔案合併,該檔案內存在的變項有哪些,其中(*)代表變數來自操作頁面的檔案(也就是作用中資料集=國語成績.sav),(+)來自非操作頁面的檔案(也就是非作用中資料集=數學成績.sav)。
(6)若不勾選「匹配已排序檔案關鍵變數的觀察值」時,會按照兩邊檔案的順序由上到下依序合併,除非使用者能夠確認兩邊檔案的樣本順序完全一樣,否則不建議採用此方式合併檔案。
(7)以此例來說就是錯誤的結果,ID1號的國語成績與ID4號的數學成績合併在一起,ID2號的國語成績與ID5號的數學成績合併在一起,以此類推。
留言列表