將原始資料讀進SAS資料集後,通常需要先進行資料處理,以方便研究者進行後續的分析及解讀報表,這些資料處理可能包含了變數的註解、變數的異動(常見的有保留及刪除變數、變數重新命名)、資料的異動(譬如說根據某些條件選取樣本或刪除樣本)。

 

5.1變數的註解

 

為了在跑出報表後,研究者不需要同時拿著問卷(或資料)及報表來邊對照邊解釋,註解是一個良好的習慣,換言之,就算不註解也不會對結果造成改變,所以不用太過擔心與害怕。

 

LABEL」為DATA STEP的敘述句,在「LABEL」後面加上變數的名稱,接著再以兩個單引號去註解此變數的意義,如圖一所示。

name這個變項註解為姓名,age註解為年齡,姓別註解為性別,height註解為身高,如此一來在出來的報表中,就會以此註解替代原先的變數名稱。

 

5.2變數的異動

 

5.2.1KEEP

 

此功能通常用在製作一個新的資料集時所要保留(敘述句為「KEEP」變數)或刪除(敘述句為「DROP」變數)的變數,以圖二為例,雖然資料集讀進了nameagesexheight共四個變數,但底下以敘述句「KEEP」保留了namesex兩個變數,因此在case1資料集裡只存在namesex


5.2.2 DROP

以圖三為例,雖然資料集讀進了nameagesexheight共四個變數,但底下以敘述句「DROP」刪除了namesex兩個變數,因此在case1資料集裡只存在ageheight

 


 

5.2.3  RENAME

此敘述句「RENAME」用來對變項重新命名,以圖四為例,將grade1重新命名為score1;將grade2重新命名為score2;將grade3重新命名為score3,因此在輸出的報表中就不會存在grade變數了。

 

 


 

5.3資料的異動

 

為了選取或刪除我們所需的樣本,我們可以依照我們要的條件,配合敘述句「IF」或是「DELETE」去做樣本的選取或刪除。

 

5.3.1  IF

 

在圖五的範例中,利用敘述句「IF」去SET case1以創造case2,設定條件為sex=F,所以在case2的資料集中只會有女性的樣本。

IF」在資料處理中非常好用,若能加以利用,在資料處理上會更為流暢。

 


 

5.3.2  DELETE

 

DELETE」敘述句可將不需要或不必要的樣本給予刪除,常搭配「IF-THEN-ELSE」來使用,才能在所設定的條件下刪除樣本。以圖六為例,在SET case1時,設定當sex=M就刪除,因此case2資料集中就不會存在任何男性樣本。



 

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 晨晰部落格新站 的頭像
    晨晰部落格新站

    晨晰統計部落格新站(統計、SPSS、BIG DATA討論園地)

    晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()