最近在複習利用SAS來做資料的處理,所參考教科書為林政豐老師的SAS應用之資料處理(2005),期望在學習的過程中,將自己所看到且應注意的地方紀錄下來,並與大家來做討論,若有發現錯誤的地方,也希望能給小弟一些批評與指教。
第一節、基本介紹
在SAS系統中撰寫語法,依功能的不同應該分為兩大類。一、資料的讀取與整理,統稱DATA STEP;二、執行分析的程序,統稱PROC STEP。
1.DATA STEP
SAS在資料讀取與處理的過程中,是以類似迴圈(loop)的方式進行,也就是說SAS會先將一筆資料讀入,經過一連串資料整理(研究者訂定),轉成SAS能夠讀取的格式並存放後,再去讀取第二筆資料,因此當一筆資料讀進SAS後,會把DATA STEP中的每段敘述句都執行後,才去讀取第二筆資料,再從第一段敘述句執行到最後一段敘述句,直到所有資料都輸入完畢為止。
以下圖為例,在DATA STEP中,
1.必需先以指定資料集名稱,如case
2.第一筆資料(CHOU 31 M 1692 65)讀進來時,會經過INPUT→LIST→RUN
3.接著第二筆資料(WANG 30 158.23)會再依此順序讀進並處理
4.直到最後一筆資料(LIN 28 F 163. 56)處理完為止

2.PROC STEP
PROC STEP為根據研究者的目的不同,採用不同的PROC的程序,譬如說想對資料作排序,就會用PROC SORT;想要列印出資料內容,就會用PROC PRINT;想要做T檢定,就會用PROC TTEST等。
不同執行程序,將配合著敘述句,才有辦法達到研究者預設的目的,因此如何找到適用的執行程序與敘述句,是SAS學習者及使用者最重要的課題。
以下圖為例,如果想要將資料內容輸出到OUTPUT,則要使用PROC PRINT;若想要將資料的變項繪製圖形,則要使用PROC PLOT。