本節主要說明在資料讀進SAS並建立資料集時,可以進行的一些動作,以符合一些研究者特殊的需求。

 

 

3.1 資料館(Library

資料館的建立及使用,在之前的第11篇「利用libname來建立資料夾存取data」已經介紹過了,但除了語法外,亦可以用點選的方式建立資料館。

 

1.Explorer裡的Libraries點選右鍵,並選擇New

2.接著對在New Library進行設定

(1)New:新的資料館名稱

(2)Enable at startup:如果想要在SAS啟動後就存在此資料館,則要打勾

(3)Path:此資料館所連接的資料夾路徑

(4)其他選項皆不需更改

 

 

3.2常用特殊資料集

3.2.1  _NULL_資料集(空資料集)

使用者想在DATA step中處理資料但又不想產生一個資料集,則可接在DATA敘述句後面將資料集的名稱命名為_NULL_即可,不過如果要對此資料做一些程敘處理時(如PROC PRINT),則會出現錯誤的訊息。

 


3.2.2 blank資料集

若在DATA step中,使用者並未給予資料集任何名稱,SAS會定義為blank data,並自動給予命名,命名的規則為DATA n,且會放在暫時資料館WORK裡,因此如果要呼叫此資料集,可以鍵入DATA=DATAnn = n次)。如下圖,由於只輸入一次資料,所以在WORK資料館裡有一個DATA1,若再將資料敘述句多點幾次,就會有nDATAn了。


 

 

3.2.3 _LAST_資料集

SAS執行中,若未設定要針對哪一個資料作執行時,SAS將以最後一筆資料為_LAST_資料集並執行。如下圖,SAS中依序輸入case3case4資料集,但在PROC PRINT中並未指定哪一筆資料,因此將會以case4作輸出的動作。


3.3 常用之內設變數

SAS中提供了許多內設變數,可在系統因某種狀況發生時,可自動產生在LOG視窗中的變數及其變數值。以下將介紹FIRST.varLAST.var_N_

 

3.3.1 FIRST.varLAST.var

DATA中使用BY敘述句時,若想瞭解BY群組中的第一筆及最後一筆資料,可以利用FIRST.varLAST.var來建立變數。此兩個附加變數必將資料經PROC SORT後才能使用,且是屬於暫時性變數,不會出現在新成立的資料集內。

1.使用FIRST.varLAST.var之前需要把資料集依特定變數作排序動作

2.針對想找出第一筆及最後一筆的變數使用此變數,如statecity

3. FIRST.varLAST.var只能顯示在LOG

4.無法顯示在output

 

 

3.3.2 _N_

內設變數_N_是在計算SAS在讀取資料時共執行的迴圈次數,通常會被用來瞭解輸入資料的筆數。

1.DATA STEP底下,去創作_N_變數

2.執行之後,在SASLog視窗中可以看到此變數的資訊

3.但和FIRST.varLAST.var不同,此變項可顯示在output

 


arrow
arrow
    全站熱搜

    晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()