SAS lag指令的應用 @ 晨晰統計部落格新站（統計、SPSS、BIG DATA討論園地） :: 痞客邦 ::

公告版位

晨晰統計顧問有限公司在新北市板橋\服務市話：02-29602817\手機：0918-276-622\信箱：raising.statistic@gmail.com\網址：http://www.rai-stat.com.tw

Jun 26 Mon 2017 08:52
SAS lag指令的應用

在許多分析步驟中，資料清檔檢查與變數的產生是基本動作，如何讓資料集(dataset)能乖乖的達成預想中的結構，需要技術人員與程式達到邏輯上的共鳴。技術人員按照程式邏輯的遊戲規則，下達準確的指令，產出預期的結構。本篇文章分享資料整理過程中常會使用到的小技巧之一：在多頻次的資料集中，如何讓同樣ID的數據們，按照時間序列往後挪。

首先介紹，在SAS中如何單純的把資料往後挪(lag)

data a0 ; setaa ;

exam_date_lag1=lag1(exam_date) ; /** lag1: 即為lag一筆的意思 **/

format exam_date_lag1 yymmdd10. ;

run ;

此種方式為單純的lag一筆，但是通常我們想做的是在dataset中，同樣ID有多筆數據時，希望能按照ID去做lag時，下意識會將lag與first.ID做出邏輯上的錯誤結合，產出非預期的資料結構(範例如下)：

procsortdata=aa ; by ID exam_date ; run ;

data a1 ; setaa ;

by ID ; if first.ID thendo ;

exam_date_lag1=lag1(exam_date) ;

end ;

format exam_date_lag1 yymmdd10. ; run ;

當lag指令包在if… then do…指令中時，會產生非預期的結果。在SAS的邏輯中，會先把first.ID取出後，直接對取出的first.ID做lag。因此，ID=1的第一筆日期會lag給ID=2的第一筆，其它非first.ID的皆未做處理，故為遺漏值。

當希望資料能按照ID中的exam_date做lag時，與first.ID正確結合使用的方式應如下，先將變項lag設定好，再將首筆ID做修正：

procsortdata=aa ; by ID exam_date ; run ;

data a2 ; setaa ;

exam_date_lag1=lag1(exam_date) ;

format exam_date_lag1 yymmdd10. ;

by ID ; if first.ID thendo ;

exam_date_lag1=. ;

end ;run ;

晨晰部落格新站

晨晰統計部落格新站（統計、SPSS、BIG DATA討論園地）

晨晰部落格新站發表在痞客邦留言(0) 人氣()

E-mail轉寄

全站分類：進修深造
個人分類：SAS教學
此分類上一篇： sas簡易教學～無母數統計-Kruskal-Wallis one-way analysis of variance by ranks之Dunn事後比較
此分類下一篇： SAS lead指令的應用
上一篇：極速分析系統（六）：卡方分析
下一篇：數據話第14集~建立戰情室綜觀全局？用SmartBI就對了

歷史上的今天

留言列表

熱門文章

文章分類

最新文章

最新留言

文章精選

所有文章列表

文章搜尋

新聞交換(RSS)

誰來我家

參觀人氣

本日人氣：
累積人氣：

QR Code

qrcode

POWERED BY

(登入)

{{ article.user_name }}
{{ article.timestamp * 1000 | date:'MMM.dd.y.hh.mm' }}
{{ article.title }}
{{ article.content }}

PIXNET Facebook Yahoo! Google MSN

您尚未登入，將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

請輸入左方認證碼：

看不懂,換張圖

請輸入驗證碼