不知大家面對SAS產生的報表是用何種方式整理的呢?土法煉鋼式地用複製貼上嗎?如果要跑的結果變項甚多、或是分析條件前後修改多次,每次都要再重新複製貼上,寶貴的時間就這麼浪費了呀!在此介紹SAS的ODS語法,善用下述技巧,一定能讓您的報表整理更有效率!
不知大家面對SAS產生的報表是用何種方式整理的呢?土法煉鋼式地用複製貼上嗎?如果要跑的結果變項甚多、或是分析條件前後修改多次,每次都要再重新複製貼上,寶貴的時間就這麼浪費了呀!在此介紹SAS的ODS語法,善用下述技巧,一定能讓您的報表整理更有效率!
醫學藥物研究常見時間相依(time-dependent)的研究設計,期望能更細緻的處理隨研究追蹤時間產生變化的藥物暴露劑量,藉以強化藥物暴露與研究觀察結果之間的風險推論。藥物隨時間變化的暴露計算方式有許多操作方式,例如:累積劑量、人-季(person-quarter)或人-月(person-month)計算藥物暴露量。以下簡略說明採用人-季(person-quarter)方式計算研究藥物暴露量的資料檔處理方式。
1.準備好每個研究ID的追蹤起始日期與結束日期,如下圖所示,研究起始日期為Index_date,終止日期為End_date
在電子化醫學研究資料庫逐漸流行的時代,利用次級資料庫或是公務行政資料庫進行醫學研究逐漸普及。研究者需要運用許多資料處理的技術在大量資料點中,擷取出適合分析的樣本,再依取出的樣本進行後續的分析處理。一般研究設計中,病例組/治療組因為操作目標明確,通常是容易擷取的,但是對照組範圍很廣,且年齡、性別的分佈往往會跟病例組/治療組有很大差異 (可以想像一般年輕人比較不容易成為病例組,所以病例組的年齡常常是較年長的),造成兩者之間可比較性低。此時有許多技術操作可以挑選出具有可比較性、適合分析的對照組,以下分享一些容易操作的簡單小技巧「抽樣」來達成挑選對照組的任務。
常見的抽樣方式「簡單隨機抽樣(Simple random sampling)」、「分層隨機抽樣(Stratified random sampling)」,其中分層隨機抽樣可再依操作方式分為「等比例隨機抽樣」跟「不等比例隨機抽樣」。以下簡單介紹透過SAS SURVEYSELECT Procedure來達成以上的抽樣操作。以上幾種常見的抽樣方式,在SURVEYSELECT Procedure語法的基本結構如下:
延續上一章節,本篇將透過官方範例檔,簡介程序實際操作的狀況,以及程序指令代表的意思。
首先,下圖列出範例檔案的前10筆觀察值。StudentID為收案編號;Music在此作為研究組別,分為Yes跟No兩組,在此Yes組視為治療組(Treated),No組視為對照組(Control);Gender為類別型共變數;Absence為連續型共變數。
近幾年已有越來越多醫學研究的研究設計採用配對法比較試驗組與對照組的差異,在眾多配對方式中,本篇文章簡單分享筆者較為常用的配對方式。
在觀察型研究中,為了提升試驗組與對照組之間的可比較性(Comparability),將兩組的背景干擾變項(例如:年齡、性別、共病等)作配對,使兩組在試驗介入以外的其他變項達到均衡。配對後的兩組便能在假設無其他因素干擾之下,比較試驗介入本身對觀察結果的影響。當然,此項假設是理想的假設情境,實際上,配對只能考慮研究者有納入配對的變項,因此配對後的兩組只會在有配對的變項上達到平衡,研究者沒有考慮到的因素可能還是分佈不均衡的。
SAS 2017/7/28出版的文件【SAS 9.4 新功能】中,介紹許多SAS 9.4M1到SAS 9.4M4的增強功能及調整。其中,在Proc Freq程序中,增強估計勝算比 (odds ratio, OR)的信賴區間。以下將透過簡單的範例玩玩這個功能。
首先,先以proc logistic的程序估計勝算比及勝算比的信賴區間,程式碼如下所示(Mortality=1為死亡):
最近同事請我幫忙做合併檔案,在匯入Excel 2010的檔案時,用到了一個小技巧,分享給大家。
Excel是臨床醫師收案時常會使用的資料檔案類型,也常常是醫師們從Microsoft Office Access資料庫中選擇匯出的形式。正確的將外部檔案匯入SAS是資料整理及後續分析關鍵的第一步。此時無論是欄位格式錯誤,或是欄位數、資料筆數錯誤,都將是慘絕人寰的事件,不僅會造成後續分析的障礙,也可能會導致garbagein then garbage out。
本篇文章延續上一篇,分享資料整理過程中常會使用到的另個小技巧:在多頻次的資料集中,如何讓同樣ID的數據們,按照時間序列往前提。
在SAS中如何運用lead達成把資料往前提的任務呢?
在許多分析步驟中,資料清檔檢查與變數的產生是基本動作,如何讓資料集(dataset)能乖乖的達成預想中的結構,需要技術人員與程式達到邏輯上的共鳴。技術人員按照程式邏輯的遊戲規則,下達準確的指令,產出預期的結構。本篇文章分享資料整理過程中常會使用到的小技巧之一:在多頻次的資料集中,如何讓同樣ID的數據們,按照時間序列往後挪。
首先介紹,在SAS中如何單純的把資料往後挪(lag)
大家是否記得之前有提到說若Kruskal-Wallis分析達顯著時,要進一步做事後比較呢?當時有跟各位提到可參考Elliott and Hynan(2011)所提供的SAS巨集來分析,因此這篇主要針對此巨集來做介紹。
先介紹這次分析用到的例子,這次主要想要瞭解不同術後類型(type)的病患在預後(outcome)恢復的情形是否有差異,患者術後類型變數分成「無感染(0)」、「血液感染(1)」、「懷疑感染(2)」,是一個類別變項;至於預後情形分為五個等級(1~5分),預後情形為順序變項,1分最差,5分最佳。
本節主要介紹在進行迴歸分析時,我們常會做一些診斷,以確保分析結果的精確性,而這些診斷包含了(1)共線性診斷(Collinarity diagnosis)、(2)極端值(outliers)的殘差診斷、(3)觀察值的影響力(influential)診斷、(4)殘差自我相關。
相信許多研究者在輸入資料時,許多人都會建立在Excel檔中,主要原因是Excel中有格線,可以方便keyin及減少錯誤的發生,另外就是可以在keyin完後做簡單的運算,像這種變數欄位確定的套裝軟體檔案,SAS提供了資料轉換功能(Import & Export),方便研究者在SAS及其他套裝軟體的資料間使用匯入及匯出的功能,本節以Excel檔為例(先將Excel存成*.xls)。
在之前文章有提到過,若我們想要進行共變異數分析之前,必須先進行迴歸係數同質性檢定,若交互作用未達顯著,則符合迴歸係數同質性假設,可移除交互作用項後繼續共變數分析;但若交互作用達顯著,則違反迴歸係數同質性假設,並需改採詹森內曼法進行分析。
合併資料是大型資料(譬如資料庫)最常見的資料處理之一,由於資料龐大,因此這些資料在一開始都會被拆分在很多資料集裡,直到分析之前才會進行合併的動作。在介紹資料合併之前,將先介紹一下相關有用的敘述句。
將原始資料讀進SAS資料集後,通常需要先進行資料處理,以方便研究者進行後續的分析及解讀報表,這些資料處理可能包含了變數的註解、變數的異動(常見的有保留及刪除變數、變數重新命名)、資料的異動(譬如說根據某些條件選取樣本或刪除樣本)。
研究者在執行量化分析過程的第一步,就是要讀取資料,不同於一般的套裝軟體,SAS並沒有提供四四方方的儲存格讓使用者去輸入資料,因此研究者絕大部分都是要先keyin在外部檔案後再讀到SAS資料集裡,本文將分享比較清楚的資料集輸入方式及一些比較常用功能與大家做討論交流。