公告版位
晨晰統計顧問有限公司在板橋~~服務市話:02-29602817 手機:0918-276-622 聯絡信箱:raising.statistic@gmail.com。 網址:http://www.rai-stat.com.tw。 歡迎大家踴躍發問,問問題請用facebook問(http://tinyurl.com/raising100)會快速回覆喔,我們每週才會統一回一次部落格上的問題。

目前分類:SAS教學 (48)

瀏覽方式: 標題列表 簡短摘要

              最近同事請我幫忙做合併檔案,在匯入Excel 2010的檔案時,用到了一個小技巧,分享給大家。

  Excel是臨床醫師收案時常會使用的資料檔案類型,也常常是醫師們從Microsoft Office Access資料庫中選擇匯出的形式。正確的將外部檔案匯入SAS是資料整理及後續分析關鍵的第一步。此時無論是欄位格式錯誤,或是欄位數、資料筆數錯誤,都將是慘絕人寰的事件,不僅會造成後續分析的障礙,也可能會導致garbagein then garbage out

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

本篇文章延續上一篇,分享資料整理過程中常會使用到的另個小技巧:在多頻次的資料集中,如何讓同樣ID的數據們,按照時間序列往前提。

SAS中如何運用lead達成把資料往前提的任務呢?

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

在許多分析步驟中,資料清檔檢查與變數的產生是基本動作,如何讓資料集(dataset)能乖乖的達成預想中的結構,需要技術人員與程式達到邏輯上的共鳴。技術人員按照程式邏輯的遊戲規則,下達準確的指令,產出預期的結構。本篇文章分享資料整理過程中常會使用到的小技巧之一:在多頻次的資料集中,如何讓同樣ID的數據們,按照時間序列往後挪

首先介紹,在SAS中如何單純的把資料往後挪(lag)

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

大家是否記得之前有提到說若Kruskal-Wallis分析達顯著時,要進一步做事後比較呢?當時有跟各位提到可參考Elliott and Hynan2011)所提供的SAS巨集來分析,因此這篇主要針對此巨集來做介紹。

先介紹這次分析用到的例子,這次主要想要瞭解不同術後類型(type)的病患在預後(outcome)恢復的情形是否有差異,患者術後類型變數分成「無感染(0)」、「血液感染(1)」、「懷疑感染(2)」,是一個類別變項;至於預後情形分為五個等級(1~5分),預後情形為順序變項,1分最差,5分最佳。

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

本節主要介紹在進行迴歸分析時,我們常會做一些診斷,以確保分析結果的精確性,而這些診斷包含了(1)共線性診斷(Collinarity diagnosis)、(2)極端值(outliers)的殘差診斷、(3)觀察值的影響力(influential)診斷、(4)殘差自我相關。

 

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(2) 人氣()

SAS中竟然包含點選分析的功能,這對懶得使用語法或臨時找不到參考語法的人來說真是一項福利,不過要使用這項功能似乎得花費一番功夫。

 

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

2.  匯出(Export

 

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(2) 人氣()

相信許多研究者在輸入資料時,許多人都會建立在Excel檔中,主要原因是Excel中有格線,可以方便keyin及減少錯誤的發生,另外就是可以在keyin完後做簡單的運算,像這種變數欄位確定的套裝軟體檔案,SAS提供了資料轉換功能(Import & Export),方便研究者在SAS及其他套裝軟體的資料間使用匯入及匯出的功能,本節以Excel檔為例(先將Excel存成*.xls)。

 

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

在之前文章有提到過,若我們想要進行共變異數分析之前,必須先進行迴歸係數同質性檢定,若交互作用未達顯著,則符合迴歸係數同質性假設,可移除交互作用項後繼續共變數分析;但若交互作用達顯著,則違反迴歸係數同質性假設,並需改採詹森內曼法進行分析。

 

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

 

三、以MERGE敘述句做資料的橫向合併(變數合併)

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()


合併資料是大型資料(譬如資料庫)最常見的資料處理之一,由於資料龐大,因此這些資料在一開始都會被拆分在很多資料集裡,直到分析之前才會進行合併的動作。在介紹資料合併之前,將先介紹一下相關有用的敘述句。

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

將原始資料讀進SAS資料集後,通常需要先進行資料處理,以方便研究者進行後續的分析及解讀報表,這些資料處理可能包含了變數的註解、變數的異動(常見的有保留及刪除變數、變數重新命名)、資料的異動(譬如說根據某些條件選取樣本或刪除樣本)。

 

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

研究者在執行量化分析過程的第一步,就是要讀取資料,不同於一般的套裝軟體,SAS並沒有提供四四方方的儲存格讓使用者去輸入資料,因此研究者絕大部分都是要先keyin在外部檔案後再讀到SAS資料集裡,本文將分享比較清楚的資料集輸入方式及一些比較常用功能與大家做討論交流。

 

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

本節主要說明在資料讀進SAS並建立資料集時,可以進行的一些動作,以符合一些研究者特殊的需求。

 

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

 

由上一篇可知,在SAS做資料處理與分析的過程中,是由一連串的DATA STEPPROC STEP所組合而成,而不論是哪一個STEP,又皆是由數個敘述句所組成的,以下將針對敘述句與SAS變數做介紹,以及說明應注意的事項。

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

最近在複習利用SAS來做資料的處理,所參考教科書為林政豐老師的SAS應用之資料處理(2005),期望在學習的過程中,將自己所看到且應注意的地方紀錄下來,並與大家來做討論,若有發現錯誤的地方,也希望能給小弟一些批評與指教。

 

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(1) 人氣()


當單因子變異數分析的基本假設無法滿足時,最常被用來代替的是克-瓦二氏單因子等級變異數分析。由此可知,當資料為三組以上的獨立樣本,欲檢定組別在次序變數上是否存在差異,或雖然變數為等距比例的變數,但資料不能符合單因子變異數分析的基本假定時,克-瓦二氏單因子等級變異數分析是代替單因子變異數分析來檢驗多群體間是否有差異的好方法。

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

 

無母數統計是一種不需要考慮樣本所來自的母群之分配條件的統計檢定,是將原始資料經由排序(rank)後,重新給予等級分數,並用此等級分數來做分析,假如有一筆資料為110100500,那麼經由排序後重新給予的等級分數會變為1234

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

    上一章提到在執行共變數分析前,必須先檢視是否有違反迴歸係數同質性的問題,如果違反,表示共變數對於依變項的影響程度,會因為組別的不同而有所差異,此時需改用詹森-內曼法(Johnson – Neyman method)來進行共變數分析。

詹森-內曼法主要原理:由於共變數(X)對於依變數(Y)的影響會因為組別(M)的不同而有所差異,因此必須將結果依共變數的區段不同來解釋。第一個區段為XD+的右邊,此處為組一的Y顯著高於組二;第二個區段為XDXD+的區域,此處雖然組一的Y高於組二,但差異的程度未達顯著水準;第三個區段為XD點上,此處的組一與組二的Y會相等;第四個區段為XD-XD的區域,此處雖然組二的Y高於組一,但差異的程度未達顯著水準;第五個區段為XD-的左邊,此處為組二的Y顯著高於組一。(如下圖)

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(3) 人氣()

共變數分析主要的目的,是要利用統計控制的方法,將會影響到實驗結果的變項以統計方法控制後,再執行分析。

 

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(1) 人氣()

1 23
找更多相關文章與討論

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼