由上一篇可知,在SAS做資料處理與分析的過程中,是由一連串的DATA STEP與PROC STEP所組合而成,而不論是哪一個STEP,又皆是由數個敘述句所組成的,以下將針對敘述句與SAS變數做介紹,以及說明應注意的事項。
由上一篇可知,在SAS做資料處理與分析的過程中,是由一連串的DATA STEP與PROC STEP所組合而成,而不論是哪一個STEP,又皆是由數個敘述句所組成的,以下將針對敘述句與SAS變數做介紹,以及說明應注意的事項。
今(2012)年2月中旬到臺灣師範大學上了許獻元博士的階層線性模型(HLM)課程,一個最大的感想是,高階統計方法的出現,並不是為了賣弄高深的數學,故意搞了複雜的統計公式,而是人類社會的實況就是這麼複雜,用簡化的統計方法,已經不能符合需要。
【2018-10-8經網友提醒,發現舉例錯誤,因此更正】
在醫學領域裡頭常常將依變項(dependent variable / outcome)定義為二元的變項(binary / dichotomous),有一些是天生的二元變項,例如病人死亡與否、病人洗腎與否;有些則是人為定義為二元變項,例如心臟科常將病人的左心室射血分數(left ventricular ejection fraction, LVEF)小於40% (or 35%) 為異常,或腎臟科將病人的腎絲球過濾率(estimated Glomerular filtration rate, eGFR)定義為小於60%為異常。
最近在複習利用SAS來做資料的處理,所參考教科書為林政豐老師的SAS應用之資料處理(2005),期望在學習的過程中,將自己所看到且應注意的地方紀錄下來,並與大家來做討論,若有發現錯誤的地方,也希望能給小弟一些批評與指教。
本篇文章旨在介紹醫學領域常見的研究設計(research design),原則上只介紹同時有實驗組與對照組研究設計(因為最常見),下圖列出簡易版的研究設計分類圖(註:在流行病學所定義的研究設計比以下的圖還複雜許多,本例只是用最簡化的例子作示範),大致可分成前瞻性研究(prospective study)及回溯性研究(retrospective study)兩個類別,其中前瞻性研究至少包括兩種主要的研究設計:①臨床實驗(clinical trials)②世代研究(cohort study),而回溯性研究則至少包括最常見的病例對照研究(case-control study)。
坊間基礎統計書籍如果沒有上千本,那至少也有上百本吧,但是我的個人經驗顯示,大多數都侷限於數理上的推論、太過強調統計的計算過程或者舉的例子實在是很難令人感到興趣,然而如果閱讀一些統計益智書籍(例如統計讓數字說話、醉漢走路)又無法真正在作學術研究的時候有所幫助。
當單因子變異數分析的基本假設無法滿足時,最常被用來代替的是克-瓦二氏單因子等級變異數分析。由此可知,當資料為三組以上的獨立樣本,欲檢定組別在次序變數上是否存在差異,或雖然變數為等距比例的變數,但資料不能符合單因子變異數分析的基本假定時,克-瓦二氏單因子等級變異數分析是代替單因子變異數分析來檢驗多群體間是否有差異的好方法。
無母數統計是一種不需要考慮樣本所來自的母群之分配條件的統計檢定,是將原始資料經由排序(rank)後,重新給予等級分數,並用此等級分數來做分析,假如有一筆資料為1、10、100、500,那麼經由排序後重新給予的等級分數會變為1、2、3、4。
林書豪旋風現在正颳翻全世界,大家都在注意這個哈佛小子是否還會有更突破的表現,看他個子小小穿梭在長人壯漢中廝殺,真的好痛快阿!不過喜歡用數據來幫助思考的我不禁手癢癢,會懷疑當「大家都說他打的好,是否代表他真的打的很好呢?」,有時候或許只是想要炒新聞炒話題,誇大了他的表現會不會?畢竟他是華人,又是哈佛畢業,能在NBA有表現是很有新聞點的,會不會因此被過度炒作呢??