公告版位
晨晰統計顧問有限公司在新北市板橋\服務市話:02-29602817\手機:0918-276-622\信箱:raising.statistic@gmail.com\網址:http://www.rai-stat.com.tw

過去幾年寫了關於樣本數規劃的幾篇文章廣受讀者迴響(http://ppt.cc/HoFLhttp://dasanlin888.pixnet.net/blog/post/34469297http://dasanlin888.pixnet.net/blog/post/34469303),不過雖然在觀念的部分已經做了詳盡的介紹,但是許多讀者仍在實際計算樣本數時會遇到一些困難點,諸如:我應該如何計算效果量(effect size)呢?或是參考文章所提供的數據有缺漏,還是可以引用這篇文章的數據計算樣本數嗎?

目前實務上最常碰到的就是比較兩組的差異,通常為實驗設計(Randomized controlled trial, RCT)或類實驗設計(Quasi-experimental)的研究,由於篇幅的限制因此本文只先介紹這類型的狀況。

晨晰部落格新站 發表在 痞客邦 留言(3) 人氣()

會寫這個主題,是因為筆者以迴歸方法進行中介或調節研究時,除了使用SPSS軟體一一跑出報表外,更方便的方法是利用Hayes, A. F.Preacher, K. J.等人所研發的各種SPSS MacroSAS code,一次把所有數值跑出來。

只是Hayes等人寫的巨集有很多版本,隨著發表時間的不同,功能各有不同,如sobel test、多元中介、Bootstrap、加入控制變項、允許多個自變項、Johnson-Neyman詹森內曼法等,每個版本強調不同的項目。雖然Hayes2013年發表的PROCESS,號稱是集過去於大成的終極版,但也因為功能太強了,以到於使用上有點複雜。

晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()

 

針對類別變項進行交叉分析時,通常會利用卡方檢定(Chi-square test)或費雪精確性檢定(Fisher's exact test)來進行考驗,而醫護領域有時候還會計算出「相對風險」(Relative risk, RR)或「勝算比」(Odds ratio, OR)來作呈現,本篇文章將以此兩項指標為主題進行介紹。

晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()

在鉅量資料時代,資料是多樣性的,一般常用來分析的結構化資料只佔20%,更多的是文字資料,如訪談稿、機器記錄檔(log)、FB臉書、Twitter推特、網誌、部落格、留言版等,所獲得的資料都是一堆文字,對統計學家來說,其分析意義主要在字詞出現頻率。高出現次數代表被討論或關注的頻率高,也就是該字詞可能是一種多數人的主流意見。

所以這方面分析統計方法難度並不高,重點在於如何擷取文字資料、自動辨別字詞與計數。前者會因為來源不同而需要不同的技術或軟體,而後者則需要事先建立龐大的字詞資料庫以供比對。今天筆者介紹一種應用在部落格分析上的方法,非常簡單且容易學習,最重要的是免費。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在進行問卷分析或一些量化研究時,常會遇到一種資料處理的情形『將一個連續值作分組的動作』,譬如說我們收集到受訪對象實際年齡的資料,但想做年齡層的分組,可能以每5歲或每10歲做一個級距分組,或是想依每組差不多的人數,將研究對象分成N組,此時最常用的就是重新編碼(Recode)。

重新編碼這個功能雖然可以精確的將數字依照自己的規則作轉換,且調整的彈性也較大,不過如果研究者若想嘗試許多種分組方式來得到不同的結果,或是這種分組的工作必須重覆執行,那麼SPSS所提供的Visual Binning功能將會為您節省蠻多時間,當然它還是有重新編碼功能做不到的地方。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

所以我們可以得知,LMM廣受歡迎的最主要原因就是可以設定「隨機效果」(random effect),例如允許每一位個案的初始值(在我們這個例子中,就是前測分數)可以不同,換句話說,每個人的初始值具有變異性,我們可以從前測分數(β0i)的第二層迴歸係數中再拆解為3個項目,其中第3項的「μ0i」就是很關鍵的隨機效果,有這一項就代表我們允許前測分數(β0i)具有變異數,到時候統計報表會提供這個變異數的顯著性,此變異數的統計符號以「τ00」表示。

然而此時的「γ01」代表的是實驗組與對照組在前測的分數是否有顯著差異,也就是兩組前測分數的同質性檢驗,值得注意的是,雖然LMM是以兩層方程式來表示,但是在之前介紹的多因子變異數分析或GEE的方程式中也都有這個項目,只是LMM看起來會有一點不太一樣。另外一個不是很具有實務意義的就是「γ00」,它代表的是對照組的前測分數是否不同於0,一般不去解釋這個項目。

晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()

大台北地區民眾因為享受到了捷運的好處,所以都希望捷運蓋愈多愈好,最好是蓋到自己家門口,但這是不可能的事。在民眾期望很高的情況下,政府只要路線稍有增減或變動,立刻會引起很大的反應。所以,筆者發想,如果可以畫一張大台北地區人口密度圖,然後看看這些未來規劃路線經過區域的人口密集程度,或許大家對捷運建設的必要性及優先順序能有必較客觀看法。

這張圖的資料來源,拜Opendata之賜,台北市及新北市政府都有提供里界圖、各里面積及人口數,使用QGIS軟體畫出里界圖。為區分人口密集度,乃以各里之人口數除以面積得到之人口密度數值,以Quantile(Equal count)分為十個等級,顏色愈深代表人口密度愈高。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

 

授課單位

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

三、報表

 

晨晰部落格新站 發表在 痞客邦 留言(19) 人氣()

上一篇曾經介紹過介入性研究常使用的統計方法,有獨立樣本t檢定、成對樣本t檢定、單因子共變數分析、二因子混合設計變異數分析等,除了這些方法之外,本篇再介紹一個最近比較受歡迎的方法廣義估計方程(Generalized estimating equation, GEE)。

嚴格來說,GEE只能算是一種估計方法而非統計方法,且建立在廣義線性模式(Generalized Linear Models, GedLM)來進行分析。那麼本篇將以一個2×2的介入性研究(兩組前後測)為例子,分享如何在SPSSGEE進行分析。

晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()

Close

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

reload

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼