公告版位
晨晰統計顧問有限公司在板橋~~服務市話:02-29602817 手機:0918-276-622 聯絡信箱:raising.statistic@gmail.com。 網址:http://www.rai-stat.com.tw。 歡迎大家踴躍發問,問問題請用facebook問(http://tinyurl.com/raising100)會快速回覆喔,我們每週才會統一回一次部落格上的問題。

過去幾年寫了關於樣本數規劃的幾篇文章廣受讀者迴響(http://ppt.cc/HoFLhttp://dasanlin888.pixnet.net/blog/post/34469297http://dasanlin888.pixnet.net/blog/post/34469303),不過雖然在觀念的部分已經做了詳盡的介紹,但是許多讀者仍在實際計算樣本數時會遇到一些困難點,諸如:我應該如何計算效果量(effect size)呢?或是參考文章所提供的數據有缺漏,還是可以引用這篇文章的數據計算樣本數嗎?

目前實務上最常碰到的就是比較兩組的差異,通常為實驗設計(Randomized controlled trial, RCT)或類實驗設計(Quasi-experimental)的研究,由於篇幅的限制因此本文只先介紹這類型的狀況。

Posted by 晨晰部落格新站 at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

會寫這個主題,是因為筆者以迴歸方法進行中介或調節研究時,除了使用SPSS軟體一一跑出報表外,更方便的方法是利用Hayes, A. F.Preacher, K. J.等人所研發的各種SPSS MacroSAS code,一次把所有數值跑出來。

只是Hayes等人寫的巨集有很多版本,隨著發表時間的不同,功能各有不同,如sobel test、多元中介、Bootstrap、加入控制變項、允許多個自變項、Johnson-Neyman詹森內曼法等,每個版本強調不同的項目。雖然Hayes2013年發表的PROCESS,號稱是集過去於大成的終極版,但也因為功能太強了,以到於使用上有點複雜。

Posted by 晨晰部落格新站 at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

 

針對類別變項進行交叉分析時,通常會利用卡方檢定(Chi-square test)或費雪精確性檢定(Fisher's exact test)來進行考驗,而醫護領域有時候還會計算出「相對風險」(Relative risk, RR)或「勝算比」(Odds ratio, OR)來作呈現,本篇文章將以此兩項指標為主題進行介紹。

Posted by 晨晰部落格新站 at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

在鉅量資料時代,資料是多樣性的,一般常用來分析的結構化資料只佔20%,更多的是文字資料,如訪談稿、機器記錄檔(log)、FB臉書、Twitter推特、網誌、部落格、留言版等,所獲得的資料都是一堆文字,對統計學家來說,其分析意義主要在字詞出現頻率。高出現次數代表被討論或關注的頻率高,也就是該字詞可能是一種多數人的主流意見。

所以這方面分析統計方法難度並不高,重點在於如何擷取文字資料、自動辨別字詞與計數。前者會因為來源不同而需要不同的技術或軟體,而後者則需要事先建立龐大的字詞資料庫以供比對。今天筆者介紹一種應用在部落格分析上的方法,非常簡單且容易學習,最重要的是免費。

Posted by 晨晰部落格新站 at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

在進行問卷分析或一些量化研究時,常會遇到一種資料處理的情形『將一個連續值作分組的動作』,譬如說我們收集到受訪對象實際年齡的資料,但想做年齡層的分組,可能以每5歲或每10歲做一個級距分組,或是想依每組差不多的人數,將研究對象分成N組,此時最常用的就是重新編碼(Recode)。

重新編碼這個功能雖然可以精確的將數字依照自己的規則作轉換,且調整的彈性也較大,不過如果研究者若想嘗試許多種分組方式來得到不同的結果,或是這種分組的工作必須重覆執行,那麼SPSS所提供的Visual Binning功能將會為您節省蠻多時間,當然它還是有重新編碼功能做不到的地方。

Posted by 晨晰部落格新站 at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

所以我們可以得知,LMM廣受歡迎的最主要原因就是可以設定「隨機效果」(random effect),例如允許每一位個案的初始值(在我們這個例子中,就是前測分數)可以不同,換句話說,每個人的初始值具有變異性,我們可以從前測分數(β0i)的第二層迴歸係數中再拆解為3個項目,其中第3項的「μ0i」就是很關鍵的隨機效果,有這一項就代表我們允許前測分數(β0i)具有變異數,到時候統計報表會提供這個變異數的顯著性,此變異數的統計符號以「τ00」表示。

然而此時的「γ01」代表的是實驗組與對照組在前測的分數是否有顯著差異,也就是兩組前測分數的同質性檢驗,值得注意的是,雖然LMM是以兩層方程式來表示,但是在之前介紹的多因子變異數分析或GEE的方程式中也都有這個項目,只是LMM看起來會有一點不太一樣。另外一個不是很具有實務意義的就是「γ00」,它代表的是對照組的前測分數是否不同於0,一般不去解釋這個項目。

Posted by 晨晰部落格新站 at 痞客邦 PIXNET 留言(1) 引用(0) 人氣()

大台北地區民眾因為享受到了捷運的好處,所以都希望捷運蓋愈多愈好,最好是蓋到自己家門口,但這是不可能的事。在民眾期望很高的情況下,政府只要路線稍有增減或變動,立刻會引起很大的反應。所以,筆者發想,如果可以畫一張大台北地區人口密度圖,然後看看這些未來規劃路線經過區域的人口密集程度,或許大家對捷運建設的必要性及優先順序能有必較客觀看法。

這張圖的資料來源,拜Opendata之賜,台北市及新北市政府都有提供里界圖、各里面積及人口數,使用QGIS軟體畫出里界圖。為區分人口密集度,乃以各里之人口數除以面積得到之人口密度數值,以Quantile(Equal count)分為十個等級,顏色愈深代表人口密度愈高。

Posted by 晨晰部落格新站 at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

 

授課單位

Posted by 晨晰部落格新站 at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()

三、報表

 

Posted by 晨晰部落格新站 at 痞客邦 PIXNET 留言(2) 引用(0) 人氣()

上一篇曾經介紹過介入性研究常使用的統計方法,有獨立樣本t檢定、成對樣本t檢定、單因子共變數分析、二因子混合設計變異數分析等,除了這些方法之外,本篇再介紹一個最近比較受歡迎的方法廣義估計方程(Generalized estimating equation, GEE)。

嚴格來說,GEE只能算是一種估計方法而非統計方法,且建立在廣義線性模式(Generalized Linear Models, GedLM)來進行分析。那麼本篇將以一個2×2的介入性研究(兩組前後測)為例子,分享如何在SPSSGEE進行分析。

Posted by 晨晰部落格新站 at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()