所以我們可以得知,LMM廣受歡迎的最主要原因就是可以設定「隨機效果」(random effect),例如允許每一位個案的初始值(在我們這個例子中,就是前測分數)可以不同,換句話說,每個人的初始值具有變異性,我們可以從前測分數(β0i)的第二層迴歸係數中再拆解為3個項目,其中第3項的「μ0i」就是很關鍵的隨機效果,有這一項就代表我們允許前測分數(β0i)具有變異數,到時候統計報表會提供這個變異數的顯著性,此變異數的統計符號以「τ00」表示。
然而此時的「γ01」代表的是實驗組與對照組在前測的分數是否有顯著差異,也就是兩組前測分數的同質性檢驗,值得注意的是,雖然LMM是以兩層方程式來表示,但是在之前介紹的多因子變異數分析或GEE的方程式中也都有這個項目,只是LMM看起來會有一點不太一樣。另外一個不是很具有實務意義的就是「γ00」,它代表的是對照組的前測分數是否不同於0,一般不去解釋這個項目。
晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()
大台北地區民眾因為享受到了捷運的好處,所以都希望捷運蓋愈多愈好,最好是蓋到自己家門口,但這是不可能的事。在民眾期望很高的情況下,政府只要路線稍有增減或變動,立刻會引起很大的反應。所以,筆者發想,如果可以畫一張大台北地區人口密度圖,然後看看這些未來規劃路線經過區域的人口密集程度,或許大家對捷運建設的必要性及優先順序能有必較客觀看法。
這張圖的資料來源,拜Opendata之賜,台北市及新北市政府都有提供里界圖、各里面積及人口數,使用QGIS軟體畫出里界圖。為區分人口密集度,乃以各里之人口數除以面積得到之人口密度數值,以Quantile(Equal count)分為十個等級,顏色愈深代表人口密度愈高。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
晨晰部落格新站 發表在 痞客邦 留言(19) 人氣()
上一篇曾經介紹過介入性研究常使用的統計方法,有獨立樣本t檢定、成對樣本t檢定、單因子共變數分析、二因子混合設計變異數分析等,除了這些方法之外,本篇再介紹一個最近比較受歡迎的方法—廣義估計方程(Generalized estimating equation, GEE)。
嚴格來說,GEE只能算是一種估計方法而非統計方法,且建立在廣義線性模式(Generalized Linear Models, GedLM)來進行分析。那麼本篇將以一個2×2的介入性研究(兩組前後測)為例子,分享如何在SPSS以GEE進行分析。
晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()
l 混合線性模式 (Linear mixed model, LMM)
目前為止,對於檢驗實驗介入成效的方法,我們已經知道非常多種方式,而在這其中目前又以GEE及現在即將要介紹的LMM蔚為主流,不過很有趣的是,這兩種方法皆克服了傳統統計方法(例如t-test, ANCOVA, ANOVA)的某些限制,因此才會廣受研究者的歡迎,但這兩種當代主流方法卻在「看待及處理」同一個個案的重複測量資料時,採用完全不同的角度,以下就讓我們開始介紹LMM。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
為了因應Big Data巨量資料時代來臨,政府推動開放資料加值應用(Open Data),一方增進政府施政透明度、提升民眾生活品質,一方面也滿足產業界需求。初步已建置了一個開放資料平臺,依照主題及機關別,提供分類查詢。其中一個比較熱門的應用是:不動產買賣實價登錄批次資料。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
在之前一篇「SPSS操作HLM教學」中提到一個關於資料處理的名詞「Aggregate」(整合),其主要的功能是在各群體之下,針對某一個變項去計算每個群體的統計量,實務上最常計算的統計量為平均數。
就我自己的經驗,這個功能常被用在具階層性(hierarchical)的資料,因為關於這種資料的研究,要時常在不同層次的單位下來進行分析,所以常會看到這樣研究裡的樣本數忽大忽小。就如同下圖,每五位教師都來自於同一個學校,假設有1,000位教師,對關於教師的變項進行分析時,那麼樣本數應該會有1,000個,但如果是對於學校的變項進行分析時,樣本數就會剩下200個了。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
在迴歸分析(線性、羅吉斯…等)中,當自變項為類別變項時,研究者都要先進行虛擬編碼(Dummy Code)的動作,關於此部分的操作教學,無論是在網路上或教科書上都相當的多,像是吳明隆(2009,p572)或邱皓政(2010,p11-18)老師的教科書裡都有提到,有興趣的讀者都可以參考,或是在搜尋引擎上打上關鍵字「虛擬變數」、「虛擬編碼」、「Dummy Variable」、「Dummy Code」,應該都可以找到許多部落格的圖文教學。
因此本篇文章將著重在虛擬變項迴歸係數的解釋,本篇將以比較簡單的線性迴歸來做說明。一般最常見的迴歸分析,自變項幾乎都是連續變項,這是因為迴歸裡假設自變項與依變項存在著線性關係,因此若自變項並非等距或比率變項,其求得的迴歸係數就無法解釋。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
接著開始討論方程式多出的「CORR」此項目,稱之為工作相關矩陣(Working correlation matrix),這是GEE兩大特色之一,而這個工作相關矩陣就是GEE如何「看待」重複測量的精神所在,簡單地來說,工作相關矩陣允許同一受測者的不同時間點之間的依變項是具有相關的(正相關),例如前測分數越高者其後測分數通常也會高(反之亦然)。不僅如此,GEE的工作相關矩陣還可以選擇不同的相關類型,我們就先簡介幾種最常見的,包括獨立(independent)、未結構化(unstructured)、可交換(Exchangeable)以及AR1(Auto-regressive first order),如以下:
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()