公告版位
晨晰統計顧問有限公司在新北市板橋\服務市話:02-29602817\手機:0918-276-622\信箱:raising.statistic@gmail.com\網址:http://www.rai-stat.com.tw

為了因應Big Data巨量資料時代來臨,政府推動開放資料加值應用(Open Data),一方增進政府施政透明度、提升民眾生活品質,一方面也滿足產業界需求。初步已建置了一個開放資料平臺,依照主題及機關別,提供分類查詢。其中一個比較熱門的應用是:不動產買賣實價登錄批次資料

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在之前一篇「SPSS操作HLM教學」中提到一個關於資料處理的名詞「Aggregate」(整合),其主要的功能是在各群體之下,針對某一個變項去計算每個群體的統計量,實務上最常計算的統計量為平均數。

就我自己的經驗,這個功能常被用在具階層性(hierarchical)的資料,因為關於這種資料的研究,要時常在不同層次的單位下來進行分析,所以常會看到這樣研究裡的樣本數忽大忽小。就如同下圖,每五位教師都來自於同一個學校,假設有1,000位教師,對關於教師的變項進行分析時,那麼樣本數應該會有1,000個,但如果是對於學校的變項進行分析時,樣本數就會剩下200個了。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在迴歸分析(線性、羅吉斯等)中,當自變項為類別變項時,研究者都要先進行虛擬編碼(Dummy Code)的動作,關於此部分的操作教學,無論是在網路上或教科書上都相當的多,像是吳明隆(2009p572)或邱皓政(2010p11-18)老師的教科書裡都有提到,有興趣的讀者都可以參考,或是在搜尋引擎上打上關鍵字「虛擬變數」、「虛擬編碼」、「Dummy Variable」、「Dummy Code」,應該都可以找到許多部落格的圖文教學。

因此本篇文章將著重在虛擬變項迴歸係數的解釋,本篇將以比較簡單的線性迴歸來做說明。一般最常見的迴歸分析,自變項幾乎都是連續變項,這是因為迴歸裡假設自變項與依變項存在著線性關係,因此若自變項並非等距或比率變項,其求得的迴歸係數就無法解釋。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

接著開始討論方程式多出的「CORR」此項目,稱之為工作相關矩陣(Working correlation matrix),這是GEE兩大特色之一,而這個工作相關矩陣就是GEE如何「看待」重複測量的精神所在,簡單地來說,工作相關矩陣允許同一受測者的不同時間點之間的依變項是具有相關的(正相關),例如前測分數越高者其後測分數通常也會高(反之亦然)。不僅如此,GEE的工作相關矩陣還可以選擇不同的相關類型,我們就先簡介幾種最常見的,包括獨立(independent)、未結構化(unstructured)、可交換(Exchangeable)以及AR1Auto-regressive first order),如以下:

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

l   廣義估計方程式 (Generalized estimating equation, GEE)

關於實驗(介入)效果的檢驗,目前我們已經學習到了t檢定(獨立t與配對t)、差異中的差異分析(DID)、共變數分析(ANCOVA)以及多因子變異數分析(Multi-factorial ANOVA)。基本上這些方法都是至少在1950年代以前就發展完畢的工具,如果用Google scholar搜尋「Analysis of covariance」或「Analysis of variance」,發現從1930年代就有文獻在報導,而在19301980年代其間,其實上述這些方法在應用於實驗介入效果上並沒有太多的改變。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

前幾天有位同事去參加一個心理學方面的聚會,認識一個新朋友,同事遞上名片那個人立刻說:「原來你是晨晰統計的人阿」,他說政大一位教授有跟他說過,晨晰的部落格有很多好的文章,很不錯值得參考,所以他對晨晰有點印象,因此當晚和同事彼此相談甚歡,我們被肯定了,我同事感到非常開心。

去年有一個學校的博士生,他作了一個比較困難的統計,找我們作諮詢,就在他口試的時候,口委非常驚訝的說這個統計分析作的非常好,他得到了95分,從此那個分析成為他們系所的參考範本,並且過了半年,那個系上好幾個教授都帶博士生來我們公司諮詢,說要學習如何製作那個分析。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

2014課程出來囉,歡迎大家提早報名囉~~

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

前幾篇有提到從短資料轉成長資料,不過一般來說,除非有特殊需求,否則一般較基本的統計分析皆會以短資料來進行,但小編前陣子遇到一個題目的data是給長資料,因此恰好相反,要先轉成短資料才行。那我們就拿上次已轉完的長資料(long form data)為例,試著再轉回去短資料。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

 

l   二因子混合設計變異數分析 (Two-way mixed-design ANOVA)

晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()

ANCOVA還有一個額外的好處,就是即使我們是隨機分組,但還是不能保證實驗組與對照組在前測分數及所有人口學變項都是同質的,或許實驗組還是比控制組有比較高或低的前測得分,而此時如果用獨立t檢定組別在後測的得分,可能會得到錯誤的結論。讓我們看一下下面這個例子,一開始實驗組就比對照組有較高的前測得分(70 vs. 60),而經過介入之後兩組都分別進步了20分,此時如果直接用獨立t檢定看兩組在後測的差異(90 vs. 80),會得到實驗組比對照組有更高的後測得分,進而宣稱這是實驗所造成的介入效果,很明顯地這個結論是錯誤的。而此時若我們是用DID分析,會發現兩組的進步幅度無顯著差異(都是20分),或者是用ANCOVA比較調整後後測分數也會發現其實是沒有組別差異,在這個例子中,DIDANCOVA都可以得到相對正確的結論:介入無效。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

Close

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

reload

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼