公告版位
晨晰統計顧問有限公司在板橋~~服務市話:02-29602817 手機:0918-276-622 聯絡信箱:raising.statistic@gmail.com。 網址:http://www.rai-stat.com.tw。 歡迎大家踴躍發問,問問題請用facebook問(http://tinyurl.com/raising100)會快速回覆喔,我們每週才會統一回一次部落格上的問題。

目前分類:迴歸與SEM (42)

瀏覽方式: 標題列表 簡短摘要

二、報表

1)模式資訊

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

      多元中介,顧名思義是模式之中包含兩個以上的中介變項(mediator variable),而多元中介又分「平行式(parallel)中介」與「串聯式(serial)中介」(又稱遠程中介)。

 

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

迴歸分析是蠻常採用的統計方法之一,而在進行迴歸分析之前,針對殘差的部分存在幾項基本的假設,當資料違反這些基本假設而進行分析時,通常會使研究結果產生偏誤,至於偏誤的程度,當然就視資料違反的程度而定,其假設包含:

1)常態性

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

進行迴歸分析時,類別變項需轉為虛擬變項(Dummy Variable)的處理,常會讓使用者覺得很麻煩,尤其當研究裡的類別變項較多時,處理起來真的需要比較多的時間。此時,我們可以利用SPSS所分享的公用程式,透過軟體來處理,說明中有提到,此公用程式可適用在SPSS 17.0之後的版本,且有安裝Python Essentials,本篇以SPSS 22.0版為操作介面,介紹安裝此公用程式及後續的操作。

在分析之前,先確認所有要做虛擬編碼(Dummy Code)的變項已做數值的標註,增加資料的可讀性。

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(1) 人氣()

二、報表

1)初步分析

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

一、操作

1)先利用SPSS進行相關分析

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

『http://dasanlin888.pixnet.net/blog/post/34469324』-之前部落格文章中有介紹迴歸係數跟預期方向相反的相關議題,我們定義為可能是多元共線性所造成的,對於研究者來說勢必相當困擾,畢竟此結果無法使用。

因此進行迴歸分析時,當遭遇以下幾種情況時,可能要注意迴歸模式中是否存在多元共線性(multi-collinearity)的問題:(1)共線性指標超過標準(含容忍度tolerance、變異膨脹因子VIF、條件指標CI)(2)迴歸係數的方向性與相關係數相反(3)解釋力R平方過高,但個別變項的係數未達顯著水準。

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

這次想和大家重新檢討一些統計方法的問題。一般人作差異分析,通常都會說比較二組的分數差異用T檢定,比較三組則用單因子變異數分析(one way ANOVA)。每一種方法有不同的使用時機。

 

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

這篇將介紹一個資料處理方法Mean Center」,又稱置中平減或中心化,大部分出現在統計模式中含有交互作用(interaction)項時,必須處理的過程,這是因為在統計模式中,若同時出現主效果(main effects)「A&B」及交互作用效果(interaction effects)「A*B」時,容易使模式產生「多元共線性」(multicollinearity)的問題,而Mean Center」可以降低模式多元共線性的程度,幫助交互作用項迴歸係數的解釋。

一般Mean Center」的作法,是利用描述性統計分析將變項的平均數求出,接著利用轉換裡的計算(Compute),將各自變項減掉各自平均數後創造出新的變項;不過有時研究可能要針對120個變項進行此動作,將會花費不少時間,因此本篇將介紹SPSS分享的新工具,輕鬆完成Mean Center」,此公用程式可適用在SPSS 17.0之後的版本,且有安裝Python Essentials,本篇以SPSS 22.0版為操作介面,介紹安裝此公用程式及後續的操作。

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

9)點選「選項」因為羅吉斯結果的呈現相當注重OR值,因此到這邊設定讓結果show出。

10)按下「Exp(B)之信賴區間(X):95%」,95%即為預設,不需變更。

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

呈上篇對於二元羅吉斯結果做簡單的介紹之後,本篇將針對SPSS操作進行教學,先以下表介紹範例資料的變項

 

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

再來,是依變項的部分,我們知道每個受訪者會發生運動傷害的機率與不會發生運動傷害的機率相加,一定是100%P(會發生)+P(不會發生)=1),在羅吉斯迴歸的方程式中,公式以P(會發生)/P(不會發生)做為一個人會不會發生依變項=1(有運動傷害)的風險(又稱勝算,odds),如果今天一個人會發生的機率是50%的話,不會發生的機率也一定是50%,此時所算出來的風險(odds)就會剛好是1如果今天算出來的風險odds)超過1的話,就代表該受訪者比較可能有依變項=1(有運動傷害)的現象反之odds)低於1的話,就代表該受訪者比較不可能有依變項=1(有運動傷害)的現象所以1即為決定方向性的重要標準。再繼續延伸到下表裡的OR值(odds ratio),OR值可以想成把兩群對象的風險(odds)進行比較,如果有一群對象A的風險(odds)為0.6,另一群對象B的風險為0.3,那對象A相較於對象BOR值則為2AB容易發生),或解釋成對象B相較於對象AOR值則為0.5BA不容易發生)因此仍以1作為OR值判斷的標準OR值超過1,越容易發生Outcome=1(有運動傷害),或可以解釋發生風險比較高

如果上述的教學您還可以接受的話,那麼恭喜您,應該對羅吉斯的迴歸解釋有相當瞭解,若您對於上述不是很明白,也不用擔心,最後要教您最快解釋報表的方法同樣的以自變項及依變項拆成兩段解釋

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(2) 人氣()

一篇研究在經過多種量化分析的統計方法後,經常以找尋預測因子或影響因子作為Ending,所使用的統計方法即是大家常看到的迴歸分析,一般所指的迴歸分析若沒有特別強調,通常都是線性迴歸(Linear Regression),而且是多個自變項所組成的多元線性迴歸(Multiple Linear Regression),不過根據我的經驗,多數客戶學線性迴歸並沒有太大的問題,就算拿書自學也都能輕易上手;而這篇所要介紹的是從統計方法聽起來就比較難的二元羅吉斯迴歸。

二元羅吉斯迴歸與線性迴歸的差別,僅在於依變項/Outcome尺度的不同,當依變項為二類的類別變項(通常Coding 1 & 0)時,會採用二元羅吉斯迴歸進行分析;而當依變項為連續尺度的變項時,則是使用線性迴歸。(當依變項的水準為三類以上,則採用多項式羅吉斯迴歸)。

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(3) 人氣()

本篇將說明如何找到變項各自單獨的解釋力,不過是否符合老闆的需要,還是得視情況而定,本篇提供兩種找尋的方式,(1)仍是以R平方改變量找尋變項解釋力;(2)利用部分相關(part correlation)來計算(非偏/淨相關)。

在分享找尋變項各自單獨的解釋力之前,先利用下圖瞭解對依變項的解釋力包含哪一些,此處設定兩個自變項X1X2,依變項Y來做介紹。

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(1) 人氣()

有關問卷調查的研究中,獨立樣本t檢定、單因子變異數分析、皮爾森相關、多元線性迴歸是推論統計常使用的分析方法,其中前三項都不致於有什麼太大的奇怪問題,但在迴歸分析裡,有些老闆會要求學生「列出每一個自變項對依變項的解釋力,好看出哪一個自變項的影響力或預測力最大」。

老闆的要求看起來似乎合理,不過通常他們認知各自變項的解釋力,和真正變項的解釋力不太相同,以下先介紹如何求出老闆要求的各自變項解釋力,在本文章採用的例子,自變項有3個(分別是X1X2X3),依變項名稱為Y

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(8) 人氣()

會寫這個主題,是因為筆者以迴歸方法進行中介或調節研究時,除了使用SPSS軟體一一跑出報表外,更方便的方法是利用Hayes, A. F.Preacher, K. J.等人所研發的各種SPSS MacroSAS code,一次把所有數值跑出來。

只是Hayes等人寫的巨集有很多版本,隨著發表時間的不同,功能各有不同,如sobel test、多元中介、Bootstrap、加入控制變項、允許多個自變項、Johnson-Neyman詹森內曼法等,每個版本強調不同的項目。雖然Hayes2013年發表的PROCESS,號稱是集過去於大成的終極版,但也因為功能太強了,以到於使用上有點複雜。

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(1) 人氣()

在迴歸分析(線性、羅吉斯等)中,當自變項為類別變項時,研究者都要先進行虛擬編碼(Dummy Code)的動作,關於此部分的操作教學,無論是在網路上或教科書上都相當的多,像是吳明隆(2009p572)或邱皓政(2010p11-18)老師的教科書裡都有提到,有興趣的讀者都可以參考,或是在搜尋引擎上打上關鍵字「虛擬變數」、「虛擬編碼」、「Dummy Variable」、「Dummy Code」,應該都可以找到許多部落格的圖文教學。

因此本篇文章將著重在虛擬變項迴歸係數的解釋,本篇將以比較簡單的線性迴歸來做說明。一般最常見的迴歸分析,自變項幾乎都是連續變項,這是因為迴歸裡假設自變項與依變項存在著線性關係,因此若自變項並非等距或比率變項,其求得的迴歸係數就無法解釋。

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

雖然可以用N + (p*10) 的原則或者是根據正式公式樣本數計算的公式(請參考http://tw.myblog.yahoo.com/da_sanlin/article?mid=2697以及http://tw.myblog.yahoo.com/da_sanlin/article?mid=3273還有http://tw.myblog.yahoo.com/da_sanlin/article?mid=3297)來大略預估需要多少人數,但是如果自變項數目太多時,這個原則可能還是失效的。

例如我們有10個自變項,若按照N + (p*30) 的原則(N100),那麼所需要的是400名樣本;反之,舉一個極端的例子,如果我們有100個自變項,則需要3100名樣本,但按照經驗法則,如果一個迴歸模型中真的包括了100個自變項,那麼儘管樣本數高達3100名但結果可能還是很難有顯著的發現,這100個自變項可能達顯著水準的只會有少數幾個。一般我們在許多期刊論文上面看到迴歸模型的自變項很少超過10個,可能的話也盡量不要超過20個(儘管樣本數可能很大)。

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

無論是各種領域,只要使用到量化研究,最重要的也讓人最感興趣的就是「尋找預測因子」或「尋找關聯性」,或是大膽地說想要探討「因果關係」。例如醫學研究中,胸腔科的醫師可能想知道與肺腺癌病人的存活率有關聯性的變項有哪些;政治學的研究中,可能想要探討什麼特質的選民會投票給某種屬性的候選人或政黨,這也需要用到「預測」的技術,而在現代的統計學中,目前最主流作預測分析的統計方法就是迴歸分析(Regression analysis)。

迴歸分析會因為依變項尺度(Scale)的不同而採用不同的模型,例如連續型依變項是線性迴歸(Linear regression)、二元型依變項是Logistic regression等等各種不同的模型,不過大致上皆可歸類到廣義線性模式(之前的簡介:http://tw.myblog.yahoo.com/da_sanlin/article?mid=2178),不過今天這篇文章不是在介紹統計分析方法,而是要淺談「迴歸模型建立的策略」,簡稱「建模」,說的白話一點就是我們如何決定一組迴歸模型中最後要保留哪些自變項。

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()

(二)建置模式

1.選擇固定效果。

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(2) 人氣()

1 23
找更多相關文章與討論

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼