有關問卷調查的研究中,獨立樣本t檢定、單因子變異數分析、皮爾森相關、多元線性迴歸是推論統計常使用的分析方法,其中前三項都不致於有什麼太大的奇怪問題,但在迴歸分析裡,有些老闆會要求學生「列出每一個自變項對依變項的解釋力,好看出哪一個自變項的影響力或預測力最大」。
老闆的要求看起來似乎合理,不過通常他們認知各自變項的解釋力,和真正變項的解釋力不太相同,以下先介紹如何求出老闆要求的各自變項解釋力,在本文章採用的例子,自變項有3個(分別是X1、X2、X3),依變項名稱為Y。
若迴歸分析選取變項的方式為逐步法(stepwise),點選方式參考如下。
(1)點選「分析」→「迴歸」→「線性」
(2)將左邊的依變項Y丟入右邊的依變數欄位
(3)將左邊的自變項X1、X2、X3丟入右邊的自變數欄位
(4)方法選用「逐步迴歸分析法」
(5)點選「統計量」→「迴歸」→「線性」
(6)估計值與模式適合度預設已勾選,另外再勾選「R平方改變量」
(7)模式摘要顯示,最終模式R平方=.384,表示此3個變項的聯合解釋力達38.4%。
(8)由R平方改變量得知,增加X1時為模式增加30.6%的解釋力,增加X2時為模式增加6.9%的解釋力,增加X3時為模式增加0.9%的解釋力,30.6%+6.9%+0.9%又剛好為38.4%,因此很容易讓人認定此三筆數值剛好就是該變項的各自解釋力,而一般老闆要求研究生求的也是這個。
若迴歸分析選取變項的方式為全部進入法(Enter),點選方式參考如下。
(1)點選「分析」→「迴歸」→「線性」
(2)將左邊的依變項Y丟入右邊的依變數欄位
(3)先將左邊的自變項X1丟入右邊的自變數欄位
(4)方法選用「輸入」
(5)點選「下一個」
(6)此時會來到區塊2的部分,且發現自變數欄位被清空,這時再把左邊的自變項X2丟入右邊的自變數欄位
(7)方法一樣選用「輸入」
(8)點選「下一個」
(9)此時會來到區塊3的部分,且發現自變數欄位被清空,這時再把左邊的自變項X3丟入右邊的自變數欄位
(10)方法一樣選用「輸入」
(11)點選「統計量」
(12)估計值與模式適合度預設已勾選,另外再勾選「R平方改變量」
(13)模式摘要顯示,最終模式R平方=.384,表示此3個變項的聯合解釋力達38.4%。
(14)此處配合論文向度的一致性,變項順序按照X1、X2、X3一一放入,由R平方改變量得知,增加X1時為模式增加30.6%的解釋力,增加X2時為模式增加6.9%的解釋力,增加X3時為模式增加0.9%的解釋力,所以結論是X1的影響最大,其次為X2,而X3的影響力最小。
(15)再來我們調動一下自變項的順序,改為X3、X2、X1,模式摘要顯示,最終模式R平方=.384,表示此3個變項的聯合解釋力仍是38.4%。
(16)再來看R平方改變量,此處似乎和剛剛的結果不同,增加X3時為模式增加24.6%的解釋力,增加X2時為模式增加6.5%的解釋力,增加X3時為模式增加7.3%的解釋力,所以結論是X3的影響最大,其次為X1,而X2的影響力最小。
根據結果得知,R平方改變時並不能視為自變項各自的解釋力,這是因為在計算R平方改變量時,已經控制先前自變項對依變項的影響了,以(14)為例,X1的解釋力30.6%,並未控制任何其他的自變項,因為是第一個順位被選進到模式的變項,因此通常有最高的解釋力;X2的解釋力6.9%,已經控制了X1對依變項的影響,因此解釋力就不會那麼高了;X3的解釋力0.9%,已經控制了X1與X2對依變項的影響,因此解釋力又會再更嚴格。
因此在大部分的情況,先放到模式的解釋力通常都比較高,而越後面放到模式的解釋力則會越低。
延伸閱讀
SPSS Create Dummy Variables Tool(SPSS建立虛擬變數工具)
HLM學習心得分享(1)~康顧問分享
利用SPSS之PROCESS分析遠程中介模式~~上