當我們想探討兩個變數之間的關聯性時,我們除了可以計算相關係數以瞭解兩個變數之間的關聯強度外,亦可利用迴歸分析,來探討自變項對於依變項的影響或預測情形。
當自變項與依變項都只有一個時,我們稱為簡單迴歸分析,結果會跟我們去跑皮爾森積差相關一樣!!但如果自變項為兩個以上時,我們稱此叫複迴歸或多元迴歸,其實複迴歸只是簡單迴歸的延伸,在考慮其他自變項對依變項的影響之下,計算自變項對於依變項的影響力或預測力。
通常迴歸分析的結果會較注意以下三點
第一:迴歸方程式為何?
第二:整體模式是否良好,解釋力為何?
第三:哪些自變數能有效影響或預測依變數?
另外在做迴歸分析時有一個很重要的選項:選擇自變項的方法,一般最常用的有兩種,一是全部進入法(Enter);另一個則是逐漸法(Stepwise)。全部進入法主要是想探討所有自變數對於依變數的影響或預測情形;逐步法則是想要從一堆自變數中,找到幾個能影響或預測依變數的有效因子(亦即找一個有效模式),以下將以一個閱讀測驗的例子,利用多元逐步迴歸來做分析。
Ex:影響閱讀測驗的重要因子(以逐步法為例)
閱讀測驗成績(Y) |
單字成績(X1) |
片語成績(X2) |
文法成績(X3) |
自我期望(X4) |
智力測驗成績(X5) |
70 |
16 |
19 |
29 |
88 |
108 |
63 |
10 |
30 |
23 |
71 |
113 |
51 |
9 |
35 |
27 |
78 |
103 |
71 |
19 |
20 |
40 |
75 |
109 |
79 |
22 |
42 |
25 |
85 |
114 |
81 |
21 |
42 |
38 |
92 |
116 |
80 |
14 |
22 |
16 |
86 |
125 |
44 |
20 |
30 |
22 |
50 |
101 |
59 |
18 |
48 |
20 |
65 |
92 |
61 |
17 |
31 |
10 |
73 |
108 |
60 |
21 |
35 |
27 |
71 |
111 |
69 |
13 |
43 |
33 |
79 |
112 |
70 |
17 |
39 |
40 |
76 |
120 |
74 |
11 |
50 |
32 |
84 |
125 |
50 |
8 |
48 |
29 |
43 |
96 |
62 |
12 |
50 |
33 |
80 |
105 |
(1)語法
1.設定原始資料集
現在要將我們的資料輸入到SAS裡,
DATA REG是指設定一個叫做REG的資料集
INPUT Y X1 X2 X3 X4 X5是指設定叫Y、X1、X2、X3、X4與X5的變數
CARD是指開始輸入我們的資料
2.執行逐步迴歸
PROC REG CORR是指執行迴歸分析,並要求計算相關係數矩陣
Model Y=X1 X2 X3 X4 X5是指模式的依變項為Y,
自變項為X1、X2、X3、X4與X5
STB SELECTION/STEPWISE是指要求計算出標準化的迴歸係數,並採用逐步法選擇變數
(2)報表
1.相關係數矩陣
包含依變項與所有的自變項
2.逐步法第一步
R平方解釋量為0.6810,Cp是用來判斷模型是否有很大偏誤的指標,比較少研究者提到
3.ANOVA摘要表
F檢定達顯著,表示第一步所選進來的自變項,整體模式不錯
4.迴歸係數摘要表
由此可知,選進來X4變項後,F值增加29.89,達顯著水準,表示選進來的自變項能讓模式更良好,X4的未標準化迴歸係數為0.689,標準誤為0.126