在迴歸分析(線性、羅吉斯等)中,當自變項為類別變項時,研究者都要先進行虛擬編碼(Dummy Code)的動作,關於此部分的操作教學,無論是在網路上或教科書上都相當的多,像是吳明隆(2009p572)或邱皓政(2010p11-18)老師的教科書裡都有提到,有興趣的讀者都可以參考,或是在搜尋引擎上打上關鍵字「虛擬變數」、「虛擬編碼」、「Dummy Variable」、「Dummy Code」,應該都可以找到許多部落格的圖文教學。

因此本篇文章將著重在虛擬變項迴歸係數的解釋,本篇將以比較簡單的線性迴歸來做說明。一般最常見的迴歸分析,自變項幾乎都是連續變項,這是因為迴歸裡假設自變項與依變項存在著線性關係,因此若自變項並非等距或比率變項,其求得的迴歸係數就無法解釋。

簡單迴歸方程式為Y=B0+B1XY為依變項,X為自變項,B0B1則是經迴歸分析所估計出來的迴歸係數,其中更以B1說明了XY之間的關係。

舉例來說,依變項為使用者對產品的使用意願(Y:使用意願),自變項為使用者在試用後對於產品易用感受(X:易用性)方程式:使用意願=1.3+0.7×易用性0.7則是使用者在易用性的感受對使用意願的影響程度,對於易用性感受為1分的消費者來說,其使用意願為1.3+0.7×1=2分;對於易用性感受為2分的消費者來說,其使用意願為1.3+0.7×2=2.7分,因此我們會解釋成當受訪者在易用性上每增加1分,其使用意願會增加0.7分。

如果將「易用性」換成「性別」,方程式:使用意願=1.3+0.7×性別,此時若解釋成當性別每增加1分,其使用意願會增加0.7分,就會變得很奇怪,因為我們都清楚性別屬於類別變項,因此要換一種解釋方式,但該如何解釋呢?

通常進行迴歸分析,都會列出一張虛擬編碼對照表,如下表。

 

性別

代號

1

0

 

由表中可知,男性受訪者的代號為1,女性受訪者的代號為0,此時分別將10代回原方程式。

男性的使用意願=1.3+0.7×1=2女性的使用意願=1.3+0.7×0=1.3,將男性的使用意願-女性的使用意願=0.7分,剛好就是迴歸係數B1,因此B1即為此兩族群的差異情形,而且就像上面看到的,迴歸係數B1是以代號為1的對象減去代號為0的對象,因此當預到虛擬變項的迴歸係數要解釋時,都直接解釋成(代號1族群)相對於(代號0族群)會有比較高(迴歸係數為正)比較低(迴歸係數為負)的依變項程度。

當類別數變成3組,其虛擬編碼對照表如下,當迴歸方程式為:使用意願=1.3+0.7×D1+1.2×D2,分別將三組的代號代回方程式中。

國中以下的使用意願=1.3+0.7×0+1.2×0=1.3

高中的使用意願=1.3+0.7×1+1.2×0=2.0

大學以上的使用意願=1.3+0.7×0+1.2×1=2.5

 

高中-國中以下=2.0-1.3=0.7,剛好就是D1的迴歸係數

大學以上-國中以下=2.5-1.3=1.2,剛好就是D2的迴歸係數

 

教育程度

D1

D2

國中以下

0

0

高中

1

0

大學以上

0

1

 

因此日後在解釋迴歸係數就別困擾了,先找尋所有虛擬變項代碼都為0的那組視為參照組(國中以下),迴歸係數D1的解釋即D1=1的那組(高中)相對於參照組(國中以下)會有更高的使用意願(0.7>0為正值)迴歸係數D2的解釋即D2=1的那組(大學以上)相對於參照組(國中以下)會有更高的使用意願(1.2>0為正值)。

 

吳明隆(2009)。SPSS操作與應用-問卷統計分析實務。台北:五南。

邱皓政(2010)。量化研究與統計分析:SPSSPASW)資料分析範例解析。臺北市:五南

創作者介紹

晨晰統計部落格新站(統計、SPSS、BIG DATA討論園地)

晨晰部落格新站 發表在 痞客邦 PIXNET 留言(0) 人氣()