這次想和大家重新檢討一些統計方法的問題。一般人作差異分析,通常都會說比較二組的分數差異用T檢定,比較三組則用單因子變異數分析(one way ANOVA)。每一種方法有不同的使用時機。
有沒有一種方法,可以適用各種情形呢?如同孔子所說「吾道一以貫之」。答案是YES,那就是〝迴歸〞,這個統計界最偉大的發明。
我們以男女二組的滿意度比較為例,在SPSS上跑T檢定及迴歸,結果如下。
l T檢定
t=2.326,p=.027 < .05,因此得出男女滿意度有顯著差異。
男生(4.095)大於女生(3.733),男生比女生高了0.362分。
l 迴歸
首先,gender的t = 2.326,p = .027 < .05,這和t檢定結果相同。
其次,未標準化迴歸係數B = 0.362,這正代較了男女的差距,也和t檢定相同。
由於我們將女生coding為0,此時constant的B = 3.733,剛好就是女生的平均滿意度,把3.733+0.362=4.095,剛好就是男生的平均滿意度。
講到這樣,你會不會覺得很神奇?過去我們學統計,講T檢定,印象中是用一個類別變項(2類)作解釋變項(explanatory),而連續分數為反應變項(response),比較的是二類群體的平均分數。
而學迴歸時,印象中是看某個連續分數X對另一個連續分數Y的預測力或解釋力。怎麼這會兒,二者又一樣了?
我們來看看散布圖,以X軸為性別,Y軸為滿意度,會得到二排點點,這是因為X軸只有2值(0為女,1為男)。這時在T檢定,是去比較二者平均數的差距是否夠大?足以證明男生比女生的滿意度高?
但是以迴歸的觀點,迴歸係數代表的是斜率,即紅線÷綠線。但這時紅線代表男女的差距,綠線正好為1,則這時斜率恰等於男女差距。這下子,T檢定不就等於迴歸了嗎?
而且當迴歸的X以0代入時,Y為constant,恰等於女性的平均數。所以你看,迴歸是不是可以用來作二組的差異比較呢?
客倌也許會說,那如果是三組比較的one way ANOVA呢?迴歸也可以嗎?答案也是YES。客倌請看:
- 二者的ANOVA表是一樣的。
- one way ANOVA中單身、已婚、單親者平均分別為3.929、3.830、4.071。而迴歸係數B中,constant = 3.929、3.929+(-0.098)=3.831、3.929+(0.143)=4.072,也幾乎完全相同。
- one way ANOVA的LSD事後比較中,前二列的p值為.660、.571。而迴歸係數T檢定的p值也完全相同。
- 唯一的不同是在操作上,迴歸分析的解釋變項marriage必須先Dummy,詳情google便知曉。
l One way ANOVA
l 迴歸
註:marriage先進行Dummy,marriageD_2 =已婚、marriageD_3=單親
總之,「迴歸」是統計學的王道,貫通統計的任督二脈。我甚至認為,初學者把「迴歸」徹底學熟、學通、學透,你就已經有九陽神功護體,學什麼統計都特別快,日後遇到相關、二因子變異數分析、共變數分析,仍至因素分析、結構方程模式、階層線性模式….等,只重其義,不重其招,就練成統計神功了。