有關統計方法的諮詢,迴歸分析是最常被詢問的統計方法之一,如何操作軟體、如何解讀報表、如何呈現結果,這些相信在坊間教科書或是上網就可以找到一堆教學資料,前提是要輸入對的關鍵字,因此我們這篇就來討論『該選什麼迴歸分析』。

 

1.jpg

 

會想討論這個題目,是因為偶爾會遇到類似下面這個問題,「請問按照我的資料,我應該要用多元迴歸呢?還是複迴歸呢?還是線性迴歸呢?」,沒錯,這三個迴歸有87%的機率指的是同一種迴歸,相信會遇到這樣的問題,因為參考來源的paper對於迴歸名稱不一樣所致,因此我們必須靠自己瞭解這些名稱的組合。

首先,先按照依變項的分布判斷迴歸模型,在社會科學領域中,就我所做的案件經驗裡,有九成使用了線性迴歸(當依變項為連續變項時),有一成使用了羅吉斯迴歸(當依變項為類別變項時),在這種出現率差異極大的情況下,當沒有特別宣稱使用哪種迴歸時,一般都會認定是用線性迴歸,至於其他如羅吉斯迴歸就會特別強調。

再來,按照自變項(解釋變項)數,分成了一個自變項的簡單迴歸(Simple regression),以及兩個以上自變項的多元迴歸(又稱複迴歸,Multiple regression),但簡單迴歸出現的比例不到5%,主要原因當自變項僅一個時,通常會以獨立樣本t檢定/單因子變異數分析/皮爾森積差相關來進行分析,同樣的,當沒有特別宣稱是使用簡單迴歸或是多元(複)迴歸時,指的應該都是多元(複)迴歸,所以結合上一段敘述,如果有文章宣稱使用迴歸分析時,大多指的是多元線性迴歸。

    最後,就是變項選擇的方法,實務上分成了全部進入法(又稱強迫進入法,Enter)與逐步法(Stepwise),一般大家比較常見的就是逐步迴歸,卻沒聽說過全部迴歸或強迫迴歸,因此如果迴歸分析裡沒看到逐步二字即是使用全部進入法,是將所有的自變項都考慮在迴歸模式裡,而逐步法是一個替代作法,從所有的自變項中挑選具有解釋力的預測變項,企圖得到一個最少自變項卻有較大解釋力的迴歸模型,不過這兩種迴歸在paper出現的比例其實是差不多。

 

2.jpg

 

     綜合以上所述,如果今天已經確認要做多元線性迴歸模型,那唯一要決擇的就是要使用全部進入法或逐步法,判斷依據有(1)遵循參考的paper2)若目的為要檢驗所有變項的聯合解釋情形,會採取全部進入法,但如果要得到最有效率的解釋模型,則會採取逐步法3)若目的是想找到主要影響因子,也沒參考paper,我會建議先使用全部進入法,若是有共線性問題而造成結果不合理,或是因樣本數不足導致多數自變項不顯著,那麼則會考慮使用逐步法再試試。

 

arrow
arrow
    創作者介紹
    創作者 晨晰部落格新站 的頭像
    晨晰部落格新站

    晨晰統計部落格新站(統計、SPSS、BIG DATA討論園地)

    晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()