當依變項為二元的類別變項時,若想作迴歸分析,此時不能再使用一般的線性迴歸,而應該要改用二元羅吉斯迴歸分析。
二元羅吉斯迴歸模式如下:
1.方程式很像原本的一般迴歸線性模式,不同點於現在的依變項變為事件發生機率的勝算比
2.因此現在的β需解釋為,當x每增加一單位時,事件發生的機率是不發生的exp(β)倍
3.為了方便結果的解釋與理解,一般來說我們會將依變項為0設為參照組(Event free)
(1)語法
1.設定原始資料集
現在要將我們的資料輸入到SAS裡,
DATA Model1是指設定一個叫做Model1的資料集
INFILE 'C:\APPENC11.txt'是指指定資料的路徑
2.變數X1與X2
由於變數X1與X2的數值較大,因此進行資料計算,皆除以1,000,000
DATA Model2是指設定一個叫做Model2的資料集
SET Model1 複製Model1資料集
X1=X1/1000000; 複製過程中將X1除以1,000,000
X2=X2/1000000; 複製過程中將X2除以1,000,000
2.執行逐步迴歸
PROC LOGISTIC是指執行羅吉斯迴歸分析
***Descending是指將Y=0設為參照組,如之前所述,結果較好解釋且易理解,若不放Descending,則會將Y=1設為參照組
Model Y=X1 X2 X3 X4 X5是指模式的依變項為Y,自變項為X1、X2、X3
(2)報表
1.模式聯合檢定
SPSS只提供LR卡方檢定,但SAS提供了LR、Score和Wald卡方檢定
由Output中的概似比檢定可知,LR χ2= 1.958 未達顯著,表示選取的自變項(X1,X2,X3)無法聯合預測Y,亦即無法從一個公司的「公司帳面價值」、「公司股份數」、「存在融資合併情形」預測一家公司是否存在投資基金
2.模式適配度
SPSS與SAS的模式適配度比較,其實SAS的左邊排數據為SPSS中Block0(只含截距項的模式),但在本文中不詳細列出,由SAS中的AIC及SC得知,加入自變項後,模式適配度反而變差了
3.迴歸係數
由SPSS與SAS的Output中皆可得到,未標準化迴歸係數、標準誤、華德卡方統計量、顯著性、OR值、OR值的95%信賴區間
其實由於模式的聯合檢定未達顯著,因此不需再看個別的迴歸係數了。
留言列表