迴歸分析是蠻常採用的統計方法之一,而在進行迴歸分析之前,針對殘差的部分存在幾項基本的假設,當資料違反這些基本假設而進行分析時,通常會使研究結果產生偏誤,至於偏誤的程度,當然就視資料違反的程度而定,其假設包含:

1)常態性

2)變異數同質性

3)獨立性

檢查的方式,通常是利用殘差值配合一些圖形(如散布圖、直方圖、常態機率分布曲線)來進行檢驗,因此以下將以SPSS軟體所分析的圖形為例,針對每一項假設進行簡單的介紹。

一、常態性

此處的常態性,不單純是指所有的殘差形成常態分布,而是在固定同樣X之下,所得到的殘差符合常態分配的要求(其實因為固定為同樣的X,會得到同樣的預測值Y^,因此殘差符合常態,在e=Y-Y^的情形下,也代表依變項Y也符合常態),此部分又稱為條件常態分配。通常的證明方式,是利用殘差的直方圖與常態機率P-P圖來證明,所繪製出來的直方圖,必須盡量符合鐘形分布,而P-P圖的觀察點,最好要若在左下到右上的45度直線上,即越接近常態分配。

 

1.jpg

2.jpg

 

二、變異數同質性

此部分替代的專有名詞還有「變異數齊一性」、「變異數均質性」、「共同變異數」、「變異數等分散性」、「變異數為一常數」等,其實指的都是同一件事。此項目的假設,是指在給定一固定X值之下,此部分的Y值所計算出來的變異數,會等同於給定另一固定X值之下的Y值變異數。換句話說,將不同X所對應的Y進行分組,每一組Y所計算出來的變異數必須符合同質,這有點像是變異數分析裡的同質性假設。

直覺上,應該利用XY繪製散布圖來證明變異數同質性,不過當迴歸分析屬於多元迴歸時,受限於空間的維度,在圖上呈現多個自變項X是有難度的,因此這部分採用預測值Y^做替代,因為同樣的預測值Y^幾乎代表有相同的自變項組合;另外在Y的部分,為了消除X對於Y所形成的線性趨勢,所以Y一律減掉預測值Y^,以殘差e做為替代,顧名思義才叫殘差的變異數同質性。因此利用預測值Y^與殘差e進行散布圖的繪製,當圖形呈現水平的隨機分配,即可認定並未違反殘差變異數同質性的假設。

 

3.jpg

 

三、獨立性

殘差獨立性是指每一項殘差將不受其它殘差影響,通常殘差不獨立容易發生在時間序列的資料,陳正昌、程炳林、陳新豐與劉子鍵(2003)建議,當資料並非時間序列的資料,可以不必進行殘差獨立性的檢定。如果一定要檢驗殘差的獨立性,可採用最常使用的Durbin-WatsonD檢定法,當DW值接近2左右,通常沒有違反獨立性的假設。

陳正昌、程炳林、陳新豐與劉子鍵(2003)。多變量分析方法—統計軟體應用(三版)。臺北市:五南。

 

4.jpg

創作者介紹
創作者 晨晰部落格新站 的頭像
晨晰部落格新站

晨晰統計部落格新站(統計、SPSS、BIG DATA討論園地)

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()