每個統計分析背後總是存在一些假設,當這些假設違反時,就有可能產生偏誤的結果,而在實務的應用上,您應該會發現每篇文章在這些假設性的檢驗都很少出現,不過偶爾還是會遇到客戶的老師要求,在2016年時曾經介紹過「迴歸分析之殘差基本假設-以SPSS為例」,這一篇將以此為例來說明操作步驟,包含常態性、變異數同質性、獨立性。
(1)點選「分析」→「迴歸」→「線性」
(2)將變項丟入依變項與自變項欄位中,本研究依變項為「行為」,自變項為「知識」、「觀念」、「態度」
(3)點選「圖形」,利用圖形的功能來診斷殘差的常態性,以及殘差的等分散性。
(4)勾選「直方圖」與「常態機率圖」,這兩張圖都可以針對常態性做直觀的判斷。
(5)進行散布圖的繪製,將「標準化預測值」放到X,將「標準化殘差值」放到Y,所謂的殘差等分散性,是指在每一種的自變項組合下,殘差應該要保持變異數同質性,因為多元迴歸裡有多個自變項,所以不太可能針對每一個自變項X都做一次這樣的圖,因此使用預測值來做替代,因為相同的自變項組合,就等同有相同的預測值。
(6)點選「統計量」
(7)勾選「Durbin-Watson」,在「迴歸分析之殘差基本假設-以SPSS為例」一文中有提到,通常殘差獨立的違反容易發生在時間序列的資料,因此若資料並非時間序列資料,多數的老師或委員並不會因為沒交代Durbin-Watson的結果來質疑。
(8)從直方圖與常態分布曲線的對應關係可以判斷殘差與常態分布的相符程度
(9)或是從常態機率圖,去檢視殘差累積機率的實際值與期望值是否相近,如果繪製出來的樣本點能夠落在45度斜對角線上,則代表符合常態
(10)誤差的等分散性,係指在每一個X值的水準下,殘差值的分布能維持差不多的變異
(11)以a圖來說,每一個X值的水準下,Y值的變異值差不多,但以b圖來說,X值較小與較大的時候,Y值的變異較小,但X值在中間的條件下,Y值的變異則較大
(12)如果一定要檢驗殘差的獨立性,可採用最常使用的Durbin-Watson之D檢定法,當DW值接近2左右,通常沒有違反獨立性的假設。
留言列表