相信很多人在做變異數分析的時候,常常會遇到這樣的狀況:F考驗顯著,但是雪費(Scheffé)事後比較不顯著。這時候該怎麼辦呢?熟悉統計實務分析的人都知道這是一種很正常的狀況,但是偏偏遇過不少指導老師認為這樣的狀況不合理,要求學生一定要做調整,所以在這邊提出我的一點看法,也歡迎大家一起留言討論,畢竟目前來說還沒有一套完整的解決方案。
根據吳明隆的SPSS操作與應用P.495頁,他提到一種調整性的作法就是「如果F考驗顯著,雪費事後比較不顯著,就改用HSD或N-K事後比較檢定法」,但是我並不認同這樣的調整。試想一下,為何社會科學會建議用雪費事後比較?為何不等組的情況會建議用雪費事後比較?雪費事後比較是所有事後比較最嚴格的一種,因為當不等組設計的時候雪費事後比較擁有最高的檢定力(power),因此換來的代價就是最不容易達顯著(p值最大),可能是因為社會科學的樣本資料(大多數是問卷)是比較髒的資料,髒的意思表示1).不清處真實作答的人到底是誰?2).不清楚真實作答的情況到底如何?所以社會科學會建議用雪費事後比較,用最嚴謹的角度來看待研究發現的結果。基於這樣的觀點,如果雪費事後比較不顯著就換一種比較寬鬆的事後比較,那是否統計分析一開始設定α = .05,如果做出來都不顯著我們就把α 改成.10,這種作法就是自欺欺人,而且只是玩數據遊戲而已了。
理論上來說F檢定顯著,而事後比較不顯著,一定有原因,這些原因大多數來自於某些組別的樣本數很少(因此導致標準誤膨脹),或是組別間的差異量不足。基本上差異分析就是在檢定差異量跟樣本數,如果差異量很大,小樣本也會有顯著性,如果樣本數很大,很小的差異量就會顯著。F考驗顯著,雪費事後比較不顯著,最合理的推論就是整個檢定是不顯著的,也可以把雪費事後比較當成一道嚴謹的關卡,為了避免社會科學產生太多浮濫的推論,所以用這樣的事後比較把門檻提高。至於實驗室裡的研究,或是受試者內的研究,自然適用其他比較寬鬆(這裡指的寬鬆指的是針對型一錯誤而論)的事後比較,例如Tukey HSD或SNK法,就不會產生這種問題,因為實驗控制的嚴謹度夠,統計控制就可以減少,這也是為什麼等組的實驗設計的統計分析方法通常都不複雜的原因,因為以實驗控制(研究設計的控制)會比統計控制來得更好。
一種比較折衷的作法就是把F檢定有顯著,雪費事後比較不顯著但是邊緣顯著的部份也列出來,所謂的邊緣顯著就是P值在.05~.10的範圍之間,這些邊緣顯著的事後比較或許可以告訴我們一些趨勢,一些可能性,但是僅僅當做是參考,畢竟前提假設是在「顯著性決斷」的邏輯之下,它們應該是不被報告的,這些邊緣顯著的結果應該是被捨棄的。當然,目前統計發展除了以「顯著性決斷」判斷分析結果,「Power」、「Effect size」也都是很重要的分析結果。

從雪費的公式來看,為了校正錯誤率,透過分母多除以組數-1來校正,所以若組數越多就會越嚴格~此外,測統界習慣用Bonferroni,此方法是控制型一錯誤,所以不會有雪費的問題,hsd則是商界慣用的方法,容許較寬鬆,但基本上這些事後比較的公式本質上都與t值如岀一徹,只是再加以校正,學界之所以不用hsd&nk法的另一個原因是它比t考驗更寬鬆,社會學界習慣用複回歸的方式控制干擾變項,找出影響變項,甚或中介變項,通常會採用事後比較的研究法為實驗研究法,但若考驗需要做到單純主要效果事後比較這會很麻煩,幾乎很少研究者會這樣做,而且在語法上是採用t考驗,這樣就可以被接受了~ ps:純路過發表感想。
感謝您的補充喔~~
想請問,那跟主題剛好相反=> 若ANOVA不顯著,但是post hoc顯著時 有解決辦法嗎?
您好:由於ANOVA的F檢定是整體考驗,若已經不顯著,則不應該再往下看post hoc,這是邏輯的問題。
您好,想請教關於事後比較的問題 假設: 想了解在不同世代中,不同教育程度對戀愛觀念的影響。 結果: 在X世代中,教育程度對戀愛觀念,有顯著,使用Scheffe做事後比較;然而,在Y世代中,因為變異數不同質,改以Brown & Forsyther檢定,之後做Games-Howell 事後比較。 (e.g. 在X世代中,大學>小學;在Y世代中,大學>中學,大學>小學) 這兩種不同事後比較的結果,在結論中,可以一起拿出來互相比較嗎? (e.g. 在X世代、Y世代中,大學>小學;且在Y世代中,大學>中學) 謝謝!!
您好: 可以的!
我的論文也被教授糾正這塊! 我的是ANOVA 顯著 可是用雪費事後比較卻是不顯著 口委覺得他教統計這麼多年 從來沒碰過這種情況....
您好: 實務上這是很常遇到的問題喔!