無母數統計(nonparametric statistics)又稱作Distribution-free statistics、由後者的名稱即可知無母數統計是「不需要分佈假設的統計方法」,一般而言常用的統計方法(譬如說獨立樣本T檢定、相依樣本T檢定、單因子變異數分析、單因子重複量數變異數分析)都是要有一些假設的,以獨立T來說假設至少包括「依變項要符合常態分佈」、「兩組的變異數要相等」以及「兩組的樣本是獨立的」,關於後者的假設是樣本取樣的問題因此無母數統計也無法修正,但前者的「常態性」與「變異數同質性」檢定在實際狀況常常會遇到。

 

 

 

 

當我們作獨立T時,若違反「變異數同質性」,我們可以使用調整公式來取得校正後T值(也就是SPSS輸出的not assumed equal variance)。但若違反「常態性」假設(例如以QQ圖判斷、K-S檢定或S-W檢定)可就麻煩了,通常使用的方式可以將依變項作「轉換」,例如轉log、開根號或其他方式,這種方式主要有兩種缺點,第一是轉換之後的依變項也不見得就會符合常態分佈,第二是轉換之後依變項的「單位」已經不是原本的性質了(譬如血壓轉完log後,單位已經不知道變成什麼了),此時其實最佳的處理方式就是直接以無母數統計的Mann-Whitney U-test 來取代獨立T,我們都知道獨立T是用「平均數」作計算,但無母數統計一律是使用「排序」作計算,也就是說Mann-Whitney U是在檢定兩組人的「平均排序」是否有顯著差異,既然已經把原始分數轉成排序了,那當然就不會有「常態性」跟「變異數同質性」的假設了,很棒吧!

 

(我也想上統計課)

 

再舉單因子變異數分析來說,它也是有「常態性」跟「變異數同質性」的假設,而且萬一變異數同質性假設違反時就糟糕了(SPSSLevene’s F值),因為統計軟體可沒像T檢定那樣提供一個校正後的F值,此時若您不希望將依變項作轉換,那麼唯一的選擇就是使用無母數統計的Kruskal-Wallis H test、它的原理是在檢驗三組(以上)的組別的「平均排序」是否具有顯著差異,如果H值是達顯著水準的,那就代表不同組別之間在平均排序是不一樣的,所以為了要找出哪兩兩組別之間不一樣,我們就要作「事後比較」,但很不幸地一般統計軟體都沒提供Kruskal-Wallis的事後比較,所以我們只好得拾起統計教本(例如林清山的心理與教育統計學)用Excel人工計算事後比較的結果了。

 

 

 

如果我們的研究設計是重複測量的研究,也就是說同一個受訪者會有2次的分數,那麼大家最熟悉的就是相依樣本T檢定,它的假設則是「前後測的差值要符合常態分佈」,大家可以試著以後測減掉前測分數然後畫出QQ圖以及作K-S檢定試試看,如果發現分佈真的極為不常態,那麼統計軟體也是沒有提供校正公式,因此我們最佳選擇就是選用Wilcoxon Rank Signed test,請務必注意!「Wilcoxon」有兩種,另外一種叫做Wilcoxon Sum Rank test,後者不是在檢定相依設計的統計方法,因此大家千萬別搞錯了。Wilcoxon Rank Signed test的統計軟體輸出報表會有點弔詭,但是別緊張,撇步就是在統計報表上尋找「Sum of ranks」比較大的那一個(前提是有顯著),然後上面會有一個註解,我們就看註解的方向,以底下的例子來說,Sum of ranks比較大的是4554.50,對應到的Positive ranks、你可以看到N=88有一個註解b,我們在對到底下的註解b表示:後測大於前測,所以答案就是後測>前測。

 

 

 

 

 

 

 

如果我們的研究設計是同一個受訪者會有3次(以上)的分數,那麼它的假設則是「前測與後測1的差值變異數 = 後測1與後測2的差值變異數 = 後測1與後測2的差值變異數」,如果違反的話就可以改用無母數統計的Friedman two-way ANOVA test, 不過一般統計軟體也沒提供事後比較,因此得自行人工計算。

 

 

 

我們來作個總結吧,作無母數的時機:

 

(1)                如果你的依變項分佈不符合常態分佈然而你又不想要轉換依變項尺度,或者是轉換之後還是不符合常態

(2)                你的樣本數太小,例如總人數少於30人,或每組人數少於10人,可以考慮使用無母數統計

(3)                T檢定與ANOVA時違反變異數同質性檢定,無母數統計是最佳利器!

 

 

創作者介紹
創作者 晨晰部落格新站 的頭像
晨晰部落格新站

晨晰統計部落格新站(統計、SPSS、BIG DATA討論園地)

晨晰部落格新站 發表在 痞客邦 留言(35) 人氣()