聊聊無母數---晨晰統計林星帆顧問整理(Nonparametric / Nonparametrical statistics) @ 晨晰統計部落格新站（統計、SPSS、BIG DATA討論園地）

無母數統計（nonparametric statistics）又稱作Distribution-free statistics、由後者的名稱即可知無母數統計是「不需要分佈假設的統計方法」，一般而言常用的統計方法（譬如說獨立樣本T檢定、相依樣本T檢定、單因子變異數分析、單因子重複量數變異數分析）都是要有一些假設的，以獨立T來說假設至少包括「依變項要符合常態分佈」、「兩組的變異數要相等」以及「兩組的樣本是獨立的」，關於後者的假設是樣本取樣的問題因此無母數統計也無法修正，但前者的「常態性」與「變異數同質性」檢定在實際狀況常常會遇到。

當我們作獨立T時，若違反「變異數同質性」，我們可以使用調整公式來取得校正後T值（也就是SPSS輸出的not assumed equal variance）。但若違反「常態性」假設（例如以QQ圖判斷、K-S檢定或S-W檢定）可就麻煩了，通常使用的方式可以將依變項作「轉換」，例如轉log、開根號或其他方式，這種方式主要有兩種缺點，第一是轉換之後的依變項也不見得就會符合常態分佈，第二是轉換之後依變項的「單位」已經不是原本的性質了（譬如血壓轉完log後，單位已經不知道變成什麼了），此時其實最佳的處理方式就是直接以無母數統計的Mann-Whitney U-test 來取代獨立T，我們都知道獨立T是用「平均數」作計算，但無母數統計一律是使用「排序」作計算，也就是說Mann-Whitney U是在檢定兩組人的「平均排序」是否有顯著差異，既然已經把原始分數轉成排序了，那當然就不會有「常態性」跟「變異數同質性」的假設了，很棒吧！

(我也想上統計課)

再舉單因子變異數分析來說，它也是有「常態性」跟「變異數同質性」的假設，而且萬一變異數同質性假設違反時就糟糕了（SPSS的Levene’s F值），因為統計軟體可沒像T檢定那樣提供一個校正後的F值，此時若您不希望將依變項作轉換，那麼唯一的選擇就是使用無母數統計的Kruskal-Wallis H test、它的原理是在檢驗三組（以上）的組別的「平均排序」是否具有顯著差異，如果H值是達顯著水準的，那就代表不同組別之間在平均排序是不一樣的，所以為了要找出哪兩兩組別之間不一樣，我們就要作「事後比較」，但很不幸地一般統計軟體都沒提供Kruskal-Wallis的事後比較，所以我們只好得拾起統計教本（例如林清山的心理與教育統計學）用Excel人工計算事後比較的結果了。

如果我們的研究設計是重複測量的研究，也就是說同一個受訪者會有2次的分數，那麼大家最熟悉的就是相依樣本T檢定，它的假設則是「前後測的差值要符合常態分佈」，大家可以試著以後測減掉前測分數然後畫出QQ圖以及作K-S檢定試試看，如果發現分佈真的極為不常態，那麼統計軟體也是沒有提供校正公式，因此我們最佳選擇就是選用 Wilcoxon Rank Signed test，請務必注意！「Wilcoxon」有兩種，另外一種叫做Wilcoxon Sum Rank test，後者不是在檢定相依設計的統計方法，因此大家千萬別搞錯了。Wilcoxon Rank Signed test的統計軟體輸出報表會有點弔詭，但是別緊張，撇步就是在統計報表上尋找「Sum of ranks」比較大的那一個（前提是有顯著），然後上面會有一個註解，我們就看註解的方向，以底下的例子來說，Sum of ranks比較大的是4554.50，對應到的Positive ranks、你可以看到N=88有一個註解b，我們在對到底下的註解b表示：後測大於前測，所以答案就是後測＞前測。

如果我們的研究設計是同一個受訪者會有3次（以上）的分數，那麼它的假設則是「前測與後測1的差值變異數 = 後測1與後測2的差值變異數 = 後測1與後測2的差值變異數」，如果違反的話就可以改用無母數統計的Friedman two-way ANOVA test, 不過一般統計軟體也沒提供事後比較，因此得自行人工計算。