林星帆顧問說:
最近在深入研究無母數分析時發現一個奇妙的問題,就是SPSS的Wilcoxon signed-rank test的報表判讀方式,首先先舉一個例子(引自Glantz, 2002)來說明:
表1 吸煙前後血小板凝聚情形(N=11)
受試者 |
吸煙前 |
吸煙後 |
差異 |
差異排序 |
符號排序 |
1 |
25 |
27 |
2 |
2 |
2 |
2 |
25 |
29 |
4 |
3.5 |
3.5 |
3 |
27 |
37 |
10 |
6 |
6 |
4 |
44 |
56 |
12 |
7 |
7 |
5 |
30 |
46 |
16 |
10 |
10 |
6 |
67 |
82 |
15 |
8.5 |
8.5 |
7 |
53 |
57 |
4 |
3.5 |
3.5 |
8 |
53 |
80 |
27 |
11 |
11 |
9 |
52 |
61 |
9 |
5 |
5 |
10 |
60 |
59 |
-1 |
1 |
-1 |
11 |
28 |
43 |
15 |
8.5 |
8.5 |
|
|
|
|
|
W=64 |
由上表可知所謂Wilcoxon signed-rank test是先算出前後的差值,然後作排序(不考慮正負符號),再將排序加上正負符號,然後將所有符號排序作加總,就會得到兩個檢定量W(一個是正的[64],另一個是負的[-1]),然後取絕對值大的那個W作檢定,原理是如果虛無假設成立(也就是抽煙不會改變前後測的血小板凝聚數量),那麼W應該是接近0才對,代表改變量為正值與改變量為負值的總排序應該相同。
然後進一步對W作檢定,如果「W」此時是指「抽煙後減抽煙前為正值」,那如果W=64又為正值,且檢定的顯著性為p,因此結論應該為「抽煙後血小板顯著上升」。
現在問題來了,在SPSS的輸出裡頭(如下面兩張表),應該如何來判斷結果呢?SPSS的判斷邏輯似乎跟一般教科書不同,因為我們模擬過SPSS永遠以「等級總和」較小者(在這裡是1890.50)作檢定,然後以本例來說,Z=-2.321, p,因此可知「Rentention 與 Pretest的GFAP分數不同」,那究竟是何者為高呢?
若以Mean Rank來看,54.01>49.40,則代表正等級>負等級,也就是表2註解b成立,即Retention > Pretest,就好像我們在T檢定顯著時,會比較「平均數」一樣,在這裡是看「平均等級」來判讀結果;但也有教科書是教如果顯著時,直接比「個數」,依此例來說,66>35,即表1註解a成立,即Pretest > Retention;另一種可能的判斷方法,表3「為□等級基礎」(Base on),在本例是以正等級基礎,而正等級在表2是註解b,註解b又是Retention > Pretest,又由於Z永遠為負值,所以應該是為「拒絕這個假設」,也就是說顯著負的Z值為拒絕「正等級, 表2註解b, 即為Retention > Pretest」,因此代表「Pretest > Retention」成立。
但究竟SPSS的輸出判斷何者為對,目前我們尚未有一個確定的定論,不過倒是可由大家來一起討論。不過要提醒一點,無母數專書都會告訴讀者,無母數檢定的是Shift或Distribution,但常常被應用來看「何者為大」,也就是說在無母數達顯著時,通常這些統計大師只會說「A組跟B組分配不同」而並非「A組比B組大」,這一點值得大家再深入研究。歡迎所有有興趣的人用回應文的方式討論一下這個議題,真理是越辨越明的。
表2
|
|
個數 |
等級平均數 |
等級總和 |
GFAP_Retention - GFAP_Pre |
負等級 |
66(a) |
49.40 |
3260.50 |
正等級 |
35(b) |
54.01 |
1890.50 | |
等值結 |
0(c) |
|
| |
總和 |
101 |
|
|
a GFAP_Retention
b GFAP_Retention > GFAP_Pre
c GFAP_Retention = GFAP_Pre
表3
|
GFAP_Retention - GFAP_Pre |
Z 檢定 |
-2.321(a) |
漸近顯著性 (雙尾) |
.020 |
a 以正等級為基礎。
b Wilcoxon 符號等級檢定