承上篇,我們將αpower的定義作個總結,α就是「母群體不存在著性別差異,但我們的樣本資料發現顯著差異(pα)」,由於我們可能得到一個極小的p值(例如0.0001),我們此時會宣稱性別有所差異,這背後的邏輯是「如果母群體不存在著性別差異,那我們得到這種樣本資料(p0.0001)也太不可能了,所以我們認為母群體是有性別差異的」。

 

β則是「母群體存在著性別差異,但我們的樣本資料顯示未有顯著差異(pα)」,也就是我們的樣本資料可能得到一個很大的p值(例如0.50)。power1-β,意義就非常的重要了(但長期以來被忽略),power定義為「母群體存在著性別差異,且我們的樣本資料也發現顯著差異(pα)」,換句話說power就是「發現有顯著差異的能力」,也就是說母群體存在差異而且我們也宣稱有顯著差異的能力,能力就是機率,機率越高就表示能力越好。

 

目前為止我們簡介了αpower的真實意涵,接下來為了幫助大家更理解,我們用圖形來呈現αpower的概念。承襲剛剛的例子,繼續以獨立樣本t檢定為例,我們以抽樣的樣本資料跑統計分析,假設總樣本人數為100人,此時會跑出一個t檢定的tt值絕對值越大則表示性別之間的差異越大。下圖為虛無假設為真時的t值分佈(X軸),可發現X軸的正中間(Y軸的最高點)恰好是0,這是由於虛無假設就是母群體的性別無顯著差異,而t值等於0就表示完全沒有差異。圖的左右邊用綠色線條切開的面積各2.5%,這代表的就是α,在這個例子是雙尾檢定所以會有左右2邊,倘若樣本資料的t值是2.5,我們發現在圖上的位置已經超過綠色線條了,以面積來看只有0.011%),這個數字就是p值,因為1%2.5%還小(皆乘以2倍的話,就是2%5%還小),所以我們會宣稱這個結論達到「顯著差異」,不過務必要記得這是假設母群體無性別差異之下所做的推論

 

 

 

接著用圖示來呈現power的意涵,延續剛剛的t檢定例子,但這次總樣本人數為200人,男女性各100人,此時會有兩個分佈,紅色線條的分佈表示虛無假設(性別無顯著差異),而藍色虛線的分佈則是對立假設(性別有顯著差異),注意藍色虛線分佈的正中心不是0而是實際跑出來的t值(粉紅色虛線的X軸位置,約為3.6)。圖中黃色highlight部分落在綠色線條左邊,也就是在α0.05的地方(α/20.025),此時我們會宣稱無顯著差異(因為pα),但是我們卻發現這塊區域同時是籠罩在藍色虛線的分佈之下,而藍色虛線分佈又是假設性別有顯著差異,因此可知黃色部分為「母群體存在差異但樣本資料宣稱無顯著差異的機率」,所以就是β(型二錯誤),本例目測約10%,因此藍色虛線分佈扣除黃色部分就是power,約為90%

 

 

在這個例子中,p值非常小,因為t=3.6(粉紅虛線與X軸相交的位置)在紅色線條分佈的位置已經非常極端,可能已經小於0.00001了,因此研究者會宣稱有顯著差異;而這個例子的power又高達90%,因此此時研究者宣稱結果達顯著差異的正確性就非常高了,無論是母群體有差異(對立假設為真)或母群體無差異(虛無假設為真)的錯誤率都很低。

 


 

目前為止我們已將αpower作了很詳盡的說明,不過現今學術界會如此地只強調p值,我想是跟統計軟體預設都只有提供p值有很大的關係,但事實上現在開始統計軟體都有提供計算power的功能,希望未來各位讀者除了只看p值之外,也要多加注意power的議題。


 

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 晨晰部落格新站 的頭像
    晨晰部落格新站

    晨晰統計部落格新站(統計、SPSS、BIG DATA討論園地)

    晨晰部落格新站 發表在 痞客邦 留言(4) 人氣()