之前我們曾經提過樣本數(Sample size)計算的三個要素,首先是型一誤差(Type I error, α)、再者是型二誤差(Type II error, β),最後則是效果量(Effect size),可參見之前的文章

 

 

在之前的兩篇文章中,我們已經介紹了數種效果量,包括Cohen’s d, 比例的差值、相關係數或解釋力(R2)等等,但我們之前一直假設α5%Power80%1-型二錯誤),但是沒有交代這兩個名詞分別代表什麼意思,因此本篇文章旨在解釋其涵義。

 

 

承襲第一篇文章的例子,我們仍然以最容易瞭解的t檢定為例,假使我們要探討的研究問題是「糖尿病男性患者與女性患者在血糖值的差異」,但是因為我們不可能能夠收集到台灣地區所有糖尿病患者的資料,因此我們透過抽樣收集樣本資料,並嘗試推論到母群體(即全台灣的患者),此時我們必須有一個很重要的認知:「除非能取得母群體所有資料,否則我們永遠無法得知差異是否存在」,也就是說樣本資料只能協助我們猜測是否存在著差異。

 

 

聰明的統計學家想出一種方式來呈現推論的結果,既然我們無法得知母群體中是否存在著性別差異,那麼我們只要假設兩種狀況就可以包括各種可能的結果,第一個狀況是假設「母群體中沒有性別差異」,第二個狀況是假設「母群體中存在著性別差異」,也就是說母群體的狀況不是沒有差異不然就是具有差異,一定是這兩種狀況之一,專業術語又把前者稱作虛無假設(Null hypothesis),後者為對立假設(Alternative hypothesis)。

 

 

此時我們開始著手進行抽樣,開始收集糖尿病人的血糖值,然後把數據輸入到統計軟體並跑t檢定,此時會有顯著性(Significance)也就是p值,如大家所知的如果p值小於α(通常設定為0.05)我們就把結果稱為「達統計顯著差異」,反之若p值大於α就叫做「未達統計顯著差異」。此時會有四種可能的狀況,我們整理如下表所示:

 

再強調一次,我們根據樣本資料把結果分成顯著與不顯著兩種情形,但真實的母群體情形我們永遠都無法得知,而母群體又分成差異存在跟差異不存在兩種情形,因此2乘以2一共是四種狀況,我們每作一個統計分析都會符合這四種狀況之一:

 

 

1、母群體差異確實存在,且抽樣結果宣稱達顯著差異(p < 0.05),此為統計檢定力(又稱統計考驗力),也就是power【結論正確】

2、母群體差異確實存在,但抽樣結果未達顯著差異(p0.05),此為型二錯誤,亦即β【結論錯誤】

3、母群體差異不存在,但抽樣結果宣稱達顯著差異(p < 0.05),此為型一錯誤,亦即α【結論錯誤】

4、母群體差異不存在,且抽樣結果未達顯著差異(p0.05),此為1-α【結論正確】

 

 

由上可知,四種狀況有兩種錯誤的可能,分別為型一錯誤(α)跟型二錯誤(β),但是一直以來大部分人都只關注型一錯誤,若看到統計軟體跑出來的p < 0.05時就急著宣稱找到顯著差異,但殊不知此結論這是建立在「母群體不存在著性別差異」的假設之下,然而母群體是否有差異是我們永遠所不能得知的。反之型二錯誤雖然受到長期間的冷落,但它也是很重要,它是我們根據樣本資料做出不顯著(p0.05)的推論,但是卻是在「母群體存在著性別差異」的假設之下。

 

(續)


 

arrow
arrow
    全站熱搜

    晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()