統計顯著性與統計檢定力（上）（Statistical significance and power）～晨晰統計林星帆顧問整理－晨晰統計部落格新站（統計、SPSS、BIG DATA討論園地）

之前我們曾經提過樣本數（Sample size）計算的三個要素，首先是型一誤差（Type I error, α）、再者是型二誤差（Type II error, β），最後則是效果量（Effect size），可參見之前的文章。

在之前的兩篇文章中，我們已經介紹了數種效果量，包括Cohen’s d, 比例的差值、相關係數或解釋力（R²）等等，但我們之前一直假設α為5%及Power為80%（1-型二錯誤），但是沒有交代這兩個名詞分別代表什麼意思，因此本篇文章旨在解釋其涵義。

承襲第一篇文章的例子，我們仍然以最容易瞭解的t檢定為例，假使我們要探討的研究問題是「糖尿病男性患者與女性患者在血糖值的差異」，但是因為我們不可能能夠收集到台灣地區所有糖尿病患者的資料，因此我們透過抽樣收集樣本資料，並嘗試推論到母群體（即全台灣的患者），此時我們必須有一個很重要的認知：「除非能取得母群體所有資料，否則我們永遠無法得知差異是否存在」，也就是說樣本資料只能協助我們猜測是否存在著差異。

聰明的統計學家想出一種方式來呈現推論的結果，既然我們無法得知母群體中是否存在著性別差異，那麼我們只要假設兩種狀況就可以包括各種可能的結果，第一個狀況是假設「母群體中沒有性別差異」，第二個狀況是假設「母群體中存在著性別差異」，也就是說母群體的狀況不是沒有差異不然就是具有差異，一定是這兩種狀況之一，專業術語又把前者稱作虛無假設（Null hypothesis），後者為對立假設（Alternative hypothesis）。

此時我們開始著手進行抽樣，開始收集糖尿病人的血糖值，然後把數據輸入到統計軟體並跑t檢定，此時會有顯著性（Significance）也就是p值，如大家所知的如果p值小於α（通常設定為0.05）我們就把結果稱為「達統計顯著差異」，反之若p值大於α就叫做「未達統計顯著差異」。此時會有四種可能的狀況，我們整理如下表所示：

再強調一次，我們根據樣本資料把結果分成顯著與不顯著兩種情形，但真實的母群體情形我們永遠都無法得知，而母群體又分成差異存在跟差異不存在兩種情形，因此2乘以2一共是四種狀況，我們每作一個統計分析都會符合這四種狀況之一：

1、母群體差異確實存在，且抽樣結果宣稱達顯著差異（p < 0.05），此為統計檢定力（又稱統計考驗力），也就是power【結論正確】

2、母群體差異確實存在，但抽樣結果未達顯著差異（p≧0.05），此為型二錯誤，亦即β【結論錯誤】

3、母群體差異不存在，但抽樣結果宣稱達顯著差異（p < 0.05），此為型一錯誤，亦即α【結論錯誤】

4、母群體差異不存在，且抽樣結果未達顯著差異（p≧0.05），此為1-α【結論正確】

由上可知，四種狀況有兩種錯誤的可能，分別為型一錯誤（α）跟型二錯誤（β），但是一直以來大部分人都只關注型一錯誤，若看到統計軟體跑出來的p < 0.05時就急著宣稱找到顯著差異，但殊不知此結論這是建立在「母群體不存在著性別差異」的假設之下，然而母群體是否有差異是我們永遠所不能得知的。反之型二錯誤雖然受到長期間的冷落，但它也是很重要，它是我們根據樣本資料做出不顯著（p≧0.05）的推論，但是卻是在「母群體存在著性別差異」的假設之下。