上一篇說到以G-power軟體來計算迴歸分析的樣本數,通常只要在內文裡交代利用的計算軟體,透過迴歸分析方法,設定「型一誤差α」、「檢定力1-β」、「效果量effect size」與「自變項個數」各為多少,所計算的樣本數為何,十篇裡有八、九篇都能順利過關。
但有時候遇到較嚴謹(刁鑽)的老闆、口委或是reviewer,則會要求學生將公式寫下,試圖在網路上搜尋了一下,卻發現找不太到。於是翻開了Cohen(1988)的專書,發現樣本數的公式非常簡單(公式9.4.3或公式9.4.4,p445)。
公式9.4.3裡顯示N=λ/f2,f2為效果量(等於[1-R2]/R2),設定方式請參考『迴歸分析樣本數規劃之G-Power使用』,至於λ的公式為:
u為自變項個數,v為誤差項的自由度(即N-u-1),所以u + v + 1恰好等於總人數N,帶入公式9.3.1後顯然發現λ= f2 × N,疑!?我們又不知道樣本數,怎麼λ的公式裡會出現N呢??【陷入鬼擋牆的迴圈~~】。
最後終於解開了迷團,原來這個計算過程需要對λ值先去訂立一個起始值,經過一連串的疊代計算後,若算出來的λ值收歛(與前一次的λ值差值在某個標準值之下),則停止計算,並以此回合的樣本數為最終的樣本數。為了讓讀者更清楚瞭解流程,此處將搭配流程圖,並以文字做細部說明。
1. 此處的λ值需要以查表進行,p448-p455的Table9.4.1 or Table9.4.2,表9.4.1是設定α為0.01,表9.4.2的α則設為0.05。在固定α(通常設0.05)、power(通常設0.08)、u(依據研究實際自變項個數)、v(Cohen建議設成120)的情況下,即可找到初始λ值。
2. 接著利用p445的公式9.4.3 or 9.4.4來計算出N值,兩個公式的差別只差在效果量是要用f2 or R2。
3. 利用p446的公式v=N-u-1算出v值,N為第2步計算出來的樣本數,u為自變項個數。
4. 根據p445的公式9.4.2(內插法),計算出新的λ值,這一步算是比較麻煩的部分。首先需要根據上一步也就是第3步的v值,來決定L值及U值的選定,原則就是v值一定會在L值及U值的區間,而Cohen將L值與U值分為3個區間【20-60】、【60-120】、【120-∞】,假設第3步的v值為50,那麼VL=20、VU=60;若v=145,那麼VL=120、VU =∞。最後λL與λU則都需根據p448-p455的Table9.4.1 or Table9.4.2去查表。
5. 接著看上一步所算出來的新的λ值與前一次的λ值差異是否很小,此處似乎沒有一個明確的標準,Cohen(1988)則是建議差值在0.1之下才算收斂。
5.1若是判斷收歛,則以此回合第2步所計算出來的N為最終樣本數。
5.2若是判斷未收斂,則以新的λ值帶入第2步算出新的N值,一直進行疊代的動作,直到λ值收歛為止。
【實作部分】此處以上一篇的例子為例,假設已知α為0.05、自變項個數u=5、=0.8、R2=0.1,來求得所需樣本數。
1. 根據表9.4.2。α=0.05、power=0.08、u=5、v=120,找到初始λ值=13.3。
2. 由於效果量給的是R2,因此根據公式9.4.4,計算出N=120。
3. 根據p446的公式v=N-u-1,算出v=120-5-1=114
4. 由於v=114,因此設定L=60、U=120,並根據表9.4.2,設定α=0.05、power=0.08、u=5、v=60及120,找到λL=14.0、λU=13.3,將所有數值代入公式9.4.2,並找出新的λ值=13.3。
5. 以此為例,發現第4步算出來的λ值=13.3,與第2步的λ值差值在0.1之下,因此可停止疊代,利用第3步所計算出來的N=114為所需樣本數。
6. 若覺得還未達收斂,則需把第4步所計算出來的λ值=13.3,再帶回第2步繼續下一回合的疊代。
Reffrence
Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences. New Jersey: Hillsdale.
Appendix
Table 9.4.1
Table9.4.2
留言列表