上一篇說到以G-power軟體來計算迴歸分析的樣本數,通常只要在內文裡交代利用的計算軟體,透過迴歸分析方法,設定「型一誤差α」、「檢定力1-β」、「效果量effect size」與「自變項個數」各為多少,所計算的樣本數為何,十篇裡有八、九篇都能順利過關。

 

    但有時候遇到較嚴謹(刁鑽)的老闆、口委或是reviewer,則會要求學生將公式寫下,試圖在網路上搜尋了一下,卻發現找不太到。於是翻開了Cohen1988)的專書,發現樣本數的公式非常簡單(公式9.4.3公式9.4.4p445)。

 

 

 

 

公式9.4.3裡顯示N=λ/f2f2為效果量(等於[1-R2]/R2),設定方式請參考『迴歸分析樣本數規劃之G-Power使用』,至於λ的公式為:


 

u為自變項個數,v為誤差項的自由度(即N-u-1),所以u + v + 1恰好等於總人數N,帶入公式9.3.1後顯然發現λ= f2 × N,疑!?我們又不知道樣本數,怎麼λ的公式裡會出現N??【陷入鬼擋牆的迴圈~~】。

最後終於解開了迷團,原來這個計算過程需要對λ先去訂立一個起始值,經過一連串的疊代計算後,若算出來的λ值收歛(與前一次的λ值差值在某個標準值之下),則停止計算,並以此回合的樣本數為最終的樣本數。為了讓讀者更清楚瞭解流程,此處將搭配流程圖,並以文字做細部說明。


 

 

 

1.      此處的λ值需要以查表進行,p448-p455Table9.4.1 or Table9.4.2,表9.4.1是設定α0.01,表9.4.2α則設為0.05。在固定α(通常設0.05)、power(通常設0.08)、u(依據研究實際自變項個數)、vCohen建議設成120)的情況下,即可找到初始λ值。

2.      接著利用p445的公式9.4.3 or 9.4.4來計算出N值,兩個公式的差別只差在效果量是要用f2 or R2

3.      利用p446的公式v=N-u-1算出v值,N為第2步計算出來的樣本數,u為自變項個數。

4.      根據p445的公式9.4.2(內插法),計算出新的λ值,這一步算是比較麻煩的部分。首先需要根據上一步也就是第3步的v值,來決定L值及U值的選定,原則就是v值一定會在L值及U值的區間,而CohenL值與U值分為3個區間【20-60】、【60-120】、【120-∞】,假設第3步的v值為50,那麼VL=20VU=60;若v=145,那麼VL=120VU =∞。最後λLλU則都需根據p448-p455Table9.4.1 or Table9.4.2去查表。

 

 


 

 

5.      接著看上一步所算出來的新的λ值與前一次的λ值差異是否很小,此處似乎沒有一個明確的標準,Cohen1988)則是建議差值在0.1之下才算收斂。

5.1若是判斷收歛,則以此回合第2步所計算出來的N為最終樣本數。

5.2若是判斷未收斂,則以新的λ值帶入第2步算出新的N值,一直進行疊代的動作,直到λ值收歛為止。

 

 

【實作部分】此處以上一篇的例子為例,假設已知α0.05、自變項個數u=5=0.8R2=0.1,來求得所需樣本數。

 

1.      根據表9.4.2α=0.05power=0.08u=5v=120,找到初始λ=13.3

2.      由於效果量給的是R2因此根據公式9.4.4,計算出N=120


 

3.      根據p446的公式v=N-u-1,算出v=120-5-1=114

4.      由於v=114,因此設定L=60U=120,並根據表9.4.2,設定α=0.05power=0.08u=5v=60120,找到λL=14.0λU=13.3,將所有數值代入公式9.4.2,並找出新的λ=13.3


 

5.      以此為例,發現第4步算出來的λ=13.3,與第2步的λ值差值在0.1之下,因此可停止疊代,利用第3步所計算出來的N=114為所需樣本數。

6.      若覺得還未達收斂,則需把第4步所計算出來的λ=13.3,再帶回第2步繼續下一回合的疊代。


 

Reffrence

 

Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences. New Jersey: Hillsdale.

 

 

Appendix

Table 9.4.1



 

Table9.4.2



 

arrow
arrow
    全站熱搜

    晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()