多元迴歸分析(Multiple Regression Analysis)常被拿當來作一篇研究最主要的分析方法,而研究的一開始必須先去先計算要收案的樣本數,此時論文裡就會出現各式各樣的抽樣公式,通常以隨機抽樣公式為主。
近年來,許多學者開始傾向注重研究結果的檢定力(power:1-β),以確認結果的正確性,因此開始發展檢定力分析(power analysis),從一開始研究者必須在結果上附上檢定力,到後來從檢定力回推所需的樣本數。若對於檢定力有興趣的研究者,不妨可以研讀Cohen(1988)「Statistical Power Analysis for the Behavioral Sciences」。
目前在網路上有免費軟體G-Power可供研究者使用,裡面已有非常多的統計方法可供使用者去計算樣本數,或是型一誤差(α)、檢定力(power:1-β)、效果量(在迴歸分析裡指的是解釋力R2),本篇文章將介紹如何透過G-power軟體去利用迴歸分析來計算所需的樣本數。(我也想上統計課)
迴歸分析在計算樣本數之前,必須先固定4個參數:(1)自變項個數,自變項個數越多,所需樣本數會越多;(2)型一誤差α,通常設為0.05;(3)檢定力power,通常設為0.8;(4)效果量effect size,這一項最麻煩,優先選擇順序依序為(a)找到一篇類似的研究,看人家做出來的解釋力R2為多少,作為我們研究的效果量依據,但要找到類似的研究真的不容易,(b)先隨便收少量的樣本,並跑一次迴歸分析得到此pilot的解釋力R2,作為我們研究的效果量依據,若一開始收了50人來做pilot,最後計算樣本數需要150人,那麼再加收100人即可,(c)最差的方式,也是許多研究最常用的方式,直接訂定解釋力R2為中度效果量(0.13)(Cohen,1998,p413)。
以下將做操作介紹,設定型一誤差α=0.05,檢定力power=0.8,自變項個數=5,R2=0.16
【操作一】打開G-power軟體,選擇F test裡的統計方法Linear multiple regression: Fixed model, R2 deviation from zero
【操作二】填入α=0.05,檢定力power=0.8,自變項個數=5
【操作三】設定效果量f2,發現我們一開始得到的效果量卻是R2,因此需要透過Determine來進行轉換
【操作四】在Squared multiple correlation ρ2輸入0.16(本例的R2=0.16),按下Calculate後,會立即在Effect size f2得到轉換後的效果量,最後按下Calculate and transfer to main window,則會幫我們把轉換後的f2輸入到左邊的Effect size f2
【操作五】最後按下Calculate,則會在Total sample size計算出最後的樣本數74人,但所發出的問卷數我們可能會考慮有20%的流失率(依各領域實際狀況來設定),依此再以74×1.2≒89做為該發出的問卷數
Reffrence
Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences. New Jersey: Hillsdale.
G-Power軟體
http://www.psycho.uni-duesseldorf.de/abteilungen/aap/gpower3/download-and-register

請教一下,一般手發問卷、當場回收這種情況,是否有文獻說明流失率該設多少呢?因目前看到的流失率皆以郵寄問卷方式為主,感謝您~
您好:根據我們所知,似乎也沒有文獻有提及這個部分,謝謝。
請問我可否請教您文中提及研究最常用的方式,直接訂定解釋力R2為中度效果量(0.13)的文獻Cohen,1998,p413,此文章的全文為何?
Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). New Jersey: Lawrence Earlbaum Associates.
您好 請問羅吉斯回歸的樣本數計算是如何進行的呢?
您好: 可參考Shieh G. Sample size calculations for logistic and Poisson regression models. Biometrika 2001;88:1193-9.
您好:想問介入措施及問卷總共會有5次,實驗對象分3組.設定effect size f 為.2,α為.05,Power為.8,但是在使用G power軟體,在statistical test及Type of powder analysis應該選擇哪一個?麻煩指導~謝謝!
您好:statistical test應選「ANOVA: Repeated measures, between factors」。Type of power analysis應選「A priori:」那一個。
您好:想請問單組重複測量三次,設定effect size f 為.15,α為.05,Power為.8,在使用G power軟體,在statistical test應該選哪一種?
您好:F-test的ANOVA, repeated measure, between factors
您好:想請問一下如果只有單一組別。想看某族群發生A症狀的百分比有多少以及族群與A症狀的相關性。 那應該用哪一種方法計算樣本數呢? 因為目前我所看的的文獻都是有控制組去進行比較所以沒有較合適的範本可以參考 請問是要分成有發生A症狀和沒有發生A症狀的族群去進行計算嘛? 還是可以用相關性去進行計算。
您好:可以使用相關性去進行計算。或是以自變項們對於A症狀的解釋力來計算樣本數。
您好:想問要探討自變項a和兩個中介變項b、C對依變相之影響。使用Linear multiple regression: Fixed model, R2 deviation from zero 自變項數量選3嗎? 這樣嗎?
您好,想請問如果有10家機構各有26個品質項目數據(平均值),要使用何種方法算出機構間有明顯差異項目?我用單因子變異數分析算不出F值和p值,用pearson相關係數反而有p值,但覺得自變項為名義型、依變項為連續型不是應該用單因子變異數分析?
真的太太太感謝您發這篇文了!!!
如何從文獻反推效果量?