前些日子台灣2012總統大選進行得如火如荼,報紙、電視天天都有相關新聞,比較特別的是,旺旺民調中心所進行的滾動式民調。依據該中心的說法,每天調查的樣本數在二百份以上,每五日滾動完成一份新的調查,滾動式選情民調一律在每晚的6時30分至10時進行。據稱,此種民調每日進行,每天都有最新出爐的支持度,並呈現各組候選人聲勢的動態變化。為台灣首創的滾動式調查方法,藉由追蹤民調將隨時了解即時選情變化與趨勢演變。
前些日子台灣2012總統大選進行得如火如荼,報紙、電視天天都有相關新聞,比較特別的是,旺旺民調中心所進行的滾動式民調。依據該中心的說法,每天調查的樣本數在二百份以上,每五日滾動完成一份新的調查,滾動式選情民調一律在每晚的6時30分至10時進行。據稱,此種民調每日進行,每天都有最新出爐的支持度,並呈現各組候選人聲勢的動態變化。為台灣首創的滾動式調查方法,藉由追蹤民調將隨時了解即時選情變化與趨勢演變。
迴歸分析(Regression analysis)可以一次檢視多個自變項對於依變項的預測效果,當依變項為連續變項時適合用線性迴歸(Linear regression)分析、當依變項為二元類別變項時則最適用羅吉斯迴歸(Logistic regression)、當依變項為計數變項(Count data)則適用以Poisson regression來分析,甚至是結合二元類別及受限資料(Censored data)的Cox regression,或是其他種類的迴歸,因此迴歸分析在量化研究的重要性無庸置疑。
上一章提到在執行共變數分析前,必須先檢視是否有違反迴歸係數同質性的問題,如果違反,表示共變數對於依變項的影響程度,會因為組別的不同而有所差異,此時需改用詹森-內曼法(Johnson – Neyman method)來進行共變數分析。
詹森-內曼法主要原理:由於共變數(X)對於依變數(Y)的影響會因為組別(M)的不同而有所差異,因此必須將結果依共變數的區段不同來解釋。第一個區段為XD+的右邊,此處為組一的Y顯著高於組二;第二個區段為XD到XD+的區域,此處雖然組一的Y高於組二,但差異的程度未達顯著水準;第三個區段為XD點上,此處的組一與組二的Y會相等;第四個區段為XD-到XD的區域,此處雖然組二的Y高於組一,但差異的程度未達顯著水準;第五個區段為XD-的左邊,此處為組二的Y顯著高於組一。(如下圖)
探索性因素分析(Exploratory factor analysis, EFA)及驗證性因素分析(Confirmatory factor analysis, CFA)都是在編制量表的時候很重要的一環,這兩種取向都是在驗證「建構效度」(Construct validity),但大家可注意到,很多已發表的文章可能只採用EFA或CFA其中一種,或甚至是兩者皆採用,本文旨在根據我個人實務的諮詢及分析經驗,提供一些兩者使用時機點上的判斷,希望讓各位讀者未來對於要用EFA或CFA有比較清楚的定見。
前二天有一則新聞,台北市中山女中學生吳璧羽、陳芝毓、古佳玉三人花了一年作一篇小論文,〈垃圾車駐點分布之相關問題探討—以台北市內湖區為例〉,10月2日在第十屆「高中地理奧林匹亞」競賽獲頒團體組一等獎。可喜可賀,忍不住要豎起大姆指說讚,學術研究最需要的就是獎勵,因為學術研究是長期抗戰,過程中很悶,要有很堅毅的耐力才可能走到最後。
(二)觀察性研究
在上篇文章中我們介紹了「比較兩組」的樣本數規劃,通常適用於作實驗設計或RCT的研究,但實際上很多研究是觀察性研究(或相關性研究),目標並非在比較特定組別之間的差異,而是在探討各變項與依變項的相關情形或預測情形,因此本篇文章將介紹以相關係數及線性迴歸分析為基礎的樣本數規劃。
之前有寫過一篇關於樣本數規劃的簡介文章,迴響還不錯,有蠻多朋友留言詢問問題,由於上次並未針對某種統計方法(或研究問題)介紹樣本數的事先規劃(planning sample size a priori),因此本篇文章旨在介紹幾種常用樣本數計算的時機點,由於篇幅的限制因此只介紹兩種類型,分別為比較兩組的差異(通常為實驗設計的研究)及相關性研究(或稱為觀察型研究,Observational study),將以下分別介紹。