有做過統計的人都知道,舉凡學術性論文或專案調查報告,開頭都會先來一段描述統計,用人數、百分比、平均數等統計量,對調查人口作一番說明,讓讀者了解研究對象的基本資料。只是通常這種統計很死板,不外乎A有OO人最多,佔XX%;B有OO人次之,佔XX%等等。這種文字讀來索然無味,一點感情也沒有,整段看完後,通常都像張無忌學太極劍的最高境界--全忘了。
有做過統計的人都知道,舉凡學術性論文或專案調查報告,開頭都會先來一段描述統計,用人數、百分比、平均數等統計量,對調查人口作一番說明,讓讀者了解研究對象的基本資料。只是通常這種統計很死板,不外乎A有OO人最多,佔XX%;B有OO人次之,佔XX%等等。這種文字讀來索然無味,一點感情也沒有,整段看完後,通常都像張無忌學太極劍的最高境界--全忘了。
台灣整體的統計素養因為高學歷推廣而日漸提升,近年也有越來越多的商業機構開始懂得尊重統計的專業,指名要找統計顧問公司來進行他們的內部研究或商業調查專案。但我發現這許許多的專案中,執行者佔了九成以上都是初次執行,而且常常會犯下一些不可修正的錯誤,雖然說這是新手必經的階段,但有些問題還是可以避免的,所以在這邊整理一些相關注意事項,給商調新手們一些方向。
之前探討當要比較三組(獨立因子)以上的平均數差異時,我們必須用到One-way ANOVA,此時若要同時探討二個獨立因子的差異(譬如說教室氣氛是否會影響到成績,以及教學法是否會影響到成績),甚至這兩個獨立因子是否存在交互作用時(譬如說不同教室氣氛間的成績差異,是否會因為教學法的不同而不同;或不同教學法間的成績差異,是否會因為教室氣氛間的不同而不同),則要使用獨立樣本二因子變異數分析。
結構方程模式(Structural equation modeling, SEM)儼然已成為社會科學近20年來的分析典範,幾乎欲探討三個變項以上的因果關係(Casual relationship)的研究都會被要求要以SEM這種同時聯立方程式的方式作探討,否則很容易被審稿者所質疑。
由於工作上的需要,我每年看過的問卷接近100種,大多數的問卷大同小異,有些設計的很用心,有些「擷取」的很精緻,有些「轉換」的很優雅,但是從這麼多的問卷中,我發現隱藏了兩大陷阱!這兩個陷阱曾經害得無數研究生淒淒慘慘,所以我必須在這邊揭發這兩個陷阱的真面目,讓後世千千萬萬的研究生可以免於罹難!阿門!
當我們有一群樣本在某一事件上的發生與否(Event or not),而且還知道持續多久的期間(Duration)才發生Event,此時我們可根據樣本此兩個依變項,畫出樣本的存活曲線(survival curves),而使用的方法為Kaplan-Meier。