HLM學習心得分享（1）~康顧問分享 @ 晨晰統計部落格新站（統計、SPSS、BIG DATA討論園地）

今(2012)年2月中旬到臺灣師範大學上了許獻元博士的階層線性模型(HLM)課程，一個最大的感想是，高階統計方法的出現，並不是為了賣弄高深的數學，故意搞了複雜的統計公式，而是人類社會的實況就是這麼複雜，用簡化的統計方法，已經不能符合需要。

最常見的一個現象，大家在抽樣調查時多半會使用分段抽樣，即先抽出若干學校，再抽出若干學生，然後僅就學生的層級分析其背景、態度表現、行為表現等相關議題，但是大家有沒有想過一個問題，同一學校的學生，可能會有某種共同傾向，也就是議題的表現不僅受學生本人的影響，也會受到學校的影響。例如，研究社經地位對學習成績的影響，用傳統迴歸分析，會違反統計獨立性假設。即同一學校的學生成績有相依性（Dependency），如都市學校學生成績可能普遍都比鄉村學校學生高，則傳統迴歸分析結果會低估標準誤（Stand Error），使得係數檢定容易顯著，提高了型一誤差。

相反地，如果基於群體的統計數據就作出推論，而忽略其下屬個體特性的作法，則會產生生態謬誤（Ecological fallacy）（或稱為層次謬誤）。如把某校所有學生社經地位平均成學校社經地位，所有學生學習成績平均成學校學術表現，然後以此來推論社經地位與學術表現的關係時，就有可能產生此種謬誤。舉例來說，在某學校內，學生社經地位愈高，學習成績也愈高，成正比（黑色線）；但如果以學校為單位，則可能變成相反結果（紅色線）。