今(2012)2月中旬到臺灣師範大學上了許獻元博士的階層線性模型(HLM)課程,一個最大的感想是,高階統計方法的出現,並不是為了賣弄高深的數學,故意搞了複雜的統計公式,而是人類社會的實況就是這麼複雜,用簡化的統計方法,已經不能符合需要。

 

 

最常見的一個現象,大家在抽樣調查時多半會使用分段抽樣,即先抽出若干學校,再抽出若干學生,然後僅就學生的層級分析其背景、態度表現、行為表現等相關議題,但是大家有沒有想過一個問題,同一學校的學生,可能會有某種共同傾向,也就是議題的表現不僅受學生本人的影響,也會受到學校的影響。例如,研究社經地位對學習成績的影響,用傳統迴歸分析,會違反統計獨立性假設。即同一學校的學生成績有相依性(Dependency),如都市學校學生成績可能普遍都比鄉村學校學生高,則傳統迴歸分析結果會低估標準誤(Stand Error),使得係數檢定容易顯著,提高了型一誤差。

 

 

相反地,如果基於群體的統計數據就作出推論,而忽略其下屬個體特性的作法,則會產生生態謬誤(Ecological fallacy)(或稱為層次謬誤)。如把某校所有學生社經地位平均成學校社經地位,所有學生學習成績平均成學校學術表現,然後以此來推論社經地位與學術表現的關係時,就有可能產生此種謬誤。舉例來說,在某學校內,學生社經地位愈高,學習成績也愈高,成正比(黑色線);但如果以學校為單位,則可能變成相反結果(紅色線)。

 

 

 

實務上還有很多情況也是如此,當個體可歸屬於群體時,如學生-學校、員工-公司、病人-診所、受訪者-記者、嫌疑犯-法官等都是,資料具有這種二階層特性時(其中個體資料叫第一層,群體資料叫第二層),便需要一種叫作HLMHierarchical Linear Modeling)的方法。

 

 

對初學者而言,這個課程的節奏控制得很好,有淺顯的比喻,也有深入的方程式,由淺入深;有HLM操作的步驟,也有入門的四模型,簡單好記。是值得推薦的一場工作坊。我覺得初學者如果從這四個模型著手,一個一個解讀、操作、熟練,相信對HLM的深入應用,可以打下良好的基礎。

 

 

 

四個HLM入門模型:

1.          One-way ANOVA

2.          Mean-as-outcome

3.          Random-coefficient

4.          Intercept-and slopes-as-outcomes

 

 

本文先介紹第1個模型,當研究問題是:我們想知道學校(群體)間是否有差異?也就是第二層之間的差異時,那就要用到上述的One-way ANOVA模型,它的方程式如下:


 

      要注意到,在這個模型下,我們並沒有放入任何預測變項,如城鄉別、規模別等,這時它研究的問題,變成與以學生成績為依變項,學校別為自變項,進行單因子變異數的目的相同,所以也就稱為one-way ANOVA model。當然,HLM不會只有這麼簡單,以後再介紹另外三個模型。

 

arrow
arrow
    全站熱搜

    晨晰部落格新站 發表在 痞客邦 留言(3) 人氣()