在潛在變項模式(latent variable modeling, LCM)這一類型的研究中,依潛在變項、測量變項的量尺區分,大致可分為以下四類方法。
筆者在此對其中的潛在類別分析(Latent Class Analysis; LCA)特別感興趣,因為在許多領域中,常常需要將樣本對象經由某些理由加以分類,如行銷學中使用集群分析進行市場區隔、醫護研究使用類別特徵將病人分群。但用來區隔的變項並不一定都是連續量尺,更多時侯類別量尺的變項其實頗為常見。
而該類研究較常用的軟體有LatentGOLD、Mplus、SAS等,而筆者常用的SPSS並無此功能,但慶幸的是,自從SPSS透過與R軟體的聯結後,也能夠執行LCA分析了。
首先你必須先裝R軟體,以SPSS 22版為例,它搭配的是R版本是2.15.3。安裝好R後,接著再到IBM官網下載SPSS_Statistics_REssentials (網址如附註),簡單申請一個ID後,選擇適合的版本下載,安裝執行後,重新開啟SPSS時,可在對數線性中,多了一個潛在類別分析的選項。
例如我想依照性別(2類)、居住地區(3類)、身體質量指數BMI(6類)、生活習慣(吸菸、喝酒、吃檳榔、運動習慣等)(皆3類),將病人分組,使同一組的病人具有相似的特徵。故在外顯變數中放入這些類別變項,鍵入想要分類的組數,按確定即可。
輸出報表第一個為適配指標,其中AIC、BIC可用來判斷到底分幾群較好。你可以再跑3、4、5群,以AIC、BIC最小者即為較佳的分群數。
第二個報表為條件機率,說明各群病人為某一特徵的機率。如第一群人為女性的機率.712較高,但第二群人為男性的機率.937較高。
第三個報表為分群人數比例,如第一群人佔76%,第二群人佔24%。
第四個報表為剖繪圖(profile),可以視覺化看出各群的人的特徵。如第一群人,主要為女性較多、較少抽菸喝酒等習慣,或許可命名為健康生活型。而第二群人則可命名為不良習慣型。後續,可以去比較這二群人在某些健康指標上是否有差異,如有,表示不同生活型態的人確有不同的健康情形。
SPSS附加的這個功能,讓我們執行LCA方便許多。對商管、教育、心理、醫護等領域,對於類別變項都可以這個分析,來看看研究對象的族群分布。尤其是沒有具體目標變項的議題,都是可以一試的方法。
註1:
R 2.15.3下載:http://cran.r-project.org/bin/windows/base/old/2.15.3/
SPSS_Statistics_REssentials下載:
https://www-01.ibm.com/marketing/iwm/iwm/web/reg/pick.do?source=swg-tspssp&lang=en_US
註2:使用時,變項名稱只能用英文;如SPSS有錯誤訊息表示缺少package,則必須先至R中下載安裝此套件。