本篇所介紹的卡方檢定(Chi square test),主要用於討論兩個類別/間斷變項的關聯性,在卡方分析的四個用途中(包含適合度考驗、百分比同質性考驗、獨立性考驗、改變的顯著性考驗),本自動化的結果只適用在「百分比同質性考驗」與「獨立性考驗」,其中「百分比同質性考驗」比較強調兩個變項的因果關係(具有方向性,也就是所謂的自變項與依變項),而「獨立性考驗」則是著重兩個變項之間是否有關係。
目前本系統所提供的卡方檢定,一次僅能放兩個變項,但實務上,在進行表格製作時,通常會固定某一個變項與其他變項進行分析,舉例來說,想要瞭解不同基本資料(包含性別、年級、地區)的學生在打工經驗的比例有無差異,若透過本系統進行分析,必須進行三次後(性別 vs. 打工經驗;年級 vs. 打工經驗;地區 vs. 打工經驗),再將表格合併。
壹、矩陣式表格
一、操作
1、點選工具列中的『分析』,選擇『卡方分析(x)』
2、將欲進行項目分析的變項丟入右邊的「欄變項」與「列變項」
所謂的「欄變項」,是指呈現在表格上方位置的變項;「列變項」,是指呈現在表格左方位置的變項;由於一般論文都是直向列印,上方變項的寬度有限,因此筆者習慣根據研究問題判斷,將較多的變項放在左方(列變項),而單一變項放在上方(欄變項),以剛剛提到為例,基本資料(包含性別、年級、地區)放在左方(列變項),打工經驗放在上方(欄變項)。
如果除了打工經驗之外,還有其他的依變項/結果變項時,則會在另外一張表呈現,因此習慣上,一張表格會固定一個自變項(基本資料),或固定一個依變項(打工經驗),來呈現卡方結果。
除非使用者僅為方便得到表格,否則為配合敘述,會建議將自變項放入列變項中。
3、改用欄百分比(未勾選者使用行百分比)。
這邊注意一下,括號內應為未勾選者使用列百分比;所謂欄百分比是指直排加起來為100%,而列百分比是指橫排加起來為100%,此部分將於報表解讀時再作詳細介紹。
百分比的設定選擇上,建議根據自變項的擺放位置做決定,以本篇文章為例,筆者將性別放入列變項,那麼百分比以選擇列百分比為佳,因此不勾選此選項,理由是比較方便解釋:若今天筆者是將性別放在欄變項時,筆者則會勾選欄百分比選項。
二、輸出(未勾選欄百分比)
1、文字敘述(未勾選欄百分比)
筆者在操作中有提到,本系所在文字敘述的設定,將以列變項作為自變項來進行水準的比較,因此所進行的就是男女之間的比較,而在比較的過程中,將固定在同一個依變項的水準下,進行男女生比較,譬如說,有打工經驗的學生中,男生的比例較女生高;而在無打工經驗的學生中,當然為女生的比例較男生高嚕(因為依變項的水準剛好只有2個)。
2、表格(未勾選欄百分比)
在未勾選欄百分比時,百分比是橫向加起來100%,對應在表格中,男生在無打工經驗與有打工經驗加總為100%,女生亦會得到另外的100%,此時我們可以將男女生在無打工經驗的比例進行比較,或是有打工經驗的比例進行比較,來回答研究問題。
3、文字敘述(勾選欄百分比)
當勾選欄百分比時,關於百分比的計算,將以一個直欄(依變項一個水準)加起來為100%,去探討在無打工經驗中,男女生的比例各是多少,有無差異;或是有打工經驗中,男女生的比例各是多少,有無差異。
而在操作的第3點有做建議,百分比的選擇最好視自變項所擺放的位置而定,在本例中,自變項性別放在列變項,但百分比卻勾選欄百分比,會導致這樣的性別比較毫無意義(除了今天是想瞭解有無打工經驗的學生在男生比較上有無差異);試想今天若出現極端的例子,男生的樣本僅10人,女生的樣本達1000人,那麼在交叉表的分布中,很容易得到「無論對無打工經驗或有打工經驗的學生來說,都是女生比例較高」,但此現象其實是由抽樣不均所造成的結果。
4、表格(勾選欄百分比)
在勾選欄百分比時,百分比是橫向加起來100%,對應在表格中,無打工經驗在男生與女生加總為100%,有打工經驗亦會得到另外的100%,此時若進行男女的比較,意義不大,反倒可以進行有無打工經驗之間的學生比較。
總結:
(1)自變項擺放的位置和百分比的選擇最好一致
(2)每張卡方表可採一個自變項搭配多個依變項,或是多個自變項搭配一個依變項來呈現
留言列表