當資料的變項為兩個類別變項時,我們常利用卡方檢定來做分析,由於研究目的不同,卡方檢定通常分為四個部份:適合度考驗、獨立性考驗、百分比同質性考驗、改變的顯著性考驗,茲說明如下:
壹、適合度考驗
我們常常想要去檢定一組資料的實際觀察次數(類別變項的資料)的分布情形是否符合理論次數(我們所預期的,通常每個類別都相等,像是1:1、1:1:1…等)
Ex:現在我們想考驗民眾對香水的喜好是否有不同(所以沒有不同的話應該是1:1:1:1)
香水品牌 |
體重 |
1 |
560 |
2 |
500 |
3 |
490 |
4 |
450 |
(1)語法
1.對OUTPUT做設定值調整,使得OUTPUT較容易閱讀
不用更改語法,適合使用者直接貼在分析語法的最前面!!
2.設定原始資料集
現在要將我們的資料輸入到SAS裡,
DATA FIT是指設定一個叫做FIT的資料集
INPUT COLOR COUNT是指設定叫COLOR與COUNT的變數
CARD是指開始輸入我們的資料
3.利用次數分配裡附加的卡方檢定
只要利用次數分配的Freq就能計算出卡方值
PROC FREQ是指執行次數分配
WEIGHT COUNT指要求依COUNT作加權
Table COLOR是指指定要分析的變數(剛剛在輸入資料時已命名為COLOR)
/CHISQ是指要求計算卡方值
(2)報表
1.次數分配
對變項COLOR進行次數分配,由左至右分別為類別、次數、百分比、累積次數、累積百分比
2.卡方檢定考驗結果
經計算出來的結果,卡方值為12.4,自由度為3,顯著性為0.0061,樣本數為2000筆
由此可知,檢定結果達顯著水準,表示不同的民眾在於香水的喜好會有所不同
貳、獨立性考驗
欲檢定2類別變項是否互為獨立(變項的人數不會因為另一變項而有所不同),此時必須進行獨立性考驗以檢定之
Ex:我們想要瞭解血型與治療結果是否有相關(若為獨立則沒有相關)
血型 |
病情改善 |
病情惡化 |
1 |
25 |
25 |
2 |
35 |
40 |
3 |
30 |
35 |
4 |
60 |
45 |
(1)語法
1.對OUTPUT做設定值調整,使得OUTPUT較容易閱讀
不用更改語法,適合使用者直接貼在分析語法的最前面!!
2.設定原始資料集
現在要將我們的資料輸入到SAS裡,
DATA INDEP是指設定一個叫做INDEP的資料集
INPUT BLOOD $是指設定叫BLOOD的變數,$是宣告此變數為文字
CURE COUNT是指設定叫CURE與COUNT的變數,在此我們必須更改上面表格的格式,新增一個變數代表治療結果
CARD是指開始輸入我們的資料
3.利用次數分配裡附加的卡方檢定
只要利用次數分配的Freq就能計算出卡方值
PROC FREQ是指執行次數分配
WEIGHT COUNT指要求依COUNT作加權
Table BLOOD*CURE是指依照BLOOD及CURE製作一個交叉表(列聯表)
/CHISQ是指要求計算卡方值
MEASURE是指要求計算SAS裡設定的一些統計量(如ψ相關、列聯相關…)
(2)報表
此時會跑出一張交叉表及一張統計量摘要表
1.細格數值的意義
細格裡的數值由上而下依序為次數、整體百分比、列百分比、欄百分比
2.細格數值舉例
血型A病情改善的受試者有8人,佔全部受試者的8.47%,佔A型受試者50%,佔病情改善受試者16.67%
3.列Total
4.欄Total
5.卡方值
卡方值2.7769,自由度為3,顯著性為0.4273。由此可知,檢定結果未達顯著水準,表示受試者的治療結果不會因為血型的不同而有所不同
6.列聯相關0.0966