當資料的變項為兩個類別變項時,我們常利用卡方檢定來做分析,由於研究目的不同,卡方檢定通常分為四個部份:適合度考驗、獨立性考驗、百分比同質性考驗、改變的顯著性考驗,茲說明如下:

 

 

壹、適合度考驗

 

我們常常想要去檢定一組資料的實際觀察次數(類別變項的資料)的分布情形是否符合理論次數(我們所預期的,通常每個類別都相等,像是11111…等)

 

Ex:現在我們想考驗民眾對香水的喜好是否有不同(所以沒有不同的話應該是1111

香水品牌

體重

1

560

2

500

3

490

4

450

 


 

1)語法

1.OUTPUT做設定值調整,使得OUTPUT較容易閱讀

不用更改語法,適合使用者直接貼在分析語法的最前面!!

 

2.設定原始資料集

現在要將我們的資料輸入到SAS裡,

DATA FIT是指設定一個叫做FIT的資料集

INPUT COLOR COUNT是指設定叫COLORCOUNT的變數

CARD是指開始輸入我們的資料

 

3.利用次數分配裡附加的卡方檢定

只要利用次數分配的Freq就能計算出卡方值

PROC FREQ是指執行次數分配

WEIGHT COUNT指要求依COUNT作加權

Table COLOR是指指定要分析的變數(剛剛在輸入資料時已命名為COLOR

/CHISQ是指要求計算卡方值

 

 

2)報表

1.次數分配

對變項COLOR進行次數分配,由左至右分別為類別、次數、百分比、累積次數、累積百分比

 

2.卡方檢定考驗結果

經計算出來的結果,卡方值為12.4,自由度為3,顯著性為0.0061,樣本數為2000

由此可知,檢定結果達顯著水準,表示不同的民眾在於香水的喜好會有所不同


 

 

貳、獨立性考驗

欲檢定2類別變項是否互為獨立(變項的人數不會因為另一變項而有所不同),此時必須進行獨立性考驗以檢定之

 

 

Ex:我們想要瞭解血型與治療結果是否有相關(若為獨立則沒有相關)

血型

病情改善

病情惡化

1

25

25

2

35

40

3

30

35

4

60

45

 

1)語法

1.OUTPUT做設定值調整,使得OUTPUT較容易閱讀

不用更改語法,適合使用者直接貼在分析語法的最前面!!

 

2.設定原始資料集

現在要將我們的資料輸入到SAS裡,

DATA INDEP是指設定一個叫做INDEP的資料集

INPUT BLOOD $是指設定叫BLOOD的變數,$是宣告此變數為文字

CURE COUNT是指設定叫CURECOUNT的變數,在此我們必須更改上面表格的格式,新增一個變數代表治療結果

CARD是指開始輸入我們的資料

 

3.利用次數分配裡附加的卡方檢定

只要利用次數分配的Freq就能計算出卡方值

PROC FREQ是指執行次數分配

WEIGHT COUNT指要求依COUNT作加權

Table BLOOD*CURE是指依照BLOODCURE製作一個交叉表(列聯表)

/CHISQ是指要求計算卡方值

MEASURE是指要求計算SAS裡設定的一些統計量(如ψ相關、列聯相關

 


 

2)報表

此時會跑出一張交叉表及一張統計量摘要表

1.細格數值的意義

細格裡的數值由上而下依序為次數、整體百分比、列百分比、欄百分比

 

2.細格數值舉例

血型A病情改善的受試者有8人,佔全部受試者的8.47%,佔A型受試者50%,佔病情改善受試者16.67%

 

3.Total

4.Total

5.卡方值

卡方值2.7769,自由度為3,顯著性為0.4273。由此可知,檢定結果未達顯著水準,表示受試者的治療結果不會因為血型的不同而有所不同

6.列聯相關0.0966

 

 




 

 

arrow
arrow
    全站熱搜

    晨晰部落格新站 發表在 痞客邦 留言(2) 人氣()