(13)先看卡方檢定下方的第一個註解,此處即是去計算在交叉表中,有幾格的預期人數不到5,以及佔比有多高,結果顯示,有兩個的預期人數不到5,在12個細格裡的佔比為16.7%。
(14)假如第13步驟的百分比超過20%,則放棄使用卡方檢定的結果,直接用費雪精確性檢定的精確顯著性(雙尾)來結論,不過由於本例預期人數低於5的細格數僅佔16.7%,因此可以繼續進行卡方檢定。
(15)根據卡方檢定結果顯示,卡方值為31.662,顯著性.000達顯著水準,表示年齡與慢性病數是有關係的,或是說不同年齡層在慢性病數的分布比較具有差異,後續再補充說明是什麼樣的關係,或是如何的有差異。
(16)個數即是觀察人數,計算每一個年齡層在慢性病數的分布人數,一般做統計表格都需呈現此敘述統計。
(17)期望個數即是在假設兩個變數為完全獨立的情況下,在每一個細格裡應該有的人數,其中未滿40歲有1種慢性病的預期人數為4.2人,60歲以上有1種慢性病的預期人數為2.7人,在12個細格裡,這兩格的期望人數低於5人,佔16.7%,呼應了第13步驟。
(18)在年齡之內的行百分比,是計算在同一個年齡層之下,各種慢性病數的比例有多少,方能進行不同年齡層間的比較。
(19)個數右下方所標示小寫的英文字母,代表的是第11步驟欄比例的比較結果,判斷的方式為同樣的英文字母,指的是組間比例並無明顯差異,結果顯示,未滿40歲與40-49歲之間無明顯差異,50-59歲與60歲以上無明顯差異,而這兩大族群之間就代表有明顯差異,再透過百分比結合起來,可以得到結論,未滿40歲(74.2%)與40-49歲(62.8%)在無慢性病的比例高於50-59歲(62.8%)與60歲以上(25.0%),而欄比例的比較結果必須在每一列的條件下各判斷一次,也就是說在無慢性病下要進行一次組間比較,在1種慢性病數下要進行一次組間比較,在2種以上慢性病數下仍要進行一次組間比較。
(20)比較欄比例再舉一個例子,這次換到2種以上慢性病數,因為未滿40歲與40-49歲都有小a,所以這兩組間無明顯差異,40-49歲與60歲以上都有小b,所以這兩組間無明顯差異,50-59歲與60歲以上都有小c,所以這兩組間無明顯差異。因此整理一下結果,未滿40歲(9.7%)在2種以上慢性病數的比例低於50-59歲(54.9%)與60歲以上(45.0%),40-49歲(17.2%)在2種以上慢性病數的比例低於50-59歲(54.9%)。
(21)第二種比較方式是透過調整後的標準化殘差來說明,判斷方式是取絕對值超過1.96時(<-1.96 or >1.96),則代表該細格的實際人數與預期人數差異達到α=0.05的顯著水準,以無慢性病為例,未滿40歲(3.4)與40-49歲(2.4)的標準化殘差>1.96,代表明顯的比預期人數來得高,50-59歲(-3.3)與60歲以上(-2.0)的標準化殘差<-1.96,代表明顯的比預期人數來得低,最後針對這樣的結果進行說明就好,而有些研究會把上面這樣的結果解讀為未滿40歲與40-49歲的比例高於50-59歲與60歲以上,不過使用時還是得小心,可能會發生有人認為過度推論的狀況,所以我還是比較喜歡採用比較欄比例。
留言列表