一、Phi相關係數(φ)是甚麼:

主要的功能是去衡量兩個二元類別變項的相關性強度,這邊有一件重要的事要提醒讀者,「相關不等於因果關係」,因此雖然下面表格的定義是寫XY,但X不是因,Y也不是果,因此XY欄列互換也可以。Phi相關的使用主要是當我們使用卡方分析的時候,當我們計算出來的Chi-square值在統計上達顯著時,我們可以進一步以Chi-square(X平方)為計算去計算phi相關係數,φ平方=X平方/n,其中n為觀察值的個數,藉以測量兩個二元類別變項的相關性強度以及方向性。

二、Phi相關係數(φ)是如何計算的:

將兩個二元類別變項整理成如下面的2×2交叉表,其中10的擺設位置必須跟下方表格一致,若只變動 X 或只變動 Y 1/0 位置,計算出來的Phi相關係數會正負號顛倒。Phi相關係數的基本概念是:兩個二元類別變數的觀察值若大多落在2×2交叉表的主對角線上面時,意思是指當下面表格b,c的觀察值佔大多數時,觀察值大多為(X,Y)=(1,0) or (0,1)的情境下,會呈現一個負相關。Phi相關係數的範圍會介在-1 to 1之間,當Phi相關係數為1時代表c=0 and b=0,沒有存在(X,Y)=(1,0) or (0,1)的情況;Phi相關係數為-1時代表a=0 and d=0,沒有存在(X,Y)=(1,1) or (0,0)的情況。聰明的讀者應該會發現Phi相關係數φ的大小只根據樣本的分布情形而改變,因此Phi相關係數φ之值只有相對之意義,即數值愈大者,表示相關程度愈高。

 

1.jpg

 

三、Phi相關係數φ的實際例子:

上面描述了許多與Phi相關係數φ有關的特性,以下來個實例:今天研究者欲觀察肥胖狀態 (體重過胖/體重正常)與代謝症候群(/)的相關性。虛無假設(H0)是:肥胖與代謝症候群無相關性;對立假設(H1)是:肥胖與代謝症候群有相關性,觀察對象為從新陳代謝科的病人當中隨機選取100個病人,然後去收集這群病人的肥胖狀態以及有無代謝症候群(肥胖狀態X ,有無代謝症候群Y),X有兩種結果值(過胖=1/正常=0),Y也有兩種結果值(有代謝症候群=1/無代謝症候群=0)。

 

2.jpg

 

    我們根據公式去計算Phi相關係數φ會得到 φ=((40*55)-(12*10))/sqrt((52*65*50*67))=0.6181 ,我們根據交叉表的資料也不難發現,體重過胖的病人中有代謝症候群的比例比起體重正常的病人來的大很多,因此我們跑出來的Phi相關係數φ才會呈現一個中度的正相關。計算出Phi相關係數φ後,如果要知道這樣的相關性到底強不強,其實可以根據下面Phi相關係數的範圍表格做判斷。

 

3.jpg

 

四、利用R語言計算Phi相關係數:

   上述的範例是手動去計算Phi相關係數,但其實我們也可以透過統計軟體來去幫我們計算,這裡以R語言為例子做介紹,首先我們要將上面範例的資料先輸入excel檔,在 R studio透過以下語法將資料讀進來,將讀進來的資料取名為data,如下圖所示。

 

4.jpg

 

再來在R studio安裝”sjstats”程式套件,如下圖所示。

 

5.jpg

 

載入sjstats程式套件的xtab_statistics函數代入data=data(代表要計算的資料來源)、肥胖狀態及代謝症候群計算Phi係數及P值。

 

6.jpg

 

執行語法後,即可得到Phi相關係數及P值,計算出來的Phi相關值=0.6181,為中度相關,且P<0.05,有達統計上的顯著相關。

 

111.jpg

 

7.jpg

arrow
arrow
    全站熱搜

    晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()