公告版位
晨晰統計顧問有限公司在新北市板橋\服務市話:02-29602817\手機:0918-276-622\信箱:raising.statistic@gmail.com\網址:http://www.rai-stat.com.tw

目前分類:Excel與統計軟體 (71)

瀏覽方式: 標題列表 簡短摘要

前陣子有客戶收到審查意見,因為客戶的研究屬於RCT,是利用廣義估計方程GEE檢驗其介入效果,委員要求在報告中提供標準畫係數,作為檢驗結果的效果量,用SPSS跑過GEE就會知道,在GEE的參數估計表格中,並不像迴歸分析提供了標準化係數,因此我們必須另外先對原始資料做處理,想到了嗎?沒錯,就是要先對變項進行標準化的動作,關於變項的標準化,可以參考之前的文章

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

當我們收集完資料並完成建檔後,在分析之前,一定要確實做到檢查的工作,檢查的重點,包含了數值的合理性,以及變數的遺漏狀況。我們用的分析方法,是最簡單及最常見的次數分配與描述性統計量,沒錯,只要分析有做到敘述統計的話,大致上都能檢查到資料的問題,下面我們將這些問題整理出來。

利用敘述統計探視變數的遺漏狀態:

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

當我們收集完資料並完成建檔後,在分析之前,一定要確實做到檢查的工作,檢查的重點,包含了數值的合理性,以及變數的遺漏狀況。我們用的分析方法,是最簡單及最常見的次數分配與描述性統計量,沒錯,只要分析有做到敘述統計的話,大致上都能檢查到資料的問題,下面我們將這些問題整理出來。

利用次數分配找到輸入錯誤的變數:

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

表格:

8)最常見的相關係數表,直接根據輸入的報表,只留下相關係數的部分製表,左邊列輸入變數名稱,上方欄則用代號表示,顯著性的部分直接以星號表示就好,這樣的呈現一目了然。然而也是有缺點的,當放入的變項太多時,在兩兩變項的相關組合下會產生非常的相關係數,將容易造成表格的數字不好閱讀。從表4-4-1可知研究變項有3個,分別是日常生活功能、憂鬱、生活品質,因此主要的相關分析有日常生活功能與憂鬱日常生活功能與生活品質憂鬱與生活品質,剩下未標顏色的區域為生活品質各構面的自我相關。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

獨立樣本T檢定、單因子變異數分析、卡方分析、皮爾森積差相關,是在研究變項之間的關係時,最常使用的統計方法,前三項已經有寫過文章做教學介紹,因此本篇將補齊第四個統計方法「皮爾森積差相關」,用於衡量兩個連續變項的相關性,係數介於-1至1之間,正負代表變項關係的方向性,數值代表變項之間的關係強度,若係數之絕對值愈接近1,表示關聯性愈強。

相對前面三種統計方法,皮爾森積差相關操作簡單,解釋也不難,所以除了操作教學之外,也會說明表格的呈現方式,並延伸常遇到的問題。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

表格(為了方便說明,先將結果整理成表格):

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

結果:

9)單因子變異數分析的第一張為描述性統計,可以得到每一組的樣本數、平均數、標準差。由於差異分析的表格通常需要交代各組別的描述性統計,所以會建議步驟4需要勾選,並將各組的平均數與標準差呈現於表格中。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

當比較樣本平均數差異的組別數來到三組以上時,就不適用先前教過的獨立樣本t檢定,而必須改用單因子變異數分析(One way ANOVA)。順帶一提,當組別數只有兩組樣本的話,也是可以使用單因子變異數分析來進行組間的平均數比較,得到的結果會和獨立樣本t檢定的結果一致,不過大部分研究遇到兩組的組間比較,仍是以獨立樣本t為主。

獨立樣本單因子變異數分析與獨立樣本t檢定有一樣的前題假設:(1)被檢定的變項需符合常態性;(2)樣本獨立性;(3)變異數同質性,有關三項假設的說明,可以參考上一篇SPSS進行獨立樣本t檢定,其中關於變異數質性的操作,會比獨立樣本t檢定來得複雜一些些,將在下方操作時一併說明。

晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()

10)接著介紹定義組別時,若調整組別編號的順序,對於結果會產生什麼影響,如圖所示,將組別1與組別2的編碼對調。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

最近想要回來介紹一些比較常用的統計方法,雖然這些方法在網路上都非常容易,不過除了介紹操作流程之外,想順便將常常被提問的問題一起分享給大家。

獨立樣本t檢定收錄在SPSS的「比較平均數」裡,比較兩組樣本的平均數差異用來推論到母群體的結果。進行獨立樣本t檢定前有三項假設需先符合:(1)被檢定的變項需符合常態性,透過常態檢定,或是呈現偏態、峰度或常態機率圖形說明,由於常態檢定在大樣本的條件下,分配的非常態性容易達到顯著條件,此時採用圖表判定,會比較合適一些;(2)樣本獨立性,指的是每一筆樣本都是獨立的資料,什麼情況下會不獨立呢?舉例來說,同一位研究對象被重複收案兩次,那就會違反樣本獨立性的假設;(3)變異數同質性,針對兩組樣本的變異數進行比較,當比較結果未達顯著才符合同質性的假設,而在SPSS軟體裡同時提供了變異數符合同質及違反同質的t檢定結果,因此只需要判斷使用那一個結果即可。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

前陣子遇到一個諮詢問題,有些變項因為不同組別的標準不一樣,在做分析時會先按照個別的標準轉換成新的變數,再利用此變數進行後續的統計分析,譬如說男女性的腰圍,通常男性的標準範圍為小於90公分,而女性應小於80公分,因此都會先依照標準轉成二元變數後,再進行統計分析,但如果今天我們想利用原始的測量數據來分析,又該如何處理呢?答案很簡單,不同組別進行個別的標準化。

變數的標準化以公式來說,首先要求出該變數的平均數與標準差,接著讓樣本減掉平均值後,最後再除以標準差即可,不過在SPSS裡更為簡單,我們只需要透過描述性統計分析的功能,進一步把標準化的變數儲存下來。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

 

這篇要介紹的是SPSS中一個資料處理的功能-分割檔案(Split Files),當研究者需要針對一筆資料中的不同組別來進行相同分析時,就可以使用此資料處理功能,譬如說在分析人口學變項的敘述統計時,除了針對全體對象以外,還想針對男性或女性個別檢視,我們有三種作法,第一種方式是將原始檔案依組別拆開另存新檔,形成男性一個檔案,女性一個檔案,再開始個別檔案進行分析;第二種方式是在原始檔案中,利用以前教學過的篩選條件,先篩選男性樣本進行分析後,再改篩選女性進行分析;第三種則是本篇的主題,分割檔案(Split Files),透過指定變項進行檔案分割後,所有分析都會以各組別的結果輸出,因此分析只要做一次,不用重複進行,否則今天若有一筆全國資料,需要針對不同縣市個別進行,若採用前兩種方式處理,那麼同一種分析就得進行22次。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

方法二:透過自訂表格進行聯合檢定

15)點選「分析」à「表格」à「複選題分析集」,先進行複選題的定義。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

當變項做完敘述性統計後,通常緊接著就會進行推論性統計,來回答各式各樣的研究問題及假設,那複選題的部分又該如何進行推論性統計呢?譬如說不同性別在慢性病的比例上有無差異,之前複選題分析的教學文章中有提到,複選題的每一個選項在資料集中都被視為一個變項,因此最直接的方式,就是將每一項慢性病都獨立最一次推論性統計(無論是做獨立樣本t檢定或是卡方檢定),不過有時候複選題的選項非常多,像慢性病就可能多達一二十種,呈現在表格非常較為繁瑣,所以不妨先以簡易的方式來呈現。

如何化繁為簡呢?重點就是要把複選題想辦法變為單選題,不過要成功的執行這一步,還是得靠各自領域的專業知識,才有辦法建立出一個有意義的單選題,以上述的慢性病來說,最常見的處理方式,就是計算出慢性病總數或是重組成有無慢性病,使此變項變成慢性病的代表變項,再來和其他變項進行相關或差異分析。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

一般針對連續變項的分布情形,通常會使用盒形圖來做視覺化的呈現,盒形圖的組成會包含下左圖所提到的,中位數(median)、上四分位數(25th quantile)、下四分位數(75th quantile)、上邊緣(最大值,maximum)、下邊緣(最小值,minimum)以及可能的異常值(outlier),我們可以透過盒形圖的對稱與否觀察資料的離散程度,也可以檢視資料當中有無不合理的異常值。除此之外,盒形圖也可以用來比較不同組別資料的分布差異,如下右圖所示,一號實驗對象的光速平均而言(中位數約930)比起其他實驗組別要來得快,但資料的分布也比較分散。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

筆者最近在幫客戶分析案子的時候遇到了一個畫圖的問題,後來測試了許多做法,最後找到用R來解決此畫圖問題。筆者手上的資料如下圖所示,包含了五個欄位,其中Mean, Lower, Higher是事先計算好的統計結果,Mean是點估計值,Lower跟Higher分別是95%信賴區間跟Mean之間的距離,因為是假設常態分佈的情況,因此Lower跟Higher會剛好一樣。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

13)先看卡方檢定下方的第一個註解,此處即是去計算在交叉表中,有幾格的預期人數不到5,以及佔比有多高,結果顯示,有兩個的預期人數不到5,在12個細格裡的佔比為16.7%

14)假如第13步驟的百分比超過20%,則放棄使用卡方檢定的結果,直接用費雪精確性檢定的精確顯著性(雙尾)來結論,不過由於本例預期人數低於5的細格數僅佔16.7%,因此可以繼續進行卡方檢定。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

 

操作:

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

     當研究問題在檢驗兩個類別變項間的關聯性或差異性時,卡方檢定是我們挑選統計方法的首要選擇,透過交叉表呈現兩個變項的分布狀況,再利用卡方檢定來檢驗關聯性或差異性的結果,本篇文章將一步一步的帶著大家學會卡方檢定。

首先,我們必須瞭解「預期個數」或稱「期望個數」,這是當我們只知道每個變項的分布狀況,但還不知兩者聯合分布時的預期假設,我們會假設兩個變項應相互獨立,間接的計算出兩者變項聯合時的分布情形。舉例來說,在100位的病患中,男女人數各佔半數,各有50人,有無慢性病的人數也各佔半數=50人時,兩個變項的交叉分布如表(1),此時兩個變項完全獨立。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

精確顯著性 VS. 漸進顯著性

在進行交叉分析時,一直都有細格人數不得過少的考量,所以您可能聽過當有過多比例的儲存格當人數過小時,就必須捨棄卡方檢定,而改用其他檢定(如費雪精確性檢定),當儲存格B+C人數在26人以上,下圖左方為操作交叉表所得到的結果,所得到的結果為精確顯著性的結果,而下圖右方則為操作無母數檢定所得到的結果,所得到的結果為漸進顯著性的結果,這兩個結果跟上方的例子完全相同。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

1 234
Close

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

reload

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼