公告版位
晨晰統計顧問有限公司在新北市板橋\服務市話:02-29602817\手機:0918-276-622\信箱:raising.statistic@gmail.com\網址:http://www.rai-stat.com.tw

目前分類:Excel與統計軟體 (80)

瀏覽方式: 標題列表 簡短摘要

 

這篇要介紹的是SPSS中一個資料處理的功能-分割檔案(Split Files),當研究者需要針對一筆資料中的不同組別來進行相同分析時,就可以使用此資料處理功能,譬如說在分析人口學變項的敘述統計時,除了針對全體對象以外,還想針對男性或女性個別檢視,我們有三種作法,第一種方式是將原始檔案依組別拆開另存新檔,形成男性一個檔案,女性一個檔案,再開始個別檔案進行分析;第二種方式是在原始檔案中,利用以前教學過的篩選條件,先篩選男性樣本進行分析後,再改篩選女性進行分析;第三種則是本篇的主題,分割檔案(Split Files),透過指定變項進行檔案分割後,所有分析都會以各組別的結果輸出,因此分析只要做一次,不用重複進行,否則今天若有一筆全國資料,需要針對不同縣市個別進行,若採用前兩種方式處理,那麼同一種分析就得進行22次。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

方法二:透過自訂表格進行聯合檢定

15)點選「分析」à「表格」à「複選題分析集」,先進行複選題的定義。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

當變項做完敘述性統計後,通常緊接著就會進行推論性統計,來回答各式各樣的研究問題及假設,那複選題的部分又該如何進行推論性統計呢?譬如說不同性別在慢性病的比例上有無差異,之前複選題分析的教學文章中有提到,複選題的每一個選項在資料集中都被視為一個變項,因此最直接的方式,就是將每一項慢性病都獨立最一次推論性統計(無論是做獨立樣本t檢定或是卡方檢定),不過有時候複選題的選項非常多,像慢性病就可能多達一二十種,呈現在表格非常較為繁瑣,所以不妨先以簡易的方式來呈現。

如何化繁為簡呢?重點就是要把複選題想辦法變為單選題,不過要成功的執行這一步,還是得靠各自領域的專業知識,才有辦法建立出一個有意義的單選題,以上述的慢性病來說,最常見的處理方式,就是計算出慢性病總數或是重組成有無慢性病,使此變項變成慢性病的代表變項,再來和其他變項進行相關或差異分析。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

一般針對連續變項的分布情形,通常會使用盒形圖來做視覺化的呈現,盒形圖的組成會包含下左圖所提到的,中位數(median)、上四分位數(25th quantile)、下四分位數(75th quantile)、上邊緣(最大值,maximum)、下邊緣(最小值,minimum)以及可能的異常值(outlier),我們可以透過盒形圖的對稱與否觀察資料的離散程度,也可以檢視資料當中有無不合理的異常值。除此之外,盒形圖也可以用來比較不同組別資料的分布差異,如下右圖所示,一號實驗對象的光速平均而言(中位數約930)比起其他實驗組別要來得快,但資料的分布也比較分散。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

筆者最近在幫客戶分析案子的時候遇到了一個畫圖的問題,後來測試了許多做法,最後找到用R來解決此畫圖問題。筆者手上的資料如下圖所示,包含了五個欄位,其中Mean, Lower, Higher是事先計算好的統計結果,Mean是點估計值,Lower跟Higher分別是95%信賴區間跟Mean之間的距離,因為是假設常態分佈的情況,因此Lower跟Higher會剛好一樣。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

13)先看卡方檢定下方的第一個註解,此處即是去計算在交叉表中,有幾格的預期人數不到5,以及佔比有多高,結果顯示,有兩個的預期人數不到5,在12個細格裡的佔比為16.7%

14)假如第13步驟的百分比超過20%,則放棄使用卡方檢定的結果,直接用費雪精確性檢定的精確顯著性(雙尾)來結論,不過由於本例預期人數低於5的細格數僅佔16.7%,因此可以繼續進行卡方檢定。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

 

操作:

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

     當研究問題在檢驗兩個類別變項間的關聯性或差異性時,卡方檢定是我們挑選統計方法的首要選擇,透過交叉表呈現兩個變項的分布狀況,再利用卡方檢定來檢驗關聯性或差異性的結果,本篇文章將一步一步的帶著大家學會卡方檢定。

首先,我們必須瞭解「預期個數」或稱「期望個數」,這是當我們只知道每個變項的分布狀況,但還不知兩者聯合分布時的預期假設,我們會假設兩個變項應相互獨立,間接的計算出兩者變項聯合時的分布情形。舉例來說,在100位的病患中,男女人數各佔半數,各有50人,有無慢性病的人數也各佔半數=50人時,兩個變項的交叉分布如表(1),此時兩個變項完全獨立。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

精確顯著性 VS. 漸進顯著性

在進行交叉分析時,一直都有細格人數不得過少的考量,所以您可能聽過當有過多比例的儲存格當人數過小時,就必須捨棄卡方檢定,而改用其他檢定(如費雪精確性檢定),當儲存格B+C人數在26人以上,下圖左方為操作交叉表所得到的結果,所得到的結果為精確顯著性的結果,而下圖右方則為操作無母數檢定所得到的結果,所得到的結果為漸進顯著性的結果,這兩個結果跟上方的例子完全相同。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

操作方法一(交叉表)

1)點選「分析」→「敘述統計」→「交叉表」。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在進行連續變項的前後測比較或配對比較時,我們會用到一個熟悉的統計方法-成對樣本t檢定(Paired sample t test),不過當變項屬於二分類的類別變項時,我們就必須改用一個比較陌生的檢定方式-麥內瑪關聯樣本檢定(McNemar test)。先來介紹這次的例子,針對100名受訪者,詢問他們在政見發表會前後,對於候選人的支持情況,資料的建立通常有兩種方式,左邊的方式,直接記錄每一位受訪者在政見發表會前後所支持的候選人,因此樣本數會有100筆;右邊的方式,則是將四種反應組合列出後,在第三個欄位中填上該組合下的人數。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

筆者之前有寫一篇關於Tidyverse的介紹,” R 資料的魔法師-Tidyverse (1)”,已經介紹了Tidyverse裡常用的package,包含readrtidyrTibbledplyr的使用,接下來筆者會針對剩下常用的package作介紹(如下圖所示)

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在資料科學的領域中,資料的處理大致是下圖的流程,從匯入資料、資料前處理(TidyTransform)、資料的探勘(視覺化:visualise、建模:model)、數據呈現。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

複選題分析

36)開始進入分析,利用SPSS讀取已整理好的複選題資料

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

資料處理方法二

不同於上一種方法,此種方式是透過函數來判斷,雖然比較困難,但如果能熟悉此作法,就算選項不多,一樣好用。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

複選題的設計,常出現問卷設計中,收集受訪者同時出現兩個以上的答案,在資料的鍵檔上,將每個選項分開,是比較好分析的格式設計,但資料輸入時,有些研究為了提高輸入效率,選擇把複選題的答案輸入在同一欄位,並用指定符號隔開選答,以下圖為例,是在收集個案的慢性病情形,以三種慢性病為例(欄B至欄D),若個案有該慢性病,以輸入數值1來表示,反之則輸入0,雖然1/0的輸入方式並非絕對,但為了日後使用方便,1/0的輸入方式還是存在相對優勢,包含資料處理及分析上。欄E則是把所有複選題的選項鍵入在同一欄位中,為了能夠分析,本文章來教學如何拆解,以下將提供兩種資料處理方式,最後說明分析方式。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

 

11.接著將第二個變項「年齡」按照同樣步驟操作一次

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

筆者過去介紹了幾種介紹虛擬變項建立的文章,直到最近想找一篇教學文章給客戶時,才發現少了一種也是相當簡單的操作方式,正是SPSS 22.0版後才內建的「建立虛擬變數」,因此若您目前所使用的版本較舊或是找不到此功能,那還是得參考過去的文章才行。本篇文章所使用的資料是拿過去的示範資料,三個變項包含性別年齡教育程度,變項的分布情形如下。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

甚麼是K-nearest Neighbors Algorithm (KNN)分析呢,白話來說,就是物以類聚的概念。假設你的朋友十個有八個成績都很好,合理來說近朱者赤,你成績好的機會應該蠻大的, KNN除了可以用於解決分類的問題(離散型資料),也適用於解決回歸的問題(連續型資料),用途相當的廣泛。為了要在R上面執行K-nearest Neighbors Algorithm (KNN)的分析,首先必須先安裝並載入以下的package

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

13)從「受試者間效應項的檢定」中,下方註解處顯示模式的R平方及調整後R平方,對應右邊用線性迴歸分析的結果,有相同的模式摘要。

14)「校正後的模式」的F值與顯著性,對應右邊用線性迴歸分析的結果,可以得到迴歸模式的整體檢定結果,F值同樣是3.523。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

Close

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

reload

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼