Excel與統計軟體－晨晰統計部落格新站（統計、SPSS、BIG DATA討論園地）｜痞客邦

公告版位

晨晰統計顧問有限公司在新北市板橋\服務市話：02-29602817\手機：0918-276-622\信箱：raising.statistic@gmail.com\網址：http://www.rai-stat.com.tw

目前分類：Excel與統計軟體 (80)

瀏覽方式：標題列表簡短摘要

Mar 06 Mon 2023 08:58
SPSS分割檔案（Split Files）

這篇要介紹的是SPSS中一個資料處理的功能－分割檔案（Split Files），當研究者需要針對一筆資料中的不同組別來進行相同分析時，就可以使用此資料處理功能，譬如說在分析人口學變項的敘述統計時，除了針對全體對象以外，還想針對男性或女性個別檢視，我們有三種作法，第一種方式是將原始檔案依組別拆開另存新檔，形成男性一個檔案，女性一個檔案，再開始個別檔案進行分析；第二種方式是在原始檔案中，利用以前教學過的篩選條件，先篩選男性樣本進行分析後，再改篩選女性進行分析；第三種則是本篇的主題，分割檔案（Split Files），透過指定變項進行檔案分割後，所有分析都會以各組別的結果輸出，因此分析只要做一次，不用重複進行，否則今天若有一筆全國資料，需要針對不同縣市個別進行，若採用前兩種方式處理，那麼同一種分析就得進行22次。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：Excel與統計軟體

Feb 06 Mon 2023 08:56
SPSS處理複選題的推論性統計（複選題的聯合檢定）（二）

方法二：透過自訂表格進行聯合檢定

（15）點選「分析」à「表格」à「複選題分析集」，先進行複選題的定義。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：Excel與統計軟體

Jan 30 Mon 2023 08:59
SPSS處理複選題的推論性統計（複選題的聯合檢定）（一）

當變項做完敘述性統計後，通常緊接著就會進行推論性統計，來回答各式各樣的研究問題及假設，那複選題的部分又該如何進行推論性統計呢?譬如說不同性別在慢性病的比例上有無差異，之前複選題分析的教學文章中有提到，複選題的每一個選項在資料集中都被視為一個變項，因此最直接的方式，就是將每一項慢性病都獨立最一次推論性統計（無論是做獨立樣本t檢定或是卡方檢定），不過有時候複選題的選項非常多，像慢性病就可能多達一二十種，呈現在表格非常較為繁瑣，所以不妨先以簡易的方式來呈現。

如何化繁為簡呢?重點就是要把複選題想辦法變為單選題，不過要成功的執行這一步，還是得靠各自領域的專業知識，才有辦法建立出一個有意義的單選題，以上述的慢性病來說，最常見的處理方式，就是計算出慢性病總數或是重組成有無慢性病，使此變項變成慢性病的代表變項，再來和其他變項進行相關或差異分析。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：Excel與統計軟體

Oct 03 Mon 2022 08:56
R 繪製violin plot (小提琴圖)

一般針對連續變項的分布情形，通常會使用盒形圖來做視覺化的呈現，盒形圖的組成會包含下左圖所提到的，中位數(median)、上四分位數(25^th quantile)、下四分位數(75^th quantile)、上邊緣(最大值，maximum)、下邊緣(最小值，minimum)以及可能的異常值(outlier)，我們可以透過盒形圖的對稱與否觀察資料的離散程度，也可以檢視資料當中有無不合理的異常值。除此之外，盒形圖也可以用來比較不同組別資料的分布差異，如下右圖所示，一號實驗對象的光速平均而言(中位數約930)比起其他實驗組別要來得快，但資料的分布也比較分散。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：Excel與統計軟體

Sep 26 Mon 2022 13:40
R語言繪製cluster error bar plot

筆者最近在幫客戶分析案子的時候遇到了一個畫圖的問題，後來測試了許多做法，最後找到用R來解決此畫圖問題。筆者手上的資料如下圖所示，包含了五個欄位，其中Mean, Lower, Higher是事先計算好的統計結果，Mean是點估計值，Lower跟Higher分別是95%信賴區間跟Mean之間的距離，因為是假設常態分佈的情況，因此Lower跟Higher會剛好一樣。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：Excel與統計軟體

Sep 05 Mon 2022 08:55
SPSS操作卡方檢定（Chi-square test）-（三）

（13）先看卡方檢定下方的第一個註解，此處即是去計算在交叉表中，有幾格的預期人數不到5，以及佔比有多高，結果顯示，有兩個的預期人數不到5，在12個細格裡的佔比為16.7%。

（14）假如第13步驟的百分比超過20%，則放棄使用卡方檢定的結果，直接用費雪精確性檢定的精確顯著性(雙尾)來結論，不過由於本例預期人數低於5的細格數僅佔16.7%，因此可以繼續進行卡方檢定。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：Excel與統計軟體

Aug 29 Mon 2022 08:47
SPSS操作卡方檢定（Chi-square test）-（二）

操作：

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：Excel與統計軟體

Aug 23 Tue 2022 09:04
SPSS操作卡方檢定（Chi-square test）-（一）

當研究問題在檢驗兩個類別變項間的關聯性或差異性時，卡方檢定是我們挑選統計方法的首要選擇，透過交叉表呈現兩個變項的分布狀況，再利用卡方檢定來檢驗關聯性或差異性的結果，本篇文章將一步一步的帶著大家學會卡方檢定。

首先，我們必須瞭解「預期個數」或稱「期望個數」，這是當我們只知道每個變項的分布狀況，但還不知兩者聯合分布時的預期假設，我們會假設兩個變項應相互獨立，間接的計算出兩者變項聯合時的分布情形。舉例來說，在100位的病患中，男女人數各佔半數，各有50人，有無慢性病的人數也各佔半數=50人時，兩個變項的交叉分布如表（1），此時兩個變項完全獨立。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：Excel與統計軟體

Aug 01 Mon 2022 08:59
SPSS進行類別變項的成對檢定-McNemar test(麥內瑪關聯樣本檢定)（三）

精確顯著性 VS. 漸進顯著性

在進行交叉分析時，一直都有細格人數不得過少的考量，所以您可能聽過當有過多比例的儲存格當人數過小時，就必須捨棄卡方檢定，而改用其他檢定（如費雪精確性檢定），當儲存格B+C人數在26人以上，下圖左方為操作交叉表所得到的結果，所得到的結果為精確顯著性的結果，而下圖右方則為操作無母數檢定所得到的結果，所得到的結果為漸進顯著性的結果，這兩個結果跟上方的例子完全相同。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：Excel與統計軟體

Jul 25 Mon 2022 08:58
SPSS進行類別變項的成對檢定-McNemar test(麥內瑪關聯樣本檢定)（二）

操作方法一（交叉表）

（1）點選「分析」→「敘述統計」→「交叉表」。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：Excel與統計軟體

Jul 18 Mon 2022 08:46
SPSS進行類別變項的成對檢定-McNemar test(麥內瑪關聯樣本檢定)（一）

在進行連續變項的前後測比較或配對比較時，我們會用到一個熟悉的統計方法-成對樣本t檢定（Paired sample t test），不過當變項屬於二分類的類別變項時，我們就必須改用一個比較陌生的檢定方式－麥內瑪關聯樣本檢定（McNemar test）。先來介紹這次的例子，針對100名受訪者，詢問他們在政見發表會前後，對於候選人的支持情況，資料的建立通常有兩種方式，左邊的方式，直接記錄每一位受訪者在政見發表會前後所支持的候選人，因此樣本數會有100筆；右邊的方式，則是將四種反應組合列出後，在第三個欄位中填上該組合下的人數。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：Excel與統計軟體

May 16 Mon 2022 08:53
R 資料的魔法師-Tidyverse (2)

筆者之前有寫一篇關於Tidyverse的介紹，” R 資料的魔法師-Tidyverse (1)”，已經介紹了Tidyverse裡常用的package，包含readr、tidyr、Tibble、dplyr的使用，接下來筆者會針對剩下常用的package作介紹(如下圖所示)。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：Excel與統計軟體

May 06 Fri 2022 08:58
R 資料的魔法師-Tidyverse (1)

在資料科學的領域中，資料的處理大致是下圖的流程，從匯入資料、資料前處理(Tidy、Transform)、資料的探勘(視覺化:visualise、建模:model)、數據呈現。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：Excel與統計軟體

Feb 21 Mon 2022 08:56
複選題的資料處理及分析（三）

複選題分析

（36）開始進入分析，利用SPSS讀取已整理好的複選題資料

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：Excel與統計軟體

Feb 14 Mon 2022 09:51
複選題的資料處理及分析（二）

資料處理方法二

不同於上一種方法，此種方式是透過函數來判斷，雖然比較困難，但如果能熟悉此作法，就算選項不多，一樣好用。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：Excel與統計軟體

Feb 07 Mon 2022 09:34
複選題的資料處理及分析（一）

複選題的設計，常出現問卷設計中，收集受訪者同時出現兩個以上的答案，在資料的鍵檔上，將每個選項分開，是比較好分析的格式設計，但資料輸入時，有些研究為了提高輸入效率，選擇把複選題的答案輸入在同一欄位，並用指定符號隔開選答，以下圖為例，是在收集個案的慢性病情形，以三種慢性病為例（欄B至欄D），若個案有該慢性病，以輸入數值1來表示，反之則輸入0，雖然1/0的輸入方式並非絕對，但為了日後使用方便，1/0的輸入方式還是存在相對優勢，包含資料處理及分析上。欄E則是把所有複選題的選項鍵入在同一欄位中，為了能夠分析，本文章來教學如何拆解，以下將提供兩種資料處理方式，最後說明分析方式。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：Excel與統計軟體

Nov 15 Mon 2021 09:03
SPSS 22-內建虛擬編碼Dummy code(虛擬變數Dummy Variables)~2

11.接著將第二個變項「年齡」按照同樣步驟操作一次

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：Excel與統計軟體

Nov 08 Mon 2021 08:49
SPSS 22-內建虛擬編碼Dummy code(虛擬變數Dummy Variables)~1

筆者過去介紹了幾種介紹虛擬變項建立的文章，直到最近想找一篇教學文章給客戶時，才發現少了一種也是相當簡單的操作方式，正是SPSS 22.0版後才內建的「建立虛擬變數」，因此若您目前所使用的版本較舊或是找不到此功能，那還是得參考過去的文章才行。本篇文章所使用的資料是拿過去的示範資料，三個變項包含性別年齡教育程度，變項的分布情形如下。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：Excel與統計軟體

Oct 18 Mon 2021 09:14
用R執行KNN分析

甚麼是K-nearest Neighbors Algorithm (KNN)分析呢，白話來說，就是物以類聚的概念。假設你的朋友十個有八個成績都很好，合理來說近朱者赤，你成績好的機會應該蠻大的， KNN除了可以用於解決分類的問題(離散型資料)，也適用於解決回歸的問題(連續型資料)，用途相當的廣泛。為了要在R上面執行K-nearest Neighbors Algorithm (KNN)的分析，首先必須先安裝並載入以下的package

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：Excel與統計軟體

Oct 12 Tue 2021 09:10
利用SPSS一般線性模式跑多元迴歸分析（二）

（13）從「受試者間效應項的檢定」中，下方註解處顯示模式的R平方及調整後R平方，對應右邊用線性迴歸分析的結果，有相同的模式摘要。

（14）「校正後的模式」的F值與顯著性，對應右邊用線性迴歸分析的結果，可以得到迴歸模式的整體檢定結果，F值同樣是3.523。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：Excel與統計軟體

«12 3 4 »

熱門文章

文章分類

最新文章

最新留言

文章精選

所有文章列表

文章搜尋

新聞交換(RSS)

誰來我家

參觀人氣

本日人氣：
累積人氣：

QR Code

qrcode

POWERED BY

(登入)

{{ article.user_name }}
{{ article.timestamp * 1000 | date:'MMM.dd.y.hh.mm' }}
{{ article.title }}
{{ article.content }}

PIXNET Facebook Yahoo! Google MSN

您尚未登入，將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

請輸入左方認證碼：

看不懂,換張圖

請輸入驗證碼