提到要進行變項間的相關分析,第一直覺會聯想到皮爾森積差相關(Pearson product-moment correlation),但畢竟是有母數統計,偶爾遇到某些情況被要求改用無母數的相關分析,包含(1)變項不服從常態(2)樣本數小(3)其中一變項為順序尺度,此時將採用Spearman等級相關來探討變項之間的相關情形。
如果有研究過皮爾森相關的公式,會知道公式主要以變項的共變數來計算出相關的強度及方向性,而在Spearman等級相關,則是以每一筆資料在兩個變項的等級差值作衡量標準,若等級差值越小,兩個變項的相關程度則越高,詳細公式說明如下。這邊準備的示範資料為10位個案對於所有照護項目的滿意程度(欄B)及需求程度(欄C),接著以排序方式計算對應的滿意等級(欄E)與需求等級(欄F),因應公式的需要,所以先將滿意等級與需求等級進行相減得到等級差d值(欄H),最後再等級差d值進行平方(欄I)
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
當縱貫型研究要進行GEE或HLM時,首先我們必須將資料集的格式整理成縱貫型資料(也就是長資料格式),此時每位樣本的每一次資料為一筆資料,若樣本重複測量3次就會有3筆資料,若重複測量5次就會有5筆資料,以此類推,資料格式整理完會像下方圖形一樣,此時變項通常會有4種類型,第一種是辨識變項(如ID、Name),用來辨識每一筆資料的來源;第二種是時間變項(如Time),用來辨識同樣本每筆資料的順序,有些研究也會登錄收案時間點;第三種是固定變項(如性別、年齡),不會隨著時間變動的變項,每次收案的數據皆相同;第四種是相依變項(如albumin),會隨著時間變動的變項,每次收案的數據並不相同。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
新版介面操作:
(9)若使用新版介面進行無母數分析,必須先設定好變項的尺度,分組變項必須設定為名義,而檢定變項可以是次序或尺度。
晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()
當要進行兩組的分數比較時,最直覺的聯想就是進行獨立樣本t檢定,歸類在有母數的推論性統計,之前文章提到過,進行獨立樣本t檢定前有三項假設需先符合:(1)常態性、(2)樣本獨立性、(3)變異數同質性。其中樣本獨立性在抽樣適宜的情況下,大致都能符合,但常態性與變異數同質性就得看資料的狀況,透過檢驗才會知道,通常在樣本數小時容易違反。因此就會發現在某些情況下(包含小樣本、依變項不符合常態、依變項為順續變項)時,不太適合有母數統計,而必須改用無母數分析。
常用的幾種有母數分析中,都可以找到對應的無母數統計,這篇文章先介紹兩組獨立樣本的比較,曼-惠特尼U考驗(Mann-Whitney U-test),至於多組獨立樣本比較、兩組相依樣本比較…等,將在日後依序介紹。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
CatBoost(Category Boosting)是由俄羅斯搜索引擎Yandex於2018年開源的一個基於梯度提升(Gradient Boosting)的機器學習演算法。該演算法主要針對分類數據(categorical data)的處理進行了優化,特別在處理稀疏數據和高維度分類數據時展現了出色的性能。它是目前業界較為流行的提升方法之一,被廣泛應用於許多機器學習和數據科學領域。
1. 什麼是梯度提升?
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
當研究要針對不同族群對象進行分析時,可以使用資料功能列中的「選取觀察值」或「分割檔案」來進行,不過由於「選取觀察值」是在條件中選取每一組的對象出來分析,並不是像「分割檔案」可以一次輸出個別組別的資料,因此以「分割檔案」的效率表現較佳,這部分的操作說明,可以參考過去的教學文章,網址如下。https://dasanlin888.pixnet.net/blog/post/569598584
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
我們2025的線上統計課程喔,報名網址,歡迎大家踴躍參加!!!
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()