前陣子有分享「曼-惠特尼U
考驗」(Mann-Whitney U-test
),這是無母數分析最常使用的兩組獨立樣本檢定,每當檢定結果達顯著水準時,此時問題就來了,該如何去判斷兩組的高低呢?
,如果用平均數似乎也有點奇怪,畢竟是放棄了平均數比較法而採用無母數分析,由於是比較兩組的分布,因此以四分位數的Q1 & Q3
進行判斷最為合理,不過有時候仍會出現兩群擁有相同的四分數位,那就尷尬了,因此這裡要介紹另一種無母數的兩組比較-
中位數檢定,和獨立樣本t
檢定以平均數作為比較基準一樣,在中位數檢定即是以中位數進行分組,再比較兩群體在中位數之上或下的比例是否存在差異,其原理是以交叉表的卡方檢定進行分析。
晨晰部落格新站 發表在
痞客邦
留言(0)
人氣()
晨晰部落格新站 發表在
痞客邦
留言(0)
人氣()
提到要進行變項間的相關分析,第一直覺會聯想到皮爾森積差相關(Pearson product-moment correlation
),但畢竟是有母數統計,偶爾遇到某些情況被要求改用無母數的相關分析,包含(1
)變項不服從常態(2
)樣本數小(3
)其中一變項為順序尺度,此時將採用Spearman
等級相關來探討變項之間的相關情形。
晨晰部落格新站 發表在
痞客邦
留言(0)
人氣()
晨晰部落格新站 發表在
痞客邦
留言(0)
人氣()
當縱貫型研究要進行GEE
或HLM
時,首先我們必須將資料集的格式整理成縱貫型資料(也就是長資料格式),此時每位樣本的每一次資料為一筆資料,若樣本重複測量3
次就會有3
筆資料,若重複測量5
次就會有5
筆資料,以此類推,資料格式整理完會像下方圖形一樣,此時變項通常會有4
種類型,第一種是辨識變項(如ID
、Name
),用來辨識每一筆資料的來源;第二種是時間變項(如Time
),用來辨識同樣本每筆資料的順序,有些研究也會登錄收案時間點;第三種是固定變項(如性別、年齡),不會隨著時間變動的變項,每次收案的數據皆相同;第四種是相依變項(如albumin
),會隨著時間變動的變項,每次收案的數據並不相同。
晨晰部落格新站 發表在
痞客邦
留言(1)
人氣()
晨晰部落格新站 發表在
痞客邦
留言(0)
人氣()
新版介面操作:(9)若使用新版介面進行無母數分析,必須先設定好變項的尺度,分組變項必須設定為名義,而檢定變項可以是次序或尺度。
晨晰部落格新站 發表在
痞客邦
留言(1)
人氣()
當要進行兩組的分數比較時,最直覺的聯想就是進行獨立樣本t
檢定,歸類在有母數的推論性統計,之前文章提到過,進行獨立樣本t
檢定前有三項假設需先符合:(1
)常態性、(2
)樣本獨立性、(3
)變異數同質性。其中樣本獨立性在抽樣適宜的情況下,大致都能符合,但常態性與變異數同質性就得看資料的狀況,透過檢驗才會知道,通常在樣本數小時容易違反。因此就會發現在某些情況下(包含小樣本、依變項不符合常態、依變項為順續變項)時,不太適合有母數統計,而必須改用無母數分析。
晨晰部落格新站 發表在
痞客邦
留言(0)
人氣()
晨晰部落格新站 發表在
痞客邦
留言(0)
人氣()
CatBoost(Category Boosting)是由俄羅斯搜索引擎Yandex於2018年開源的一個基於梯度提升(Gradient Boosting)的機器學習演算法。該演算法主要針對分類數據(categorical data)的處理進行了優化,特別在處理稀疏數據和高維度分類數據時展現了出色的性能。它是目前業界較為流行的提升方法之一,被廣泛應用於許多機器學習和數據科學領域。
晨晰部落格新站 發表在
痞客邦
留言(0)
人氣()
當研究要針對不同族群對象進行分析時,可以使用資料功能列中的「選取觀察值」或「分割檔案」來進行,不過由於「選取觀察值」是在條件中選取每一組的對象出來分析,並不是像「分割檔案」可以一次輸出個別組別的資料,因此以「分割檔案」的效率表現較佳,這部分的操作說明,可以參考過去的教學文章,網址如下。https://dasanlin888.pixnet.net/blog/post/569598584
晨晰部落格新站 發表在
痞客邦
留言(0)
人氣()
我們2025的線上統計課程喔,
報名網址,歡迎大家踴躍參加!!!
晨晰部落格新站 發表在
痞客邦
留言(0)
人氣()