公告版位
- Mar 31 Mon 2025 09:03
智慧醫療客戶問卷設計 3 大技巧!
- Mar 10 Mon 2025 09:23
縱貫型資料用Excel填補空白欄位
當縱貫型研究要進行GEE或HLM時,首先我們必須將資料集的格式整理成縱貫型資料(也就是長資料格式),此時每位樣本的每一次資料為一筆資料,若樣本重複測量3次就會有3筆資料,若重複測量5次就會有5筆資料,以此類推,資料格式整理完會像下方圖形一樣,此時變項通常會有4種類型,第一種是辨識變項(如ID、Name),用來辨識每一筆資料的來源;第二種是時間變項(如Time),用來辨識同樣本每筆資料的順序,有些研究也會登錄收案時間點;第三種是固定變項(如性別、年齡),不會隨著時間變動的變項,每次收案的數據皆相同;第四種是相依變項(如albumin),會隨著時間變動的變項,每次收案的數據並不相同。
- Mar 03 Mon 2025 09:44
PowerBI快速導入方案介紹
- Feb 24 Mon 2025 09:12
無母數分析-兩組獨立樣本檢定(Mann-Whitney U-test)(二)
- Feb 08 Sat 2025 16:06
無母數分析-兩組獨立樣本檢定(Mann-Whitney U-test)(一)
當要進行兩組的分數比較時,最直覺的聯想就是進行獨立樣本t檢定,歸類在有母數的推論性統計,之前文章提到過,進行獨立樣本t檢定前有三項假設需先符合:(1)常態性、(2)樣本獨立性、(3)變異數同質性。其中樣本獨立性在抽樣適宜的情況下,大致都能符合,但常態性與變異數同質性就得看資料的狀況,透過檢驗才會知道,通常在樣本數小時容易違反。因此就會發現在某些情況下(包含小樣本、依變項不符合常態、依變項為順續變項)時,不太適合有母數統計,而必須改用無母數分析。
常用的幾種有母數分析中,都可以找到對應的無母數統計,這篇文章先介紹兩組獨立樣本的比較,曼-惠特尼U考驗(Mann-Whitney U-test),至於多組獨立樣本比較、兩組相依樣本比較…等,將在日後依序介紹。
- Jan 20 Mon 2025 11:19
EHJ高分論文分享
- Jan 13 Mon 2025 11:47
CatBoost演算法介紹
CatBoost(Category Boosting)是由俄羅斯搜索引擎Yandex於2018年開源的一個基於梯度提升(Gradient Boosting)的機器學習演算法。該演算法主要針對分類數據(categorical data)的處理進行了優化,特別在處理稀疏數據和高維度分類數據時展現了出色的性能。它是目前業界較為流行的提升方法之一,被廣泛應用於許多機器學習和數據科學領域。
1. 什麼是梯度提升?
- Dec 23 Mon 2024 09:18
使用SPSS分割並儲存為檔案
當研究要針對不同族群對象進行分析時,可以使用資料功能列中的「選取觀察值」或「分割檔案」來進行,不過由於「選取觀察值」是在條件中選取每一組的對象出來分析,並不是像「分割檔案」可以一次輸出個別組別的資料,因此以「分割檔案」的效率表現較佳,這部分的操作說明,可以參考過去的教學文章,網址如下。https://dasanlin888.pixnet.net/blog/post/569598584
- Dec 02 Mon 2024 09:12
晨晰統計2025線上統計課程~~
- Nov 18 Mon 2024 08:58
SHAP 值在機器學習的應用
在當前的人工智能(AI)和機器學習(ML)領域,模型的透明性與可解釋性愈加重要。隨著這些模型廣泛應用於決策過程中,從醫療診斷到金融風險評估,理解模型如何做出決策變得至關重要。SHAP(SHapley 加法解釋)值因此應運而生,旨在滿足這一需求。SHAP 值是一種基於合作博弈論的解釋方法,它將模型的輸出分解為各個特徵的貢獻,幫助用戶更好地理解模型的運行機制。