公告版位
晨晰統計顧問有限公司在新北市板橋\服務市話:02-29602817\手機:0918-276-622\信箱:raising.statistic@gmail.com\網址:http://www.rai-stat.com.tw


晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

當縱貫型研究要進行GEEHLM時,首先我們必須將資料集的格式整理成縱貫型資料(也就是長資料格式),此時每位樣本的每一次資料為一筆資料,若樣本重複測量3次就會有3筆資料,若重複測量5次就會有5筆資料,以此類推,資料格式整理完會像下方圖形一樣,此時變項通常會有4種類型,第一種是辨識變項(如IDName),用來辨識每一筆資料的來源;第二種是時間變項(如Time),用來辨識同樣本每筆資料的順序,有些研究也會登錄收案時間點;第三種是固定變項(如性別、年齡),不會隨著時間變動的變項,每次收案的數據皆相同;第四種是相依變項(如albumin),會隨著時間變動的變項,每次收案的數據並不相同。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

POWER BI 快速導入方案

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

新版介面操作:

9)若使用新版介面進行無母數分析,必須先設定好變項的尺度,分組變項必須設定為名義,而檢定變項可以是次序或尺度。

晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()

當要進行兩組的分數比較時,最直覺的聯想就是進行獨立樣本t檢定,歸類在有母數的推論性統計,之前文章提到過,進行獨立樣本t檢定前有三項假設需先符合:(1)常態性、(2)樣本獨立性、(3)變異數同質性。其中樣本獨立性在抽樣適宜的情況下,大致都能符合,但常態性與變異數同質性就得看資料的狀況,透過檢驗才會知道,通常在樣本數小時容易違反。因此就會發現在某些情況下(包含小樣本、依變項不符合常態、依變項為順續變項)時,不太適合有母數統計,而必須改用無母數分析。

常用的幾種有母數分析中,都可以找到對應的無母數統計,這篇文章先介紹兩組獨立樣本的比較,曼-惠特尼U考驗Mann-Whitney U-test),至於多組獨立樣本比較、兩組相依樣本比較等,將在日後依序介紹。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()


晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

 

CatBoostCategory Boosting)是由俄羅斯搜索引擎Yandex2018年開源的一個基於梯度提升(Gradient Boosting)的機器學習演算法。該演算法主要針對分類數據(categorical data)的處理進行了優化,特別在處理稀疏數據和高維度分類數據時展現了出色的性能。它是目前業界較為流行的提升方法之一,被廣泛應用於許多機器學習和數據科學領域。

1. 什麼是梯度提升?

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

 

當研究要針對不同族群對象進行分析時,可以使用資料功能列中的「選取觀察值」或「分割檔案」來進行,不過由於「選取觀察值」是在條件中選取每一組的對象出來分析,並不是像「分割檔案」可以一次輸出個別組別的資料,因此以「分割檔案」的效率表現較佳,這部分的操作說明,可以參考過去的教學文章,網址如下。https://dasanlin888.pixnet.net/blog/post/569598584

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

 

我們2025的線上統計課程喔,報名網址,歡迎大家踴躍參加!!!

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

              在當前的人工智能(AI)和機器學習(ML)領域,模型的透明性與可解釋性愈加重要。隨著這些模型廣泛應用於決策過程中,從醫療診斷到金融風險評估,理解模型如何做出決策變得至關重要。SHAPSHapley 加法解釋)值因此應運而生,旨在滿足這一需求。SHAP 值是一種基於合作博弈論的解釋方法,它將模型的輸出分解為各個特徵的貢獻,幫助用戶更好地理解模型的運行機制。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

Close

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

reload

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼