PIXNET Logo登入

晨晰統計部落格新站(統計、SPSS、BIG DATA討論園地)

跳到主文

一個討論統計的好地方

部落格全站分類:圖文創作

  • 相簿
  • 部落格
  • 留言
  • 名片
  • 9月 30 週一 202409:05
  • Bagging 與 Boosting的比較

Bagging 與 Boosting的比較
集成學習是一種通過結合多個模型來提升機器學習預測性能的方法。相較於單一模型,集成學習能產生更準確且穩定的結果,其核心理念是訓練一組分類器(或專家),並通過集體投票來決策。Bagging 和 Boosting 是集成學習中常見的兩種技術,這兩者都能減少單一模型的方差,從而提升模型的穩定性。Bagging跟Boosting 同為同質弱學習器模型,但其工作方式不同,我們將深入探討這兩者之間的差異。
 
(繼續閱讀...)
文章標籤

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣(414)

  • 個人分類:統計分析新趨勢
▲top
  • 9月 09 週一 202409:03
  • XGBoost模型的介紹

 
XGBoost,全名為 Extreme Gradient Boosting,是一種先進的機器學習算法,特別適合於分類和回歸任務。自 2016 年由陳天奇推出以來,XGBoost 以其卓越的性能和靈活性迅速成為數據科學領域的熱門工具,被廣泛應用於許多實際問題中,特別是在Kaggle的競賽中經常會見到。
(繼續閱讀...)
文章標籤

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣(1,512)

  • 個人分類:統計分析新趨勢
▲top
  • 7月 29 週一 202408:57
  • 隨機存活森林概述

隨機存活森林概述
 
一、緣起:
(繼續閱讀...)
文章標籤

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣(246)

  • 個人分類:統計分析新趨勢
▲top
  • 7月 01 週一 202409:11
  • KNN(K-Nearest Neighbors)的起源與應用

KNN(K-Nearest Neighbors)的起源與應用
筆者過去曾寫過用R執行KNN(K-Nearest Neighbors)分析(https://reurl.cc/qV5Xzp)的文章,筆者這篇將針對KNN的起源跟原理進行介紹及說明。
 
(繼續閱讀...)
文章標籤

晨晰部落格新站 發表在 痞客邦 留言(1) 人氣(306)

  • 個人分類:統計分析新趨勢
▲top
  • 6月 03 週一 202408:56
  • Support vector machine (SVM)的起源與應用

 
支持向量機(Support Vector Machine,SVM)是一種重要的機器學習算法,被廣泛應用於分類和回歸分析等任務。它的起源可以追溯到上個世紀60年代,由兩位蘇聯數學家Vladimir Vapnik (弗拉基米爾·瓦普尼克)和Alexey Chervonenkis (亞歷克塞·澤范蘭傑斯)首次提出。在本文中,我們將分別討論SVM的起源、發展歷程以及其在在機器學習中的優點及缺點。
(繼續閱讀...)
文章標籤

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣(305)

  • 個人分類:統計分析新趨勢
▲top
  • 9月 19 週一 202209:03
  • 機器學習的好夥伴-WEKA介紹(1)

1.jpg
在機器學習的領域當中,有著各式各樣的演算法,但往往為了要使用這些演算法,會需要透過寫程式的方式來去使用這些方法,雖然現在統計軟體(例如: R、Python)在呼叫這些演算法所下的指令不是說非常的長,有些時候甚至相當簡單的指令就能使用需要的演算法,但對於沒有寫程式經驗的機器學習初學者來說,還是有一定的進入障礙。所幸還是有一些不需要寫程式的機器學習工具可以使用,例如Weka,筆者第一次接觸Weka是在大學上資料探勘課程的時候,筆者大學的時候機器學習還沒有像現在那麼多課程跟工具可用(應該距今至少十年吧),因此Weka這個工具可以發展那麼久都還沒有停止更新,想必有其過人之處,因此筆者想介紹Weka給機器學習的初學者們。
Weka是紐西蘭懷卡托大學機器學習實驗室專為「學習資料探勘」所開發的Java軟體,Weka是懷卡托智慧分析系統的縮寫。Weka限制在GNU通用官方證書的條件下發佈(開源工具),幾乎可以運行在所有作業系統平台上,包括Linux、Windows、Mac OS等。Weka包含完整的資料探勘處理流程,包含(1)資料前處理工具、(2)機器學習演算法、(3)成效評估方法、(4)資訊視覺化報表摘要,最大的優點在於兼具圖像化的使用介面以及寫指令的介面,因此不管是不懂寫程式的初學者以及老手都可以充分做使用,此外,Weka也可以持續擴充新的演算法,因此不用擔心不支援主流的演算法。目前下載最新版本的Weka是3.8.6版,以下的操作就已最新版本做示範。
(繼續閱讀...)
文章標籤

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣(2,774)

  • 個人分類:統計分析新趨勢
▲top
  • 1月 24 週一 202209:59
  • XGBoost演算法-eXtreme Gradient Boosting(極限梯度提升)-3/3

1.jpg
這次的內容會針對如何在R語言執行XGBoost作介紹,主要會根據筆者參考資料中XGBoost R Tutorial的章節作介紹,XGBoost的全名是eXtreme Gradient Boosting,最早是在2014年由陳天奇開發,此種演算法在Kaggle的比賽中大殺四方,因此獲得了大量建模使用者的青睞。筆者之前有針對XGBoost的原理做比較深入的介紹,有興趣的讀者可以參考XGBoost演算法-eXtreme Gradient Boosting(極限梯度提升)-1/3、XGBoost演算法-eXtreme Gradient Boosting(極限梯度提升)-2/3的文章。
(繼續閱讀...)
文章標籤

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣(246)

  • 個人分類:統計分析新趨勢
▲top
  • 1月 10 週一 202208:58
  • XGBoost演算法-eXtreme Gradient Boosting(極限梯度提升)-2/3

1.jpg
梯度提升(Gradient Boosting)是一種boosting的演算法,最早的論文是「Greedy Function Approximation: A Gradient Boosting Machine」,目前已被引用約15,000次,此種演算法可以應用到很多模型上,但是最常見的是用到決策樹(Decision tree)上,也就是GBDT(Gradient Boosting Decision Tree)。
(繼續閱讀...)
文章標籤

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣(2,120)

  • 個人分類:統計分析新趨勢
▲top
  • 1月 03 週一 202208:48
  • XGBoost演算法-eXtreme Gradient Boosting(極限梯度提升)-1/3

1.jpg
機器學習中,有一個分支為集成式學習(ensemble learning),顧名思義,集成式學習不是指單一的演算法框架,是一種團體的合作演算法框架,既然一個演算法無法得到好的預測結果,那如果是把不同方法用來訓練,理論上,應該會得到更好的預測結果,集成式學習就是這樣的概念。集成式的做法包含了Bagging、Boosting、Stacking,預測的準不準基本上有兩個面向,”Bias”跟”Variance”,詳細的介紹可參考筆者之前寫過的文章(機器學習-Bias-Variance Tradeoff),所有的機器學習模式不外乎想降低”Bias”跟”Variance”來得到更好的預測結果,但Bias跟Variance從下圖來看就是一種取捨的過程,所以各種機器學習的優化糾是想在這兩個概念中取得最佳的平衡。
(繼續閱讀...)
文章標籤

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣(817)

  • 個人分類:統計分析新趨勢
▲top
  • 7月 26 週一 202109:05
  • 線性判別分析(linear discriminant analysis, LDA)介紹

1.jpg
<源起>
LDA最早是1936年由RA. Fisher(現代統計學之父)發展,可用於解決二元分類的問題,之後也拓展成解決多分類的問題。在機器學習的領域,LDA可做為資料降維的工具,至於為什麼要降維,可參考筆者之前寫過的文章(https://reurl.cc/7y1zON),裡面有完整的介紹,降維的目的主要是為了避免機器學習的模型的分類或迴歸能力會開始隨維度的增加而下降(如圖一所示)。
(繼續閱讀...)
文章標籤

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣(5,812)

  • 個人分類:統計分析新趨勢
▲top
123»

2023社群金點賞

晨晰主打星

個人資訊

晨晰部落格新站
暱稱:
晨晰部落格新站
分類:
圖文創作
好友:
累積中
地區:

熱門文章

  • (141,481)因果關係的第三者-中介變項(Mediator / Mediation)-上~晨晰統計林星帆顧問整理
  • (111,625)變異數不同質的處理
  • (110,263)透過G-power軟體計算迴歸分析所需之樣本數
  • (74,055)SAS輕鬆入門(一)--晨晰統計張顧問整理
  • (67,146)重要-表現程度分析法~Importance- Performance Analysis,IPA(上)
  • (48,319)SAS簡易教學~共變異數分析(Analysis of Covariance, ANCOVA)
  • (47,866)廣義估計方程式(Generalized estimating equation, GEE)簡介~广义估计方程式(GEE)简介---晨晰統計林星帆顧問整理
  • (26,663)醫學篩檢(Medical screening)II-陽性概似比與陰性概似比(Positive and Negative likelihood ratio)~晨晰統計林星帆顧問整理
  • (24,201)使用SPSS之GEE分析處理兩組前後測的介入性研究(上)
  • (10,178)結構方程模式的優勢與劣勢(Advantage and Disadvantage of Structural Equation modeling, SEM)-上(簡介篇)

文章分類

  • power BI (59)
  • 生物醫學統計 (157)
  • 迴歸與SEM (59)
  • 研究方法 (71)
  • SAS教學 (54)
  • Excel與統計軟體 (86)
  • 統計應用專題 (80)
  • 其他類統計知識 (120)
  • 問卷知識 (26)
  • 論文寫作 (17)
  • 統計分析新趨勢 (23)
  • 晨晰的宣傳與服務專案 (62)
  • 數據話視頻 (15)
  • 會員心得分享 (10)
  • 新聞類 (65)
  • 我們的故事 (78)
  • 未分類文章 (1)

最新文章

  • 醫學研究使用PowerBI的情境3—醫療決策系統
  • 醫學研究使用PowerBI的情境(2)—介入措施
  • 紙本問卷鍵檔自己做(二)
  • 紙本問卷鍵檔自己做(一)
  • 醫學研究使用PowerBI的情境(1)—製作圖表
  • 結構方程中介分析-透過AMOS採拔靴法(Bootstrap法)(下)
  • 結構方程中介分析-透過AMOS採拔靴法(Bootstrap法)(上)
  • 一同研究,共同成就!
  • 時間相依Cox model:以生物製劑對帶狀皰疹風險之影響為例
  • 如何在SPSS裡安裝中介調節Marco: PROCESS(2025更新)

最新留言

  • [26/01/23] rechal15 於文章「結構方程中介分析-透過AMOS採拔靴法(...」發表了一則私密留言
  • [25/07/15] 訪客 於文章「專業還是神棍...」留言:
    台灣最新詐術~你是否發現最近怪事一羅匡~{生意倒店}諸事不...
  • [25/04/25] Lucky Nina 於文章「縱貫型資料用Excel填補空白欄位...」留言:
    這篇文章提供了縱貫型資料處理的完整步驟,詳細解釋了如何利用E...
  • [25/03/05] 西班牙蒼蠅水 於文章「使用SPSS合併資料(merge dat...」留言:
    巴黎偉姐 https://www.tw9g.com/good...
  • [25/02/24] ckhou1 於文章「無母數分析-兩組獨立樣本檢定(Mann-...」留言:
    請問有spss資料檔案嗎? ...
  • [24/12/30] 一 於文章「SPSS進行單因子變異數分析(One w...」留言:
    請問N.S.是什麼的縮寫?謝謝!...
  • [24/12/27] 男性增大液 於文章「誰說Power BI沒有硬核的分析功能?...」留言:
    NAISC延時噴劑 https://www.tw9g.com...
  • [24/12/27] 外用持久液 於文章「SPSS操作成對樣本t檢定(Paired...」留言:
    外用陰莖增大 https://www.tw9g.com/go...
  • [24/10/22] FN 於文章「使用R繪製Survival ROC cu...」留言:
    您好,感謝撰文介紹此套件,感覺非常實用。有個問題想請教,若想...
  • [24/09/15] 頂級偉哥  於文章「KNN(K-Nearest Neighb...」留言:
    美國大陰莖 https://www.tw9g.com/goo...

文章精選

文章搜尋

誰來我家

參觀人氣

  • 本日人氣:
  • 累積人氣:

留言板