梯度提升(Gradient Boosting)是一種boosting的演算法,最早的論文是「Greedy Function Approximation: A Gradient Boosting Machine」,目前已被引用約15,000次,此種演算法可以應用到很多模型上,但是最常見的是用到決策樹(Decision tree)上,也就是GBDT(Gradient Boosting Decision Tree)。
機器學習領域在做演算法的訓練目標通常是為了優化或最小化損失函數(loss Function),Gradient boosting的核心精神是迭代出多個(M個)弱的演算法,然後將M個弱模型的預測結果相加,後面的模型Fm+1(x)基於前面學習模型的Fm(x)的效果生成的,關係如下:
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
機器學習中,有一個分支為集成式學習(ensemble learning),顧名思義,集成式學習不是指單一的演算法框架,是一種團體的合作演算法框架,既然一個演算法無法得到好的預測結果,那如果是把不同方法用來訓練,理論上,應該會得到更好的預測結果,集成式學習就是這樣的概念。集成式的做法包含了Bagging、Boosting、Stacking,預測的準不準基本上有兩個面向,”Bias”跟”Variance”,詳細的介紹可參考筆者之前寫過的文章(機器學習-Bias-Variance Tradeoff),所有的機器學習模式不外乎想降低”Bias”跟”Variance”來得到更好的預測結果,但Bias跟Variance從下圖來看就是一種取捨的過程,所以各種機器學習的優化糾是想在這兩個概念中取得最佳的平衡。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
在醫學統計中,ROC分析經常用於(1)比較預測模型的好壞(比較AUC(Area under the Curve of ROC)的面積大小)、(2)找單一模型的最佳切點,可用於臨床上的使用(例如:找到Biomarker的切點,用於診斷疾病)。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
2022年統計課程已經出爐囉,大家可以開始線上報名 。一樣是小班制,不增班,要報名要快唷,不然又要再等一年囉!!
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
5.釘選實時頁面Pinning a Live Page
一般我們在儀表版中釘選一個視覺圖表,其實是一種快照(snapshot) ,無法用籂選器(slicer)互動。如果去點選它,會跳到報表頁面。但如果你是「釘選實時頁面」,它相當於釘選整頁報表,那麼在這張報表中便可以互動。同時如原報表有變動儲存後,儀表板也會反應。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
是的,很多人不知道,Power BI也有線上版,以為只有下載軟體Power BI Desktop,在單機上製作。事實上,線上版出現的時間早於桌機板,只是很快地,微軟便出了桌機版,使得大家的目光轉到桌機上。而且實際上,因Power BI報表製作需要一些時間,幾個小時到1~2天,所以如果一直與PBI伺服器連線,容易受到連線速度影響,而拖慢速度。所以,目前主流作法,都是在桌機上完成後,再上傳到線上伺服器。那這樣一來,Power BI線上版還有存在價值嗎?當然有,以下舉出八個必須在線上版完成的工作。
1.儀表板和服務概述
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
接著我們指定類別型的共變數,meta4diag 的指令是「modality」,我們丟入「S_M」這個變項,S 代表 surgical 族群,M 代表 Medical 族群。目前為止,此套件只支援在模式中指定一個類別型的共變數。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
筆者於 2020/5 時介紹了診斷型統合分析的介紹,包括基本概念與傳統方法(https://reurl.cc/4a3Lxv);兩種主流方法(https://reurl.cc/Q96YQ2),包括雙變量模型(Bivariate model)以及階層模型(Hierarchical model);以及於 2021/3 時介紹了常用 R 套件的比較(https://reurl.cc/NrZYv6)。
在不久之前筆者也是介紹了用 SAS macro(MetaDAS)執行標準的雙變量模型以及階層模型(https://reurl.cc/Rb43KZ )。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
11.接著將第二個變項「年齡」按照同樣步驟操作一次
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
筆者過去介紹了幾種介紹虛擬變項建立的文章,直到最近想找一篇教學文章給客戶時,才發現少了一種也是相當簡單的操作方式,正是SPSS 22.0版後才內建的「建立虛擬變數」,因此若您目前所使用的版本較舊或是找不到此功能,那還是得參考過去的文章才行。本篇文章所使用的資料是拿過去的示範資料,三個變項包含性別年齡教育程度,變項的分布情形如下。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()