公告版位
晨晰統計顧問有限公司在新北市板橋\服務市話:02-29602817\手機:0918-276-622\信箱:raising.statistic@gmail.com\網址:http://www.rai-stat.com.tw

目前分類:生物醫學統計 (157)

瀏覽方式: 標題列表 簡短摘要

在各類的醫學量化研究中,資料集中含有遺漏值(missing value)幾乎是無可避免的狀況。關於遺漏值的機制(mechanism),可分成三類:(一)Missing completely at random (MCAR)、(二)Missing at random (MAR) 以及(三)Missing not at randomMNAR)。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

八、使用「rms」得到 Resampling calibration Validation 指標

在「rms package」中,只提供 k-fold bootstrap 兩種驗證模式的方式,首先我們先來看 bootstrap validation 的指令非常的簡單,首先先固定種子數,否則每一次重複抽樣的樣本組合都會不一樣,於是就會得到不一樣的結果。

                  欲驗證的是 fit2 這個物件,亦即包含「Proteinuria」的完整模型;B=2000 代表一共要 2000 bootstrap samples。除非是樣本數很大(例如數萬甚至數十萬),否則建議 bootstrap samples 設至少一千次。

文章標籤

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

七、Validation 原理說明

在現今以預測模型做為主要目標的論文,幾乎都要再報告 Resampling calibration Validation 的結果,才有機會可以通過統計審查這一關,特別是發在優質的雜誌時。

雖然在上述第五點,雖然有提到以「PredictABEL」得到一些其他 Calibration 指標,但須注意,這些指標都是利用該模式的「預測機率」算出來的。然而其實這個模式的「類推性」(generalizability)是受限制的,因為一個模式通常都是在我們同一群樣本之下,用精挑細選的方式揀擇最後留在模式中的變項,因此通常會傾向得到一個高估模式表現的結果(例如比較高的解釋力、比較低的預測誤差)。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

五、使用「PredictABEL」得到其他 Calibration Discrimination 指標

             在「PredictABEL」套件中,有許多關於 Calibration Discrimination 的指標。下方為常用的 Hosmer-Lemeshow goodness-of-fit,其中「predRisk= predRisk2」使用完整模型(預測變項包括Proteinuria + SOFA + Age + Male + DM + SBP)的預測機率。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

三、使用「pROC」比較兩個預測變項的曲線下面積

接著安裝並呼叫「pROC」(compare ROC)套件,由於更換了套件,因此此時要再 attach 一次資料集「proteinuria」。

再來創造「roc1」物件,括號前面的「proteinuria$AKI」表示資料集「proteinuria」中的「AKI」這個變項是結果變項;括號後面的「proteinuria$SOFA」則是資料集「proteinuria」中的「SOFA」這個變項是預測變項。

文章標籤

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

筆者曾在之前的一系列文章,介紹風險預測模型(risk prediction model)使用 area under the curveAUC)的限制(https://reurl.cc/GkX1Vy),以及應該如何評估預測模型的表現(https://reurl.cc/RdON4xhttps://reurl.cc/GkX1rZhttps://reurl.cc/W4qnLL),進而介紹預測模型的新指標-IDI NRIhttps://reurl.cc/M7Xedkhttps://reurl.cc/qDZE8N),本系列文章則以 R 軟體進行操作示範。

一、安裝軟體及套件,並匯入資料

首先讀者可先自行安裝最新版 R 軟體(https://cran.r-project.org/bin/windows/base/),並且安裝操作介面較為友善的免費版 R studiohttps://rstudio.com/products/rstudio/download/)。接著在 R studio 右下角的『Install』點擊一下,並陸續安裝以下套件(package):『rms』、『Hmisc』、『PredictABEL』以及『pROC』。

文章標籤

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

四、遺漏值處理方法

約有 19% NEJM 論文會提到遺漏值的處理方式,其中幾乎都是以單一插補(single imputation)以及多重插補(multiple imputation)為主流。這邊的單一插補指的應該是 Expectation-Maximization 方法,但是此方法是在完全隨機遺漏(missing completely at random, MCAR)的假設之下才有效。

文章標籤

晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()

 

筆者分別在 2017 年評論過由權威醫學雜誌 The New England Journal of Medicine(NEJM)的一篇關於統計方法使用趨勢的評論,網址連結:https://goo.gl/IJ7eSQ。另外也曾於同年評論過美國醫學雜誌 JAMA 關於統計方法使用趨勢的一篇文章,網址連結:https://tinyurl.com/y67mxofr

文章標籤

晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()

 

在真實情境世界所蒐集的資料(real world data; RWD)所進行的真實世界研究(real world study; RDS),醫院的電子病歷資料庫(electronic health/medical records; EHRs or EMRs)佔了相當的比重。本篇文章旨在介紹目前台灣各家醫院在開放 EMRs 的現況。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

筆者在 2013 年曾經寫過一篇文章『醫學統計經常混淆的名詞』(https://dasanlin888.pixnet.net/blog/post/34469753),將醫學領域與其他領域的慣用使用統計名詞作了一些釐清。

本篇文章旨在討論在醫學領域很常被誤用的統計名詞,有些名詞甚至錯誤(或說不精確)名詞的使用頻率還高過正確名詞。主要討論多變項(multivariable)與多變量分析(multivariate)的差別以及雙變項/雙變量(bivariable or bivariate)還是單變量分析(univariable or univariate)的差別。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

筆者前些日子去長庚醫院參加「資料庫研究的研究設計方法與測量」的研討會,這個演講主要分為兩大主題「健保資料庫研究設計與應用」、「資料庫藥物流病研究的測量」,筆者想跟讀者分享演講過程學到的知識以及筆者的一些心得。

  • 健保資料庫研究設計與應用

主要講述內容包含(1) 觀察性研究會遇到的偏差(bias)(2) 常見的研究設計與如何避免研究的偏差;(3) 演講者在實務研究上的分享

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

相較於在嚴格控制情境之下的臨床試驗,目前醫學研究多數仍為以真實情境世界所蒐集的資料(real world data; RWD)所進行的真實世界研究(real world study; RDS),特別是以例行性蒐集資料(routinely collected data,以下簡稱RCD)由於資料已經預先收集,通常樣本數較大,因此很常被用來比較療效(treatment effectiveness),以台灣而言最常見的為健康保險資料庫(NHIRD或衛生福利資料科學中心)、醫院的電子病歷資料庫(electronic health records; EHRs)以及各醫學會的登錄研究(registries)。

由於網路是在近二十幾年才開始越來越發達,因此在過去來說,對於此類 例行性蒐集資料並沒有很完整的方法學體系的知識,但很幸運的是,在過去的十幾年間,許許多多的流行病方法專家與生物統計學家展示了各種偏誤(bias)、提出這些偏誤的來源以及提供了許多處理方式。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

比較療效時常見的偏誤(Sharma 等人)

Sharma 等人於 2019 年在《Clinical Epidemiology》發表了一篇名為『Observational studies of treatment effectiveness: worthwhile or worthless?』的文章2,本篇文章所提到的偏誤以及處理方式並非針對醫學資料庫,而是對於所有的觀察型研究都適用,而且針對的是前瞻性世代研究(prospective cohort study)。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

醫學資料庫常見的偏誤(Franklin Schneeweiss

  • 因果關係錯置

這是指因(介入/處置)與果(結果變項)在時間軸上的錯置,偏誤來源來自於事實上是結果變項決定了之後要做何種介入(或醫療選擇)。這種偏誤的處理方式很簡單,只要確認結果變項是發生在介入之後即可,亦即追蹤時間是從介入開始算。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

醫學資料庫研究目前佔目前醫學研究相當大宗,由於資料在研究想法產生之前就已經存在,而不需要再收案或追蹤,一旦可以有權限使用資料時,可以快速地做資料處理及統計分析進而發表,甚至搶先在臨床試驗之前就先有真實世界數據(real world data)的結果。

 

晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()

              真實世界數據(real-world data; RWD)在目前幾年變的非常流行,下圖列出在PubMed搜尋RWDReal-world evidence(真實世界證據,以下簡稱為RWE)關鍵字的文獻數量,在最近幾年急速飆漲。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

  2019/1/19由林口長庚醫院的巨量資料及統計中心主辦「臨床資料庫的建立和應用研討會」,會議中邀請許多學者分享醫療院所整合的資料庫,分別有以下五種醫學研究資料:

  1. 長庚醫學與研究資料庫
  2. 彙整台大醫院及台大所屬的各級分院所形成的「臺大醫療整合資料庫」
  3. 彙整北醫、萬芳、雙和三家醫院的「北醫體系臨床資料庫」
  4. 中國醫附設醫院的臨床資料,並完成串連衛生福利部死因檔的「中國醫臨床資料庫」
  5. 早產兒基金會運用台灣極低出生體重早產兒聯合追蹤網(TPFN)的資訊建構的「台灣早產兒基金會資料庫」

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

筆者曾於 2017/11 發表的兩篇文章(https://reurl.cc/n112lhttps://reurl.cc/x992e),提到在醫學研究中如何執行敏感度分析(Sensitivity analysis),不過當時筆者引用的 BMC Medical Research Methodology 論文(https://reurl.cc/0ppeA),比較偏重在於資料分析的觀點,本篇文章則嘗試以臨床觀點(from clinical points of view)來描述敏感度分析的應用方式。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在醫學論文中,在內文、表格與圖形中,必然會有數字的呈現,那麼這些數字的小數點應該取到第幾位是最合適的呢?

若以呈現最精確的數據訊息為主要目的,那麼小數點理應是取越多位越精確。然而,當不必要的小數點取太多位時,會讓讀者注意力受到影響,不易立即理解到數字的大小;反之,小數點取的位數不夠,則可能會失去精確性,甚至被懷疑是否作者是故意隱匿資訊。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在前兩篇文章中,我們分別介紹了整體表現(overall performance)以及區別/鑑別(discrimination)的指標以及其使用上的限制。為了回答以下兩個臨床問題,即(1)新模式是否比舊模式更能預測結果變項/事件發生?或新模式的預測是否準確?(2)在新模式的預測之下,是否可以改變治療決策(medical decision)?分別要再採用校正/校準(calibration)以及風險重新分組(reclassification)此兩組指標。

(三)校正/校準(calibration

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

Close

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

reload

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼