公告版位
晨晰統計顧問有限公司在新北市板橋\服務市話:02-29602817\手機:0918-276-622\信箱:raising.statistic@gmail.com\網址:http://www.rai-stat.com.tw

目前分類:生物醫學統計 (151)

瀏覽方式: 標題列表 簡短摘要

四、遺漏值處理方法

約有 19% NEJM 論文會提到遺漏值的處理方式,其中幾乎都是以單一插補(single imputation)以及多重插補(multiple imputation)為主流。這邊的單一插補指的應該是 Expectation-Maximization 方法,但是此方法是在完全隨機遺漏(missing completely at random, MCAR)的假設之下才有效。

文章標籤

晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()

 

筆者分別在 2017 年評論過由權威醫學雜誌 The New England Journal of Medicine(NEJM)的一篇關於統計方法使用趨勢的評論,網址連結:https://goo.gl/IJ7eSQ。另外也曾於同年評論過美國醫學雜誌 JAMA 關於統計方法使用趨勢的一篇文章,網址連結:https://tinyurl.com/y67mxofr

文章標籤

晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()

 

在真實情境世界所蒐集的資料(real world data; RWD)所進行的真實世界研究(real world study; RDS),醫院的電子病歷資料庫(electronic health/medical records; EHRs or EMRs)佔了相當的比重。本篇文章旨在介紹目前台灣各家醫院在開放 EMRs 的現況。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

筆者在 2013 年曾經寫過一篇文章『醫學統計經常混淆的名詞』(https://dasanlin888.pixnet.net/blog/post/34469753),將醫學領域與其他領域的慣用使用統計名詞作了一些釐清。

本篇文章旨在討論在醫學領域很常被誤用的統計名詞,有些名詞甚至錯誤(或說不精確)名詞的使用頻率還高過正確名詞。主要討論多變項(multivariable)與多變量分析(multivariate)的差別以及雙變項/雙變量(bivariable or bivariate)還是單變量分析(univariable or univariate)的差別。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

筆者前些日子去長庚醫院參加「資料庫研究的研究設計方法與測量」的研討會,這個演講主要分為兩大主題「健保資料庫研究設計與應用」、「資料庫藥物流病研究的測量」,筆者想跟讀者分享演講過程學到的知識以及筆者的一些心得。

  • 健保資料庫研究設計與應用

主要講述內容包含(1) 觀察性研究會遇到的偏差(bias)(2) 常見的研究設計與如何避免研究的偏差;(3) 演講者在實務研究上的分享

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

相較於在嚴格控制情境之下的臨床試驗,目前醫學研究多數仍為以真實情境世界所蒐集的資料(real world data; RWD)所進行的真實世界研究(real world study; RDS),特別是以例行性蒐集資料(routinely collected data,以下簡稱RCD)由於資料已經預先收集,通常樣本數較大,因此很常被用來比較療效(treatment effectiveness),以台灣而言最常見的為健康保險資料庫(NHIRD或衛生福利資料科學中心)、醫院的電子病歷資料庫(electronic health records; EHRs)以及各醫學會的登錄研究(registries)。

由於網路是在近二十幾年才開始越來越發達,因此在過去來說,對於此類 例行性蒐集資料並沒有很完整的方法學體系的知識,但很幸運的是,在過去的十幾年間,許許多多的流行病方法專家與生物統計學家展示了各種偏誤(bias)、提出這些偏誤的來源以及提供了許多處理方式。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

比較療效時常見的偏誤(Sharma 等人)

Sharma 等人於 2019 年在《Clinical Epidemiology》發表了一篇名為『Observational studies of treatment effectiveness: worthwhile or worthless?』的文章2,本篇文章所提到的偏誤以及處理方式並非針對醫學資料庫,而是對於所有的觀察型研究都適用,而且針對的是前瞻性世代研究(prospective cohort study)。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

醫學資料庫常見的偏誤(Franklin Schneeweiss

  • 因果關係錯置

這是指因(介入/處置)與果(結果變項)在時間軸上的錯置,偏誤來源來自於事實上是結果變項決定了之後要做何種介入(或醫療選擇)。這種偏誤的處理方式很簡單,只要確認結果變項是發生在介入之後即可,亦即追蹤時間是從介入開始算。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

醫學資料庫研究目前佔目前醫學研究相當大宗,由於資料在研究想法產生之前就已經存在,而不需要再收案或追蹤,一旦可以有權限使用資料時,可以快速地做資料處理及統計分析進而發表,甚至搶先在臨床試驗之前就先有真實世界數據(real world data)的結果。

 

晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()

              真實世界數據(real-world data; RWD)在目前幾年變的非常流行,下圖列出在PubMed搜尋RWDReal-world evidence(真實世界證據,以下簡稱為RWE)關鍵字的文獻數量,在最近幾年急速飆漲。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

  2019/1/19由林口長庚醫院的巨量資料及統計中心主辦「臨床資料庫的建立和應用研討會」,會議中邀請許多學者分享醫療院所整合的資料庫,分別有以下五種醫學研究資料:

  1. 長庚醫學與研究資料庫
  2. 彙整台大醫院及台大所屬的各級分院所形成的「臺大醫療整合資料庫」
  3. 彙整北醫、萬芳、雙和三家醫院的「北醫體系臨床資料庫」
  4. 中國醫附設醫院的臨床資料,並完成串連衛生福利部死因檔的「中國醫臨床資料庫」
  5. 早產兒基金會運用台灣極低出生體重早產兒聯合追蹤網(TPFN)的資訊建構的「台灣早產兒基金會資料庫」

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

筆者曾於 2017/11 發表的兩篇文章(https://reurl.cc/n112lhttps://reurl.cc/x992e),提到在醫學研究中如何執行敏感度分析(Sensitivity analysis),不過當時筆者引用的 BMC Medical Research Methodology 論文(https://reurl.cc/0ppeA),比較偏重在於資料分析的觀點,本篇文章則嘗試以臨床觀點(from clinical points of view)來描述敏感度分析的應用方式。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在醫學論文中,在內文、表格與圖形中,必然會有數字的呈現,那麼這些數字的小數點應該取到第幾位是最合適的呢?

若以呈現最精確的數據訊息為主要目的,那麼小數點理應是取越多位越精確。然而,當不必要的小數點取太多位時,會讓讀者注意力受到影響,不易立即理解到數字的大小;反之,小數點取的位數不夠,則可能會失去精確性,甚至被懷疑是否作者是故意隱匿資訊。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在前兩篇文章中,我們分別介紹了整體表現(overall performance)以及區別/鑑別(discrimination)的指標以及其使用上的限制。為了回答以下兩個臨床問題,即(1)新模式是否比舊模式更能預測結果變項/事件發生?或新模式的預測是否準確?(2)在新模式的預測之下,是否可以改變治療決策(medical decision)?分別要再採用校正/校準(calibration)以及風險重新分組(reclassification)此兩組指標。

(三)校正/校準(calibration

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在前一篇文章中,我們介紹了整體表現(overall performance)的各項指標以及使用上的限制,在這篇文章中,我們繼續介紹區別/鑑別(discrimination)、校正/校準(calibration)以及風險重新分組(reclassification)此三組指標。

(二)區別/鑑別(discrimination

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在各種類的醫學研究中,建立以及驗證一個有效的預測模型(prediction model)是很常見的,無論結果變項(outcome)是連續型、二元類別、計數變項或是存活資料,現在皆已有常規的迴歸分析方法,分別是線性迴歸、logistic迴歸、Poisson迴歸以及Cox比例危險模式(Cox proportional hazard model)。

舉例來說,目前已知數個心衰竭病人死亡率的預測模式,例如MAGGIChttps://www.mdcalc.com/maggic-risk-calculator-heart-failure)或Seattle Heart Failure Modelhttps://qxmd.com/calculate/calculator_203/seattle-heart-failure-model),假定我們在這些預測模型之下,提出一個(或多個)生物標記或是一組危險因子,我們想要證實加上這些生物標記/危險因子之後,我們的新模式會比原本模式更能預測死亡率。

晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()

在前兩篇文章中,我們介紹了曲線下面積(Area under the curve, AUC)與integrated discrimination improvementIDI)的定義以及使用上的限制。為了回答此問題:「A這個生物標記或預測模型,所增加的預測能力若使用在臨床上,究竟是否可以改變治療決策?」,Pencina2008)首次提出net reclassification improvementNRI)這個指標以及展示它的統計檢定1

在使用NRI之前,必須有個很重要的前提,亦即關於該事件的預測機率已有明確的風險分組。例如根據Third Adult Treatment PanelATP III)將10年冠心病的風險(10-year risk of coronary heart disease)明確分為3組:0%–6%6%–20%>20%,針對不同風險分組會有不同的治療決策,例如0-6%只要保持定期追蹤,6%–20%則是改變生活方式與藥物治療,而>20%則可能要接受更積極的監測與治療。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在之前文章中,我們提到了在以下幾種情況,過去常以Receiver Operating CharacteristicROC)的曲線下面積(Area under the curve, AUC)作為主要的統計方法以及其限制1-2

假設已知有個表現良好的生物標記B(或是一組危險因子,例如Framingham Risk Score),此時我們提議(proposed)的生物標記或預測模型(或一組危險因子)為A,可能會有以下幾種的比較。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

        8月舉辦於嘉義長庚醫院的實證醫學年會,主題探討大數據、人工智慧對醫學研究與實證醫學的影響。會中由李友專院長淺談人工智慧的發展沿革,以及目前在醫學領域應用較為廣泛的人工智慧型態,例如:圖像判讀或分組、決策樹(decision tree)、人工神經網路(artificial neural network, ANN)、深度學習(deep learning)、機器學習(machine learning, ML)等。李院長的演講作為導言,以輕鬆詼諧的方式,簡單讓與會者像聽歷史故事一般接觸人工智慧的發展史,並從中帶出人工智慧在過去遭遇的挫折與困境 (例如硬體設備的計算效率不佳)。隨著科技時代的進步,電腦硬體與時俱進,形成現今人工智慧發展的優勢環境,足以支援更複雜演算法與更大量的資料點。

        李院長精彩的演說引人入勝,讓筆者會後更為好奇,人工智慧目前在醫學研究方面是如何被應用與執行的?以及人工智慧的基本概念有些什麼?故筆者搜尋了一些介紹人工智慧的網站,以及一些運用或探討人工智慧的醫學論文。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在臨床醫學研究中,常常會提出一個生物標記(Biomarker)可以預測特定事件的假設,例如以neutrophil gelatinase-associated lipocalinNGAL)預測急性腎損傷(acute kidney injury, AKI),或是以B-type natriuretic peptideBNP)預測心衰竭病人的再住院率。

通常此時會有比較的基準,假設已知有個表現良好的生物標記B(或是一組危險因子,例如Framingham Risk Score),此時我們提議(proposed)的生物標記或預測模型(或一組危險因子)為A,可能會有以下幾種的比較。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

Close

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

reload

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼