生物醫學統計－晨晰統計部落格新站（統計、SPSS、BIG DATA討論園地）｜痞客邦

公告版位

晨晰統計顧問有限公司在新北市板橋\服務市話：02-29602817\手機：0918-276-622\信箱：raising.statistic@gmail.com\網址：http://www.rai-stat.com.tw

目前分類：生物醫學統計 (153)

瀏覽方式：標題列表簡短摘要

Jan 13 Mon 2020 09:02
以R軟體進行二元結果變項之風險預測模型的實作（第2篇）~晨晰統計林星帆顧問整理

三、使用「pROC」比較兩個預測變項的曲線下面積

接著安裝並呼叫「pROC」（compare ROC）套件，由於更換了套件，因此此時要再 attach 一次資料集「proteinuria」。

再來創造「roc1」物件，括號前面的「proteinuria$AKI」表示資料集「proteinuria」中的「AKI」這個變項是結果變項；括號後面的「proteinuria$SOFA」則是資料集「proteinuria」中的「SOFA」這個變項是預測變項。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Jan 06 Mon 2020 09:07
以R軟體進行二元結果變項之風險預測模型的實作（第1篇） ~晨晰統計林星帆顧問整理

筆者曾在之前的一系列文章，介紹風險預測模型（risk prediction model）使用 area under the curve（AUC）的限制（https://reurl.cc/GkX1Vy），以及應該如何評估預測模型的表現（https://reurl.cc/RdON4x、https://reurl.cc/GkX1rZ、https://reurl.cc/W4qnLL），進而介紹預測模型的新指標－IDI 與 NRI（https://reurl.cc/M7Xedk、https://reurl.cc/qDZE8N），本系列文章則以 R 軟體進行操作示範。

一、安裝軟體及套件，並匯入資料

首先讀者可先自行安裝最新版 R 軟體（https://cran.r-project.org/bin/windows/base/），並且安裝操作介面較為友善的免費版 R studio（https://rstudio.com/products/rstudio/download/）。接著在 R studio 右下角的『Install』點擊一下，並陸續安裝以下套件（package）：『rms』、『Hmisc』、『PredictABEL』以及『pROC』。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Nov 11 Mon 2019 08:57
再談 NEJM 統計方法(下)~~晨晰統計林星帆顧問整理

四、遺漏值處理方法

約有 19% 的 NEJM 論文會提到遺漏值的處理方式，其中幾乎都是以單一插補（single imputation）以及多重插補（multiple imputation）為主流。這邊的單一插補指的應該是 Expectation-Maximization 方法，但是此方法是在完全隨機遺漏（missing completely at random, MCAR）的假設之下才有效。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(1) 人氣()

個人分類：生物醫學統計

Nov 04 Mon 2019 09:24
再談 NEJM 統計方法(上)~~晨晰統計林星帆顧問整理

筆者分別在 2017 年評論過由權威醫學雜誌 The New England Journal of Medicine（NEJM）的一篇關於統計方法使用趨勢的評論，網址連結：https://goo.gl/IJ7eSQ。另外也曾於同年評論過美國醫學雜誌 JAMA 關於統計方法使用趨勢的一篇文章，網址連結：https://tinyurl.com/y67mxofr。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(1) 人氣()

個人分類：生物醫學統計

Sep 16 Mon 2019 08:58
國內醫院電子病歷資料庫現況 ~~晨晰統計林星帆顧問整理

在真實情境世界所蒐集的資料（real world data; RWD）所進行的真實世界研究（real world study; RDS），醫院的電子病歷資料庫（electronic health/medical records; EHRs or EMRs）佔了相當的比重。本篇文章旨在介紹目前台灣各家醫院在開放 EMRs 的現況。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Sep 02 Mon 2019 09:00
多變項還是多變量？雙變項還是單變量？~~晨晰統計林星帆顧問整理

筆者在 2013 年曾經寫過一篇文章『醫學統計經常混淆的名詞』（https://dasanlin888.pixnet.net/blog/post/34469753），將醫學領域與其他領域的慣用使用統計名詞作了一些釐清。

本篇文章旨在討論在醫學領域很常被誤用的統計名詞，有些名詞甚至錯誤（或說不精確）名詞的使用頻率還高過正確名詞。主要討論多變項（multivariable）與多變量分析（multivariate）的差別以及雙變項/雙變量（bivariable or bivariate）還是單變量分析（univariable or univariate）的差別。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Jun 24 Mon 2019 09:25
2019資料庫研究的研究設計方法與測量研討會心得

筆者前些日子去長庚醫院參加「資料庫研究的研究設計方法與測量」的研討會，這個演講主要分為兩大主題「健保資料庫研究設計與應用」、「資料庫藥物流病研究的測量」，筆者想跟讀者分享演講過程學到的知識以及筆者的一些心得。

健保資料庫研究設計與應用

主要講述內容包含(1) 觀察性研究會遇到的偏差(bias)；(2) 常見的研究設計與如何避免研究的偏差；(3) 演講者在實務研究上的分享

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Jun 17 Mon 2019 09:15
以觀察型研究進行療效比較關於研究設計與常見偏誤之文獻整理 ~晨晰統計林星帆顧問整理

相較於在嚴格控制情境之下的臨床試驗，目前醫學研究多數仍為以真實情境世界所蒐集的資料（real world data; RWD）所進行的真實世界研究（real world study; RDS），特別是以例行性蒐集資料（routinely collected data，以下簡稱RCD）由於資料已經預先收集，通常樣本數較大，因此很常被用來比較療效（treatment effectiveness），以台灣而言最常見的為健康保險資料庫（NHIRD或衛生福利資料科學中心）、醫院的電子病歷資料庫（electronic health records; EHRs）以及各醫學會的登錄研究（registries）。

由於網路是在近二十幾年才開始越來越發達，因此在過去來說，對於此類例行性蒐集資料並沒有很完整的方法學體系的知識，但很幸運的是，在過去的十幾年間，許許多多的流行病方法專家與生物統計學家展示了各種偏誤（bias）、提出這些偏誤的來源以及提供了許多處理方式。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Apr 22 Mon 2019 09:09
以醫學資料庫進行療效比較研究時必須避免的偏誤（第3篇，共3篇）－晨晰統計林星帆顧問整理

比較療效時常見的偏誤（Sharma 等人）

Sharma 等人於 2019 年在《Clinical Epidemiology》發表了一篇名為『Observational studies of treatment effectiveness: worthwhile or worthless?』的文章²，本篇文章所提到的偏誤以及處理方式並非針對醫學資料庫，而是對於所有的觀察型研究都適用，而且針對的是前瞻性世代研究（prospective cohort study）。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Apr 15 Mon 2019 09:12
以醫學資料庫進行療效比較研究時必須避免的偏誤（第2篇，共3篇）－晨晰統計林星帆顧問整理

醫學資料庫常見的偏誤（Franklin 與 Schneeweiss）

因果關係錯置

這是指因（介入/處置）與果（結果變項）在時間軸上的錯置，偏誤來源來自於事實上是結果變項決定了之後要做何種介入（或醫療選擇）。這種偏誤的處理方式很簡單，只要確認結果變項是發生在介入之後即可，亦即追蹤時間是從介入開始算。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Apr 08 Mon 2019 13:14
以醫學資料庫進行療效比較研究時必須避免的偏誤（第1篇，共3篇）~~晨晰統計林星帆顧問整理

醫學資料庫研究目前佔目前醫學研究相當大宗，由於資料在研究想法產生之前就已經存在，而不需要再收案或追蹤，一旦可以有權限使用資料時，可以快速地做資料處理及統計分析進而發表，甚至搶先在臨床試驗之前就先有真實世界數據（real world data）的結果。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(1) 人氣()

個人分類：生物醫學統計

Apr 01 Mon 2019 09:21
Real-World Data and Real-World Evidence~~晨晰統計林星帆顧問整理

真實世界數據（real-world data; RWD）在目前幾年變的非常流行，下圖列出在PubMed搜尋RWD或Real-world evidence（真實世界證據，以下簡稱為RWE）關鍵字的文獻數量，在最近幾年急速飆漲。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Mar 18 Mon 2019 09:01
2019臨床資料庫的建立和應用研討會參與心得

　　2019/1/19由林口長庚醫院的巨量資料及統計中心主辦「臨床資料庫的建立和應用研討會」，會議中邀請許多學者分享醫療院所整合的資料庫，分別有以下五種醫學研究資料：

長庚醫學與研究資料庫
彙整台大醫院及台大所屬的各級分院所形成的「臺大醫療整合資料庫」
彙整北醫、萬芳、雙和三家醫院的「北醫體系臨床資料庫」
中國醫附設醫院的臨床資料，並完成串連衛生福利部死因檔的「中國醫臨床資料庫」
早產兒基金會運用台灣極低出生體重早產兒聯合追蹤網(TPFN)的資訊建構的「台灣早產兒基金會資料庫」

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Mar 12 Tue 2019 09:38
再談敏感度分析在醫學研究的應用－以臨床觀點出發~~晨晰統計林星帆顧問整理

筆者曾於 2017/11 發表的兩篇文章（https://reurl.cc/n112l、https://reurl.cc/x992e），提到在醫學研究中如何執行敏感度分析（Sensitivity analysis），不過當時筆者引用的 BMC Medical Research Methodology 論文（https://reurl.cc/0ppeA），比較偏重在於資料分析的觀點，本篇文章則嘗試以臨床觀點（from clinical points of view）來描述敏感度分析的應用方式。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Mar 04 Mon 2019 09:51
醫學論文統計數據的小數點應取到第幾位？ ~~晨晰統計林星帆顧問整理

在醫學論文中，在內文、表格與圖形中，必然會有數字的呈現，那麼這些數字的小數點應該取到第幾位是最合適的呢？

若以呈現最精確的數據訊息為主要目的，那麼小數點理應是取越多位越精確。然而，當不必要的小數點取太多位時，會讓讀者注意力受到影響，不易立即理解到數字的大小；反之，小數點取的位數不夠，則可能會失去精確性，甚至被懷疑是否作者是故意隱匿資訊。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Jan 07 Mon 2019 09:09
如何評估預測模型的表現（第3篇，共3篇）~晨晰統計林星帆顧問整理

在前兩篇文章中，我們分別介紹了整體表現（overall performance）以及區別/鑑別（discrimination）的指標以及其使用上的限制。為了回答以下兩個臨床問題，即（1）新模式是否比舊模式更能預測結果變項/事件發生？或新模式的預測是否準確？（2）在新模式的預測之下，是否可以改變治療決策（medical decision）？分別要再採用校正/校準（calibration）以及風險重新分組（reclassification）此兩組指標。

（三）校正/校準（calibration）

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Dec 24 Mon 2018 09:07
如何評估預測模型的表現（第2篇，共3篇） ~晨晰統計林星帆顧問整理

在前一篇文章中，我們介紹了整體表現（overall performance）的各項指標以及使用上的限制，在這篇文章中，我們繼續介紹區別/鑑別（discrimination）、校正/校準（calibration）以及風險重新分組（reclassification）此三組指標。

（二）區別/鑑別（discrimination）

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Dec 17 Mon 2018 08:49
如何評估預測模型的表現（第1篇，共3篇） ~晨晰統計林星帆顧問整理

在各種類的醫學研究中，建立以及驗證一個有效的預測模型（prediction model）是很常見的，無論結果變項（outcome）是連續型、二元類別、計數變項或是存活資料，現在皆已有常規的迴歸分析方法，分別是線性迴歸、logistic迴歸、Poisson迴歸以及Cox比例危險模式（Cox proportional hazard model）。

舉例來說，目前已知數個心衰竭病人死亡率的預測模式，例如MAGGIC（https://www.mdcalc.com/maggic-risk-calculator-heart-failure）或Seattle Heart Failure Model（https://qxmd.com/calculate/calculator_203/seattle-heart-failure-model），假定我們在這些預測模型之下，提出一個（或多個）生物標記或是一組危險因子，我們想要證實加上這些生物標記/危險因子之後，我們的新模式會比原本模式更能預測死亡率。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(1) 人氣()

個人分類：生物醫學統計

Nov 19 Mon 2018 09:10
預測模型的新指標－IDI與NRI（第2篇，共2篇）~~晨晰統計林星帆顧問整理

在前兩篇文章中，我們介紹了曲線下面積（Area under the curve, AUC）與integrated discrimination improvement（IDI）的定義以及使用上的限制。為了回答此問題：「A這個生物標記或預測模型，所增加的預測能力若使用在臨床上，究竟是否可以改變治療決策？」，Pencina（2008）首次提出net reclassification improvement（NRI）這個指標以及展示它的統計檢定¹。

在使用NRI之前，必須有個很重要的前提，亦即關於該事件的預測機率已有明確的風險分組。例如根據Third Adult Treatment Panel（ATP III）將10年冠心病的風險（10-year risk of coronary heart disease）明確分為3組：0%–6%、6%–20%及>20%，針對不同風險分組會有不同的治療決策，例如0-6%只要保持定期追蹤，6%–20%則是改變生活方式與藥物治療，而>20%則可能要接受更積極的監測與治療。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Nov 12 Mon 2018 09:16
預測模型的新指標－IDI與NRI（第1篇，共2篇）~~晨晰統計林星帆顧問整理

在之前文章中，我們提到了在以下幾種情況，過去常以Receiver Operating Characteristic（ROC）的曲線下面積（Area under the curve, AUC）作為主要的統計方法以及其限制^1-2。

假設已知有個表現良好的生物標記B（或是一組危險因子，例如Framingham Risk Score），此時我們提議（proposed）的生物標記或預測模型（或一組危險因子）為A，可能會有以下幾種的比較。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

«1 2 34 5 6 7 8 »

熱門文章

文章分類

最新文章

最新留言

文章精選

所有文章列表

文章搜尋

新聞交換(RSS)

誰來我家

參觀人氣

本日人氣：
累積人氣：

QR Code

qrcode

POWERED BY

(登入)

{{ article.user_name }}
{{ article.timestamp * 1000 | date:'MMM.dd.y.hh.mm' }}
{{ article.title }}
{{ article.content }}

PIXNET Facebook Yahoo! Google MSN

您尚未登入，將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

請輸入左方認證碼：

看不懂,換張圖

請輸入驗證碼