生物醫學統計－晨晰統計部落格新站（統計、SPSS、BIG DATA討論園地）｜痞客邦

公告版位

晨晰統計顧問有限公司在新北市板橋\服務市話：02-29602817\手機：0918-276-622\信箱：raising.statistic@gmail.com\網址：http://www.rai-stat.com.tw

目前分類：生物醫學統計 (153)

瀏覽方式：標題列表簡短摘要

Oct 29 Mon 2018 09:34
2018實證醫學學會參與心得

8月舉辦於嘉義長庚醫院的實證醫學年會，主題探討大數據、人工智慧對醫學研究與實證醫學的影響。會中由李友專院長淺談人工智慧的發展沿革，以及目前在醫學領域應用較為廣泛的人工智慧型態，例如：圖像判讀或分組、決策樹(decision tree)、人工神經網路(artificial neural network, ANN)、深度學習(deep learning)、機器學習(machine learning, ML)等。李院長的演講作為導言，以輕鬆詼諧的方式，簡單讓與會者像聽歷史故事一般接觸人工智慧的發展史，並從中帶出人工智慧在過去遭遇的挫折與困境 (例如硬體設備的計算效率不佳)。隨著科技時代的進步，電腦硬體與時俱進，形成現今人工智慧發展的優勢環境，足以支援更複雜演算法與更大量的資料點。

李院長精彩的演說引人入勝，讓筆者會後更為好奇，人工智慧目前在醫學研究方面是如何被應用與執行的？以及人工智慧的基本概念有些什麼？故筆者搜尋了一些介紹人工智慧的網站，以及一些運用或探討人工智慧的醫學論文。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Oct 22 Mon 2018 09:12
預測模型使用AUC的限制~~晨晰統計林星帆顧問整理

在臨床醫學研究中，常常會提出一個生物標記（Biomarker）可以預測特定事件的假設，例如以neutrophil gelatinase-associated lipocalin（NGAL）預測急性腎損傷（acute kidney injury, AKI），或是以B-type natriuretic peptide（BNP）預測心衰竭病人的再住院率。

通常此時會有比較的基準，假設已知有個表現良好的生物標記B（或是一組危險因子，例如Framingham Risk Score），此時我們提議（proposed）的生物標記或預測模型（或一組危險因子）為A，可能會有以下幾種的比較。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Oct 01 Mon 2018 09:07
傾向分數配對後的相依統計方法~晨晰統計林星帆顧問整理

在觀察型研究當中，傾向分數分析（propensity score analysis）的使用，特別是傾向分數配對（propensity score matching）已經是非常普遍，這個部分可參見筆者在之前寫的文章（https://reurl.cc/qd8xg 以及 https://reurl.cc/V6Xr5）。關於傾向分數配對的技術與介紹，網路上已經有非常多資源（可參見筆者同事撰寫的一系列文章（https://reurl.cc/E7z3R、https://reurl.cc/WdL5D以及https://reurl.cc/O1qlv），但目前比較少人討論在傾向分數配對後的統計方法。

理論上，在同一個配對組合（matched pair）之下的實驗組與對照組（或暴露組與非暴露組），由於他們有很接近的傾向分數（成為實驗組/暴露組的機率），因此他們在用來計算傾向分數的基本屬性上（例如年齡、性別、共病等）也會比較相近，因此此時的實驗組與對照組不再是「獨立樣本」，而是具有相依性的配對樣本（paired sample）¹。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(1) 人氣()

個人分類：生物醫學統計

Jul 30 Mon 2018 09:01
健保資料庫資料年代太舊了，很難被高分雜誌社接受，真的嗎？~晨晰統計林星帆顧問整理

目前欲作健保資料庫有三種管道，第一種是以國衛院時代的攜出健保資料庫，其資料只到2013年就停止更新了；第二種是衛生福利資料科學中心，俗稱加值中心，資料更新約延遲1.5～2年左右；第三種是全民健康保險保險人資訊整合應用服務中心，資料更新約延遲1年。最近常聽到一種聲音，就是知名雜誌越來越不願意接受國衛院的攜出健保資料庫，但筆者的實際經驗似乎相左。

因此筆者使用國立成功大學健康資料加值應用研究中心的健保資料庫搜尋網站（https://visualizinghealthdata.idv.tw/?route=article/thesis），搜尋方式為「限定impact factor > 5」（以2016 JCR的分數），結果有743篇（更新時間 : 2018-06-27），其中43篇為於2018年發表，筆者由摘要中找尋「追蹤截止日期」的相關資訊。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Jun 25 Mon 2018 09:03
簡介配對的應用與SAS內建的配對程序PSMATCH -3

　　延續上一章節，本篇將持續透過官方範例檔與示範程式(如下圖所示)，簡介程序實際操作之後產出的報表，以及報表中各項目的涵義。　　

　　執行完上段程序後，首先產出的報表會描述進行傾向分數配對的變數細節(如下圖所示)。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(1) 人氣()

個人分類：生物醫學統計

Jun 11 Mon 2018 09:15
存活偏誤(Survival bias)對觀察型研究設計與存活分析的影響-2

　　呈上個章節簡單介紹觀察型研究中的存活偏誤(Survival bias)，本章節導讀文獻中提出的常見的5種研究設計方法，前2種會受到存活偏誤(Survival bias)影響，導致研究結果產生傾向於某一方有優勢，後3種為控制存活偏誤(Survival bias)的研究設計方法，以下將逐一介紹。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Jun 04 Mon 2018 08:59
存活偏誤(Survival bias)對觀察型研究設計與存活分析的影響-1

　　觀察型研究中，由於介入/治療行為並非由研究者施予及分組，非受試者與受試者在受到其他許多背景、環境等因素操弄之下，而形成他們在研究中被觀察到的組別或治療型態。而醫學研究中，常見的觀察性研究資料類型多數為病歷回顧或是資料庫形式。當研究者從現有的資料集中萃取研究個案將其分組，並觀察追蹤期間的結果時，會因為【分組】這個動作而產生存活偏誤(Survival bias)，或是不死的時間偏誤(Immortal time bias)。舉例來說，研究者從現有資料庫中篩選出一群急性心肌梗塞(AMI)的病人，看病人出院後90天內的Statin藥物使用狀況，將病人分成Statin組跟Non-statin組，並觀察病人從AMI出院之後發生AMI再住院或死亡的風險。這看似順風順水的研究設計，潛藏著一個干擾觀察結果的偏誤(bias)，出院後90天內因為有使用Statin而被分到Statin組的人，從病人出院到使用Statin的這段時間是保證存活(意即活著的人才有機會被開Statin)，因為死亡而來不及使用Statin的人就會被分到Non-statin組。在比較Statin與Non-statin組在AMI出院之後的AMI再住院與死亡時，就可能會發現Non-statin組死亡率比較高且AMI再住院率比較低，這是因為死亡而來不及用藥的人都在Non-statin組，而死亡的人也比較不容易被觀察到AMI的再住院，這個現象就稱為不死的時間偏誤(Immortal time bias)。

　　流行病學研究設計中，有幾種處理不死的時間偏誤(Immortal time bias)的方式，以下援引American Journal of Epidemiology於2005年介紹的5種研究設計方式，其中方法1跟方法2都是會強烈受到偏誤(bias)影響研究結果，而方法3~5則是控制偏誤(bias)的方式，下一章節將逐一導讀介紹文獻中的5種研究設計方法，以及這5種研究設計之下對結果產生的影響。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Apr 30 Mon 2018 09:23
傾向分數分析介紹（第2篇，共2篇）－晨晰統計林星帆顧問整理

完成對處置變項的羅吉斯迴歸之後，根據每個個案的基本特性（年齡、性別與共病狀況）會得到預測機率，即此人成為治療組的機率。在接著往下進行傾向分數的分析之前，要先評估治療組與控制組在傾向分數的分布情形。可以使用兩種方法來判斷，第一種是畫圖，第二種是看C-statistics（即C-index或AUROC）。C-statistics代表的是預測變項對處置變項（1=treated, 0=untreated）整體的區別力，0.5為完全無法區別，1代表完美區別。

下圖列出傾向分數可以非常有效區分治療組與控制組的結果，兩組在傾向分數的分布截然不同，而且重疊區域很少（中間灰色底的common support），這種狀況是很難進行後續的傾向分數分析的，不管進行任何一種傾向分數分析，都無法有效降低混淆因子的效果。當出現這種情形時，檢查是否有對處置變項的強烈預測變項，例如「有洗腎的病人一定不會開Metformin」或是存在工具變數。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Apr 23 Mon 2018 09:32
傾向分數分析介紹（第1篇，共2篇）－晨晰統計林星帆顧問整理

在現今的醫學研究中，傾向分數分析（propensity score analysis, PSA）儼然扮演非常重要的角色。下圖為筆者在Pubmed以關鍵字「propensity score」搜尋得到的文獻筆數，由結果可知，以傾向分數作為研究方法的文獻呈現非線性的增加，到了2017年，單年度超過3千篇文獻使用傾向分數，可見傾向分數已為醫學研究當中的顯學。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Jan 29 Mon 2018 09:16
健保資料庫驗證碼研究之整理~~晨晰統計林星帆顧問整理

根據成功大學呂宗學教授及其團隊針對健保資料庫所作的詳盡搜尋，目前為止（2017/11/17）已有4356 篇文章以英文的形式發表在國際期刊，其中Impact factor大於10分者高達104篇，可謂是台灣醫學領域之光。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Jan 08 Mon 2018 09:15
醫學研究中處理不死偏誤的方法比較-2 (文獻分享)

延續上篇簡單描述什麼是不死偏誤，以及為什麼不死偏誤會讓用藥治療組傾向有比較好的結果。上篇文末提到的處理不死偏誤的幾種方式中，目前比較多模擬研究在比較的是時間相依(time-dependent)、用藥時間分佈配對(prescription time-distribution matching, PTDM)及sequential Cox approach這三種較為新穎的研究方法。但是多數研究為某兩種方法的比較，或是純理論推導的比較，模擬研究也比較多是在單一模擬資料集之下所做的研究結果。比較少有文獻同時比較這三種較為新穎的研究法，且在同一篇文獻中虛擬出不同特性的資料結構，比較三種研究法在不同資料結構之下的偏誤狀況及風險比例(Hazard ratio, HR)估算的結果差異。　

　　本篇要分享2016年發表於美國流行病學期刊(American Journal of Epidemiology, AJE)的一份研究報告。作者首先透過公式推導的方式寫出偏誤(bias)的公式，藉此合理推論什麼情境之下偏誤會增加或減少。之後再以模擬資料集(simulated data)實際比較三種研究法的偏誤及Cox分析結果。本篇分享文略過複雜的公式部分，直接分享作者研究報告比較的結果，對研究中細部訊息有興趣的讀者，可以從下方參考文獻處的資訊搜尋全文閱覽。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Jan 02 Tue 2018 09:16
醫學研究中處理不死偏誤的方法比較-1 (文獻分享)

　觀察型或是資料庫追蹤研究的醫學藥物研究設計中，將用藥組跟非用藥組分別比較時，會面臨不死偏誤(immortal time bias)造成的錯誤分組(misclassification)，而且這個錯誤分組傾向用藥組會有較好的存活效應。什麼是不死偏誤？而不死偏誤造成的錯誤分組指的又是什麼意思？

　　不死偏誤指的是用藥組在疾病診斷日期之後到第一次用藥日期之間存活的時間偏誤，因為有機會在診斷日期之後被觀察到接受藥物治療的人，前提必須先活著，因此【沒有機會接受治療】的人會被歸類到非用藥組，產生錯誤分組的問題。沒有機會接受治療的人是指在診斷日期之後觀察追蹤的這段時間中死亡、設限或是發生事件的人。這個思考邏輯的背後有個前提假設，診斷日期之後的任何觀察追蹤時間點，病人都是有可能接受藥物治療的人，也是就風險人口(population at risk)的概念。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(1) 人氣()

個人分類：生物醫學統計

Dec 04 Mon 2017 09:02
醫學存活分析採用競爭因子存活分析的理由

　Austin與Fine於2016年發表於Circulation期刊的文章，以實際資料數據闡述當存活分析存在競爭因子時，研究者使用一般傳統的Kaplan-Meier存活函數，與考慮競爭因子之下的存活函數分析，比較兩者之間得到的分析結果差異，以此說明當存在競爭因子時，為何研究者必須採用競爭因子存活分析的原因。本文章將以過去分析過的資料集做為示範樣本，操作當資料集存在競爭因子時，傳統Kaplan-Meier存活分析函數與考慮競爭因子的次分佈瞬間危險函數（Subdistribution Hazard Function，SDH），兩者之間存活分析結果的差異，並簡述造成存活分析結果有落差的原因。

　　範例樣本中，實驗組有1,182人，對照組有2,027人，兩組人在設限、興趣事件及競爭事件的比例分佈如下圖所示，可以發現兩組的分佈差異甚大。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Nov 21 Tue 2017 09:00
敏感度分析在醫學臨床研究的應用（下）~ 晨晰統計林星帆顧問整理

四、結果變項的定義（Definitions of outcomes）

在醫學研究上，許多結果變項都是被人工二元分類，例如慢性腎病（CKD）定義可能是eGFR < 60 mL/min/1.73m²，那麼如果切點改為55或50，本研究主要發現是否會因而改變。當然可以用比較有臨床意義的作法，例如將Outcome定義改為CKD stage 4-5（eGFR < 30），然後觀察原本結論是否仍然適用。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Nov 13 Mon 2017 08:56
敏感度分析在醫學臨床研究的應用（上）－晨晰統計林星帆顧問整理

世界知名醫學期刊美國醫學協會雜誌（Journal of the American Medical Association, JAMA，2016年Impact Factor：44.4）於2010年所刊登文章中，每2篇中已有1篇會報告敏感度分析（Sensitivity analysis）的結果，這篇報告刊登在2013年的PLOS ONE（https://goo.gl/oLRNkT），也可見讀者於2017/8時的介紹（https://goo.gl/38dwwi）。

那麼，什麼是敏感度分析呢，筆者的定義是「本研究的發現是否會在某些操作條件之下而改變」。2013年有一篇發表在BMC Medical Research Methodology（https://goo.gl/ZhuNAQ），專門介紹臨床試驗的敏感度分析細節，裡頭提到敏感度分析定義包括「a method to determine the robustness of an assessment by examining the extent to which results are affected by changes in methods, models, values of unmeasured variables, or assumptions」以及「a series of analyses of a data set to assess whether altering any of the assumptions made leads to different final interpretations or conclusions」。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Sep 04 Mon 2017 09:04
EQUATOR Network介紹－晨晰統計林星帆顧問整理

EQUATOR Network是促進健康研究品質及公開透明（Enhancing the QUAlity and Transparency Of healthResearch）的縮寫，這是一個收錄各種類型的研究，應揭露的研究報告格式及內容的資訊整合平台。EQUATOR計畫由2006/3時開始（由UK NHS National Knowledge Service所贊助的一年期計畫），EQUATOR Network於2008/6正式啟動，核心成員來自臨床試驗最重要的報告指引（Reporting guideline）CONSORTstatement的草擬者。

EQUATOR Network的主旨在於協助加強健康領域研究的品質及透明度，透過標準化且詳細的報告檢核項目（Checklist），讓每篇文章的技術細節能夠充分被揭露，以實行在科學研究裡所注重的實驗可重複性（Reproducibility or Repeatability）。然而隨著各種研究類型與專科領域的發展，報告指引的種類越來越多，EQUATOR network即是一個集中收錄的資訊整合平台，截至目前為止（2017/7/24）共收錄367種報告指引。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Aug 01 Tue 2017 09:04
JAMA統計方法的趨勢－晨晰統計林星帆顧問整理

繼筆者於2017/4發表關於新英格蘭醫學雜誌（The New England Journal of Medicine, NEJM）的統計分析之歷年趨勢（網址連結：https://goo.gl/IJ7eSQ），本次分享另一頂尖醫學期刊美國醫學協會雜誌（Journal of the American MedicalAssociation, JAMA，2015年Impact Factor：37.7）的統計方法分析，本篇報告刊登在2013年的PLOS ONE（連結：https://goo.gl/oLRNkT），是經過同儕審核的文章，之前關於NEJM那一篇文章僅是評論，在學術嚴謹度略有差別。

一、研究設計與統計軟體

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Jun 12 Mon 2017 09:15
醫學期刊Medicine轉型報告（下篇，完）－晨晰統計林星帆顧問整理

四、引用分析（Citation Analysis）

接著不免俗地要看一下Impact factor，由於分母（發表量）急速上升，所以2015年Medicine的分數掉到2.1分。不過實際上的一開始Journal of Citation Report公告的分數只有1.2分，是Medicine向Thomson Reuters要求分母由2年改為1.5年，所以才迅速地由1.2升為2.1分（不過不難預測到了2017年，以2015跟2016為分母的時候，分數會降到1分以下）。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

Jun 05 Mon 2017 08:59
醫學期刊Medicine轉型報告（上篇）~晨晰統計林星帆顧問整理

知名醫學雜誌「Medicine (Baltimore)」是目前已知唯一由傳統版權制期刊（Copyright）轉型為開放近用巨量期刊（Open access mega-journal, OAMJ）的雜誌。過往每年的出刊量（Volume）約為30至50篇文章，為雙月刊。於2014年年中轉為每週線上發行的開放近用期刊，不限制每期的出刊量。且向作者收取刊登費（Publicationfee）$1,400美元，且審稿策略採取「在科學上的穩固性」（Scientific soundness）而不是注重主題的新奇性（Novelty）、對領域的影響程度與以及引發興趣關注的程度。

Simon Wakeling於2017年發表了一篇專門對於Medicine轉型前後的期刊計量分析（Bibliometrics study），裡頭詳細報告了Medicine緣由介紹、轉型前後的產出報告與引用分析（文章連結：http://www.mdpi.com/2304-6775/5/2/7）。筆者在此摘錄其文章重點以及評論。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

May 22 Mon 2017 09:01
NEJM統計方法的趨勢－晨晰統計林星帆顧問整理

新英格蘭醫學雜誌（The New England Journal of Medicine, NEJM）身為醫學領域最權威的醫學雜誌（2015年Impact Factor：59.558），引領著整個醫學學術的研究風向與潮流。該雜誌所刊登的題目、使用的研究方法與統計法一向動見觀瞻，本文以2017年發表於NEJM的評論（http://www.nejm.org/doi/pdf/10.1056/NEJMc1616211），筆者額外做一些補充與個人見解。

該文章列出NEJM從1978至2015年的「平均每篇文章使用的統計方法數量」（僅計入original article跟special article），得出一個重要結論：刊在NEJM的文章的統計方法多樣性持續在上升中。這代表當代的高品質研究需要越來越多的精細統計方法（Sophisticated statistical method）來加以協助回答研究問題（如下圖）。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：生物醫學統計

«1 2 3 45 6 7 8 »

熱門文章

文章分類

最新文章

最新留言

文章精選

所有文章列表

文章搜尋

新聞交換(RSS)

誰來我家

參觀人氣

本日人氣：
累積人氣：

QR Code

qrcode

POWERED BY

(登入)

{{ article.user_name }}
{{ article.timestamp * 1000 | date:'MMM.dd.y.hh.mm' }}
{{ article.title }}
{{ article.content }}

PIXNET Facebook Yahoo! Google MSN

您尚未登入，將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

請輸入左方認證碼：

看不懂,換張圖

請輸入驗證碼