公告版位
晨晰統計顧問有限公司在板橋~~服務市話:02-29602817 手機:0918-276-622 聯絡信箱:raising.statistic@gmail.com。 網址:http://www.rai-stat.com.tw。 歡迎大家踴躍發問,問問題請用facebook問(http://tinyurl.com/raising100)會盡量回覆!

目前分類:生物醫學統計 (75)

瀏覽方式: 標題列表 簡短摘要

在前兩篇文章中,我們介紹了曲線下面積(Area under the curve, AUC)與integrated discrimination improvementIDI)的定義以及使用上的限制。為了回答此問題:「A這個生物標記或預測模型,所增加的預測能力若使用在臨床上,究竟是否可以改變治療決策?」,Pencina2008)首次提出net reclassification improvementNRI)這個指標以及展示它的統計檢定1

在使用NRI之前,必須有個很重要的前提,亦即關於該事件的預測機率已有明確的風險分組。例如根據Third Adult Treatment PanelATP III)將10年冠心病的風險(10-year risk of coronary heart disease)明確分為3組:0%–6%6%–20%>20%,針對不同風險分組會有不同的治療決策,例如0-6%只要保持定期追蹤,6%–20%則是改變生活方式與藥物治療,而>20%則可能要接受更積極的監測與治療。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在之前文章中,我們提到了在以下幾種情況,過去常以Receiver Operating CharacteristicROC)的曲線下面積(Area under the curve, AUC)作為主要的統計方法以及其限制1-2

假設已知有個表現良好的生物標記B(或是一組危險因子,例如Framingham Risk Score),此時我們提議(proposed)的生物標記或預測模型(或一組危險因子)為A,可能會有以下幾種的比較。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

        8月舉辦於嘉義長庚醫院的實證醫學年會,主題探討大數據、人工智慧對醫學研究與實證醫學的影響。會中由李友專院長淺談人工智慧的發展沿革,以及目前在醫學領域應用較為廣泛的人工智慧型態,例如:圖像判讀或分組、決策樹(decision tree)、人工神經網路(artificial neural network, ANN)、深度學習(deep learning)、機器學習(machine learning, ML)等。李院長的演講作為導言,以輕鬆詼諧的方式,簡單讓與會者像聽歷史故事一般接觸人工智慧的發展史,並從中帶出人工智慧在過去遭遇的挫折與困境 (例如硬體設備的計算效率不佳)。隨著科技時代的進步,電腦硬體與時俱進,形成現今人工智慧發展的優勢環境,足以支援更複雜演算法與更大量的資料點。

        李院長精彩的演說引人入勝,讓筆者會後更為好奇,人工智慧目前在醫學研究方面是如何被應用與執行的?以及人工智慧的基本概念有些什麼?故筆者搜尋了一些介紹人工智慧的網站,以及一些運用或探討人工智慧的醫學論文。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在臨床醫學研究中,常常會提出一個生物標記(Biomarker)可以預測特定事件的假設,例如以neutrophil gelatinase-associated lipocalinNGAL)預測急性腎損傷(acute kidney injury, AKI),或是以B-type natriuretic peptideBNP)預測心衰竭病人的再住院率。

通常此時會有比較的基準,假設已知有個表現良好的生物標記B(或是一組危險因子,例如Framingham Risk Score),此時我們提議(proposed)的生物標記或預測模型(或一組危險因子)為A,可能會有以下幾種的比較。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在觀察型研究當中,傾向分數分析(propensity score analysis)的使用,特別是傾向分數配對(propensity score matching)已經是非常普遍,這個部分可參見筆者在之前寫的文章(https://reurl.cc/qd8xg 以及  https://reurl.cc/V6Xr5)。關於傾向分數配對的技術與介紹,網路上已經有非常多資源(可參見筆者同事撰寫的一系列文章(https://reurl.cc/E7z3Rhttps://reurl.cc/WdL5D以及https://reurl.cc/O1qlv),但目前比較少人討論在傾向分數配對後的統計方法。

理論上,在同一個配對組合(matched pair)之下的實驗組與對照組(或暴露組與非暴露組),由於他們有很接近的傾向分數(成為實驗組/暴露組的機率),因此他們在用來計算傾向分數的基本屬性上(例如年齡、性別、共病等)也會比較相近,因此此時的實驗組與對照組不再是「獨立樣本」,而是具有相依性的配對樣本(paired sample1

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

目前欲作健保資料庫有三種管道,第一種是以國衛院時代的攜出健保資料庫,其資料只到2013年就停止更新了;第二種是衛生福利資料科學中心,俗稱加值中心,資料更新約延遲1.52年左右;第三種是全民健康保險保險人資訊整合應用服務中心,資料更新約延遲1年。最近常聽到一種聲音,就是知名雜誌越來越不願意接受國衛院的攜出健保資料庫,但筆者的實際經驗似乎相左。

因此筆者使用國立成功大學健康資料加值應用研究中心的健保資料庫搜尋網站(https://visualizinghealthdata.idv.tw/?route=article/thesis),搜尋方式為「限定impact factor > 5」(以2016 JCR的分數),結果有743篇(更新時間 : 2018-06-27),其中43篇為於2018年發表,筆者由摘要中找尋「追蹤截止日期」的相關資訊。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

  延續上一章節,本篇將持續透過官方範例檔與示範程式(如下圖所示),簡介程序實際操作之後產出的報表,以及報表中各項目的涵義。  

  執行完上段程序後,首先產出的報表會描述進行傾向分數配對的變數細節(如下圖所示)。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

  呈上個章節簡單介紹觀察型研究中的存活偏誤(Survival bias),本章節導讀文獻中提出的常見的5種研究設計方法,前2種會受到存活偏誤(Survival bias)影響,導致研究結果產生傾向於某一方有優勢,後3種為控制存活偏誤(Survival bias)的研究設計方法,以下將逐一介紹。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

  觀察型研究中,由於介入/治療行為並非由研究者施予及分組,非受試者與受試者在受到其他許多背景、環境等因素操弄之下,而形成他們在研究中被觀察到的組別或治療型態。而醫學研究中,常見的觀察性研究資料類型多數為病歷回顧或是資料庫形式。當研究者從現有的資料集中萃取研究個案將其分組,並觀察追蹤期間的結果時,會因為【分組】這個動作而產生存活偏誤(Survival bias),或是不死的時間偏誤(Immortal time bias)。舉例來說,研究者從現有資料庫中篩選出一群急性心肌梗塞(AMI)的病人,看病人出院後90天內的Statin藥物使用狀況,將病人分成Statin組跟Non-statin組,並觀察病人從AMI出院之後發生AMI再住院或死亡的風險。這看似順風順水的研究設計,潛藏著一個干擾觀察結果的偏誤(bias),出院後90天內因為有使用Statin而被分到Statin組的人,從病人出院到使用Statin的這段時間是保證存活(意即活著的人才有機會被開Statin),因為死亡而來不及使用Statin的人就會被分到Non-statin組。在比較Statin與Non-statin組在AMI出院之後的AMI再住院與死亡時,就可能會發現Non-statin組死亡率比較高且AMI再住院率比較低,這是因為死亡而來不及用藥的人都在Non-statin組,而死亡的人也比較不容易被觀察到AMI的再住院,這個現象就稱為不死的時間偏誤(Immortal time bias)。

  流行病學研究設計中,有幾種處理不死的時間偏誤(Immortal time bias)的方式,以下援引American Journal of Epidemiology於2005年介紹的5種研究設計方式,其中方法1跟方法2都是會強烈受到偏誤(bias)影響研究結果,而方法3~5則是控制偏誤(bias)的方式,下一章節將逐一導讀介紹文獻中的5種研究設計方法,以及這5種研究設計之下對結果產生的影響。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

完成對處置變項的羅吉斯迴歸之後,根據每個個案的基本特性(年齡、性別與共病狀況)會得到預測機率,即此人成為治療組的機率。在接著往下進行傾向分數的分析之前,要先評估治療組與控制組在傾向分數的分布情形。可以使用兩種方法來判斷,第一種是畫圖,第二種是看C-statistics(即C-indexAUROC)。C-statistics代表的是預測變項對處置變項(1=treated, 0=untreated)整體的區別力,0.5為完全無法區別,1代表完美區別。

下圖列出傾向分數可以非常有效區分治療組與控制組的結果,兩組在傾向分數的分布截然不同,而且重疊區域很少(中間灰色底的common support),這種狀況是很難進行後續的傾向分數分析的,不管進行任何一種傾向分數分析,都無法有效降低混淆因子的效果。當出現這種情形時,檢查是否有對處置變項的強烈預測變項,例如「有洗腎的病人一定不會開Metformin」或是存在工具變數。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在現今的醫學研究中,傾向分數分析(propensity score analysis, PSA)儼然扮演非常重要的角色。下圖為筆者在Pubmed以關鍵字「propensity score」搜尋得到的文獻筆數,由結果可知,以傾向分數作為研究方法的文獻呈現非線性的增加,到了2017年,單年度超過3千篇文獻使用傾向分數,可見傾向分數已為醫學研究當中的顯學。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

根據成功大學呂宗學教授及其團隊針對健保資料庫所作的詳盡搜尋,目前為止(2017/11/17)已有4356 篇文章以英文的形式發表在國際期刊(https://goo.gl/atTnNN),其中Impact factor大於10分者高達104篇,可謂是台灣醫學領域之光。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

         延續上篇簡單描述什麼是不死偏誤,以及為什麼不死偏誤會讓用藥治療組傾向有比較好的結果。上篇文末提到的處理不死偏誤的幾種方式中,目前比較多模擬研究在比較的是時間相依(time-dependent)、用藥時間分佈配對(prescription time-distribution matching, PTDM)及sequential Cox approach這三種較為新穎的研究方法。但是多數研究為某兩種方法的比較,或是純理論推導的比較,模擬研究也比較多是在單一模擬資料集之下所做的研究結果。比較少有文獻同時比較這三種較為新穎的研究法,且在同一篇文獻中虛擬出不同特性的資料結構,比較三種研究法在不同資料結構之下的偏誤狀況及風險比例(Hazard ratio, HR)估算的結果差異。 

  本篇要分享2016年發表於美國流行病學期刊(American Journal of Epidemiology, AJE)的一份研究報告。作者首先透過公式推導的方式寫出偏誤(bias)的公式,藉此合理推論什麼情境之下偏誤會增加或減少。之後再以模擬資料集(simulated data)實際比較三種研究法的偏誤及Cox分析結果。本篇分享文略過複雜的公式部分,直接分享作者研究報告比較的結果,對研究中細部訊息有興趣的讀者,可以從下方參考文獻處的資訊搜尋全文閱覽。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

    觀察型或是資料庫追蹤研究的醫學藥物研究設計中,將用藥組跟非用藥組分別比較時,會面臨不死偏誤(immortal time bias)造成的錯誤分組(misclassification),而且這個錯誤分組傾向用藥組會有較好的存活效應。什麼是不死偏誤?而不死偏誤造成的錯誤分組指的又是什麼意思?

  不死偏誤指的是用藥組在疾病診斷日期之後到第一次用藥日期之間存活的時間偏誤,因為有機會在診斷日期之後被觀察到接受藥物治療的人,前提必須先活著,因此【沒有機會接受治療】的人會被歸類到非用藥組,產生錯誤分組的問題。沒有機會接受治療的人是指在診斷日期之後觀察追蹤的這段時間中死亡、設限或是發生事件的人。這個思考邏輯的背後有個前提假設,診斷日期之後的任何觀察追蹤時間點,病人都是有可能接受藥物治療的人,也是就風險人口(population at risk)的概念。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

 AustinFine2016年發表於Circulation期刊的文章,以實際資料數據闡述當存活分析存在競爭因子時,研究者使用一般傳統的Kaplan-Meier存活函數,與考慮競爭因子之下的存活函數分析,比較兩者之間得到的分析結果差異,以此說明當存在競爭因子時,為何研究者必須採用競爭因子存活分析的原因。本文章將以過去分析過的資料集做為示範樣本,操作當資料集存在競爭因子時,傳統Kaplan-Meier存活分析函數與考慮競爭因子的次分佈瞬間危險函數(Subdistribution Hazard FunctionSDH),兩者之間存活分析結果的差異,並簡述造成存活分析結果有落差的原因。 

  範例樣本中,實驗組有1,182人,對照組有2,027人,兩組人在設限、興趣事件及競爭事件的比例分佈如下圖所示,可以發現兩組的分佈差異甚大。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

四、結果變項的定義(Definitions of outcomes

在醫學研究上,許多結果變項都是被人工二元分類,例如慢性腎病(CKD)定義可能是eGFR < 60 mL/min/1.73m2,那麼如果切點改為5550,本研究主要發現是否會因而改變。當然可以用比較有臨床意義的作法,例如將Outcome定義改為CKD stage 4-5eGFR < 30),然後觀察原本結論是否仍然適用。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

世界知名醫學期刊美國醫學協會雜誌(Journal of the American Medical Association, JAMA2016Impact Factor44.4)於2010年所刊登文章中,每2篇中已有1篇會報告敏感度分析(Sensitivity analysis)的結果,這篇報告刊登在2013年的PLOS ONEhttps://goo.gl/oLRNkT),也可見讀者於2017/8時的介紹(https://goo.gl/38dwwi)。

那麼,什麼是敏感度分析呢,筆者的定義是「本研究的發現是否會在某些操作條件之下而改變」。2013年有一篇發表在BMC Medical Research Methodologyhttps://goo.gl/ZhuNAQ),專門介紹臨床試驗的敏感度分析細節,裡頭提到敏感度分析定義包括「a method to determine the robustness of an assessment by examining the extent to which results are affected by changes in methods, models, values of unmeasured variables, or assumptions」以及「a series of analyses of a data set to assess whether altering any of the assumptions made leads to different final interpretations or conclusions」。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

EQUATOR Network是促進健康研究品質及公開透明(Enhancing the QUAlity and Transparency Of healthResearch)的縮寫,這是一個收錄各種類型的研究,應揭露的研究報告格式及內容的資訊整合平台。EQUATOR計畫由2006/3時開始(由UK NHS National Knowledge Service所贊助的一年期計畫),EQUATOR Network2008/6正式啟動,核心成員來自臨床試驗最重要的報告指引(Reporting guidelineCONSORTstatement的草擬者。

EQUATOR Network的主旨在於協助加強健康領域研究的品質及透明度,透過標準化且詳細的報告檢核項目(Checklist),讓每篇文章的技術細節能夠充分被揭露,以實行在科學研究裡所注重的實驗可重複性(Reproducibility or Repeatability)。然而隨著各種研究類型與專科領域的發展,報告指引的種類越來越多,EQUATOR network即是一個集中收錄的資訊整合平台,截至目前為止(2017/7/24)共收錄367種報告指引。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

繼筆者於2017/4發表關於新英格蘭醫學雜誌(The New England Journal of Medicine, NEJM)的統計分析之歷年趨勢(網址連結:https://goo.gl/IJ7eSQ),本次分享另一頂尖醫學期刊美國醫學協會雜誌(Journal of the American MedicalAssociation, JAMA2015Impact Factor37.7)的統計方法分析,本篇報告刊登在2013年的PLOS ONE(連結:https://goo.gl/oLRNkT),是經過同儕審核的文章,之前關於NEJM那一篇文章僅是評論,在學術嚴謹度略有差別。

一、研究設計與統計軟體

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

四、引用分析(Citation Analysis

接著不免俗地要看一下Impact factor,由於分母(發表量)急速上升,所以2015年Medicine的分數掉到2.1分。不過實際上的一開始Journal of Citation Report公告的分數只有1.2分,是Medicine向Thomson Reuters要求分母由2年改為1.5年,所以才迅速地由1.2升為2.1分(不過不難預測到了2017年,以2015跟2016為分母的時候,分數會降到1分以下)。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

1 234

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼