醫學資料庫研究目前佔目前醫學研究相當大宗,由於資料在研究想法產生之前就已經存在,而不需要再收案或追蹤,一旦可以有權限使用資料時,可以快速地做資料處理及統計分析進而發表,甚至搶先在臨床試驗之前就先有真實世界數據(real world data)的結果。

 

醫學資料庫以台灣的情形大致可以分成三大類

  • 全民健康保險資料庫(NHIRD):目前有國衛院時代的攜出健保資料庫(其資料只到 2013 年,未來不再更新),未來則都是透過衛生福利資料科學中心(俗稱加值中心)或是全民健康保險保險人資訊整合應用服務中心進行健保資料的研究
  • 醫院的電子病歷資料庫(electronic health records; EHRs):這又可粗略分成兩類,第一類是讓研究人員申請資料後直接攜出,也就是將病人與醫事人員身份匿名化之後,直接將資料提供給申請人,目前比較具代表性的是長庚醫學研究資料庫(Chang Gung Research Database; CGRD)。第二類則是中央化管理(centralized authorization),由醫院建置專門的連線與作業空間,申請人進入指定場所進行操作,只能帶出完成的分析日誌與圖表等,類似目前衛福部資科中心的作法。
  • 登錄研究(registries):台灣的登錄研究非常多,筆者知道的有出生通報檔(此資料在衛福部資科中心也有提供加值服務)、中風登錄、癌症登錄與急性冠心症登錄檔(據筆者所知,光急性冠心症就有兩組不同的資料)。

無論使用上述任何一種資料庫,都可以用來進行比較療效(treatment effectiveness)的研究,包括比較不同醫療裝置/器材、藥物、術式等。然而在沒有隨機分派的情況下,再加上缺乏某些重要的混淆變項(confounders,特別是健保資料庫),使得這一類的研究相較於臨床試驗,有更多研究設計與統計分析的額外考量。

幸運的是,許多流行病方法專家與生物統計學家在過去的一、二十年間,展示了各種偏誤(bias)、提出這些偏誤的來源以及提供了許多處理方式。本系列文章旨在簡略地介紹這些常見(而且可以很容易避免)的偏誤,以及若無法避免時該如何因應。

 

醫學資料庫常見的偏誤(Franklin Schneeweiss

本文主要參考兩篇近期兩篇流行病學雜誌的文章1,2,筆者加以翻譯並試圖轉譯成較為易於理解的方式與大家分享這些觀點。

Franklin 等人在 2017 年提出四大造成觀察型研究(真實世界數據)有偏誤的面向,分別是因果關係錯置(reverse causation)、校正了因果關係中的中介變項(adjusting for causal intermediaries)、不死時間偏誤(immortal time bias)以及易受影響的病人的損耗(depletion of susceptibles1,以下一一分別說明。

 

參考文獻

1.      Franklin JM, Schneeweiss S. When and how can real world data analyses substitute for randomized controlled trials? Clinical Pharmacology & Therapeutics. 2017;102(6):924-933.

2.      Sharma M, Nazareth I, Petersen I. Observational studies of treatment effectiveness: worthwhile or worthless? Clinical epidemiology. 2019;11:35.

3.      Schneeweiss S. Sensitivity analysis and external adjustment for unmeasured confounders in epidemiologic database studies of therapeutics. Pharmacoepidemiology and drug safety. 2006;15(5):291-303.

 

(仍有下文)

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 晨晰部落格新站 的頭像
    晨晰部落格新站

    晨晰統計部落格新站(統計、SPSS、BIG DATA討論園地)

    晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()