瞭解了「資料來源」之後,我們要明白到一件事情,由於健保的原始資料過於龐大,對研究者而言非常難以使用,因此國衛院會將健保局提供的資料建置為各類加值資料檔案,以利研究者使用,主要分成兩種:「制式光碟片」與「特殊需求申請」,其中制式光碟片又包括了系統抽樣檔、特定主題分檔及抽樣歸人檔,以下將稍作說明。

一、          資料加值服務所提供的資料組合

(一)  基本資料檔

如國衛院網站所說明:醫事機構病床主檔(BED)、醫事機構診療科別明細檔(DETA)、醫事機構基本資料檔(HOSB)、專科醫師證書主檔(DOC)、醫事人員基本資料檔(PER)、重大傷病證明明細檔(HV),以及門診、住院費用總表等九類資料檔,製成一片檔光碟發行。承保檔雖屬基本資料(registry),因其檔案較大,另以「特定主題分檔」發行。

每一年度都會有其基本資料檔,因此如果研究時間涵蓋五年,那一般都會購買這五年的基本資料檔,共五片光碟。

不過這邊要補充說明,以上國衛院網站說:「製成一片檔光碟發行」可能是舊的資訊,應該是HV(重大傷病)獨立一片發行,因此每年的基本資料的費用固定為1千元(每年2片)

(二)  系統抽樣檔

系統抽樣檔有兩組資料,第一組是DDDO的系統抽樣,以該年度1/20的比例抽樣;第二組是CDOO的系統抽樣,以該年度1/500的比例抽樣。但由於此類系統抽樣無法將同一個人的資料作「歸人」的處理,也就是說,若我們同時申請兩年的DD/DO系統抽樣檔,我們也無法辨識同一個人在這兩年是否皆有資料,因此一般研究比較少使用這類檔案。

(三)  特定主題分檔

特定主題分檔的檔案非常多種,但依照個人使用經驗,主要常用的還是HV(重大傷病)跟ID(承保檔),國衛院網站應該是把HV檔重複擺在「基本資料檔」以及「特定主題分檔」的位置了,不過筆者之前遇過HV檔是另外一片光碟,而其他基本資料檔則是合在一片光碟,因此可見HV檔仍然需要額外購買。ID承保檔雖然算是基本資料檔,但由於資料過於龐大,因為放了2300百萬人的承保資料,因此另外以特定主題分檔的方式發行。

由於承保檔可協助辨識病患的最後追蹤時間,一般研究一定都會包括此檔,如果研究期間涵蓋很長(19962012),承保檔的費用也不少,以2012年為例,承保檔一共五片光碟,每片500元,等於是2500

 

 

dd  

 

(一)  歸人抽樣檔

(1)           承保抽樣歸人檔

承保抽樣歸人檔(LHID)是一般研究者進行健保資料庫最常用的套裝組合,又稱之為「百萬歸人檔」,以LHID2000為例,就是西元2000年所有在保的身份證字號(ID)中,隨機抽取100萬個ID,並且擷取每人各年所有就醫申報資料(包括門診CD/OO、住院DD/DO及特約藥局GD/GO),製成承保抽樣歸人檔。目前一共有LHID2000LHID2005LHID2010三套百萬歸人檔,不過目前比較少用LHID2010作研究,因為以2010在保作抽樣,若以前瞻性研究而言(Prospective study),其追蹤期可能不到4年(以目前2014年而言),因此目前通常以LHID2000LHID2005較常見。

百萬歸人檔是作縱貫研究非常強大的一組資料,以LHID2000為例,我們可以有100萬人從19962012(會持續更新)這將近20年期間的所有就醫資料,包括住院、門診及慢性連續處方箋(特約藥局)的所有資料,因此非常適合作前瞻性研究或縱貫型研究。

若預算有限,也可不買到100萬人,以LHID2000為例,每一組為5萬人,因此也可以只買10組,這樣就變成50萬歸人檔。

不過百萬歸人檔有個限制,即不適合研究罕見疾病或罕見的暴露因子,若某疾病的每年發生率僅10萬分之1,以全台灣2300萬人來說,每年平均只有230人發病,若再除以23倍(100萬人除以2300萬人),則每年僅有10個病例,這樣的病例數恐怕不足以作有效的統計分析。

關於百萬歸人檔的詳細說明可參考國衛院網頁。若要買齊LHID200020組從19962012的資料,每一組共111片光碟,每片光碟為500元,因此共20*17*500元=17萬元,這還不含一般的基本資料(DOCHOSBHV檔等),基本資料平均1年為2片,因此再加上2*17*500元=1.7萬元,總成本約將近20萬元,也是所費不貲。

(2)           糖尿病人抽樣歸人檔

除了百萬歸人檔,國衛院還提供了糖尿病人抽樣歸人檔」,每年從新增的糖尿病患者中隨機抽取12萬人,一樣可擷取19962012(會持續更新)的所有就醫資料。每年的12萬人皆分成3組發行,每一組包括4萬人。

關於糖尿病人抽樣歸人檔的詳細說明可參考國衛院網頁

(二)  特殊需求申請

「特殊需求」申請的意思是向國衛院申請某些條件的病人資料,通常都是符合某些條件、診斷、處置之下的病人,例如我們欲研究先天性心臟病(Congenital heart disease, CHD),但是由於人數稀少因此不適合用百萬歸人檔來研究,此時就可向國衛院申請特殊需求,例如申請所有符合先天性心臟病(ICD-9740–759)病人從19962012(年份可自己選擇)期間的所有就醫資料,這等於是拿到全台灣所有CHD病人的就醫資料,也是非常強大的資料型態。

特殊需求內容包括門診處方及治療明細檔(CD)、門診處方醫令明細檔(OO)、住院醫療費用清單明細檔(DD)、住院醫療費用醫令清單明細檔(DO)、特約藥局處方及調劑明細檔(GD)、特約藥局處方醫令檔(GO)、物理治療所調劑檔(GDD)、物理治療所醫令檔(GOO)等8個檔案,可以不用一次申請全部檔案,例如可以只申請DDDO,等於是住院歸人檔的意思。

雖然特殊需求非常適合作學術研究,但是其費用非常高昂,國衛院對於特殊需求的收費方式是根據「讀取到多少資料」,而非根據「拿到多少資料」,其收費規則為每讀取1GB的資料就收取200元費用,例如我們舉民國101年為例,門診明細(CD)為95G、門診醫令(OO)為351G、住院明細(DD)為2G、住院醫令(DO)為42G,若我們的研究是需要門診醫令及住院醫令的話,那麼這一年的資料讀取量就是490G,費用為490*200$98,000,這還只是一年的費用,因此若欲以特殊需求申請,必須考量到預算的問題。

 

arrow
arrow
    全站熱搜

    晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()