二、          各檔案之間的關聯-舉例說明

(一)  總覽

在串聯資料之前,最重要的是要先知道各個檔案之間的關鍵變數(一般稱之key variable)為何,才能夠將各個不同檔案來源予以串聯。下圖為國衛院製作的各檔案間串檔變項說明,每一個文字方塊代表的是不同的檔案來源,文字方塊左上角的字體為筆者加上去的檔案英文縮寫名稱,沒有標示縮寫名稱是筆者經驗中比較少用到的檔案。

按照筆者經驗,大致上關鍵變數可以分成幾種類型,首先為身份證字號(ID),可用來直接串聯CD/DD/ID/HV等檔案、再者為用來串聯醫令檔(門診或住院)的六個關鍵變數、最後則是其他關鍵變數,以下再作說明。

 

 

 

Q1

資料來源:http://nhird.nhri.org.tw/file_date/connect2.gif

 

(二)  利用ID(身份證字號)串檔

首先是可以利用ID(身份證字號)直接串檔的資料來源有CDDDHVID檔等,因為這四個檔案皆有該對象的身份證字號與出生年月日。因此直接以身份證字號與出生年月日就可以將這四種不同來源的資料予以串聯。

 

(三)  與醫令(Order code)串檔

之前有提過,如果要作比較細部的分析,例如要瞭解是否有使用某一種用藥或某一種手術/處置,或是需要得知更細的費用分析,必須使用到醫令檔。以門診費用明細檔(CD)而言,每一次門診所申請的醫令可能包括醫師診察費、處置費、藥費,其中包括費用與數量皆記載在醫令檔中(OO),而CDOO之間的串聯關鍵變數並不是病人的身份證字號,而是由六個欄位組合而成的關鍵變數,如下表所示。倘若將這六個欄位合併成一個欄位之後,CD檔中不會找到重複的資料,因為這六個欄位代表的是獨一無二的就診資料,然而其相對應的OO記錄可能會有很多筆,因為每一筆OO記錄代表某一種藥物/處置/明細。

 

Q2

 

Q3

Q4  

 

 

(四)  其他串檔:醫院ID、醫師ID

再來還有一些其他串檔的關鍵變數,如果我們想知道這一次門診/住院是在什麼等級的醫事機構就診,那麼就是要用CD/DD檔跟HOSB(醫事機構基本資料檔)檔做串聯,關鍵變數即為醫院ID(欄位為:HOSP_ID)。

倘若我們想知道關於本次主治醫師的一些特性,例如年資或科別,就是要以用CD/DD檔跟DOC檔(專科醫師證書主檔)檔做串聯,此時的關鍵變數為醫生ID(欄位為:PRSN_ID)。

arrow
arrow
    全站熱搜

    晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()