瞭解了「資料來源」之後,我們要明白到一件事情,由於健保的原始資料過於龐大,對研究者而言非常難以使用,因此國衛院會將健保局提供的資料建置為各類加值資料檔案,以利研究者使用,主要分成兩種:「制式光碟片」與「特殊需求申請」,其中制式光碟片又包括了①系統抽樣檔、②特定主題分檔及③抽樣歸人檔,以下將稍作說明。
一、 資料加值服務所提供的資料組合
瞭解了「資料來源」之後,我們要明白到一件事情,由於健保的原始資料過於龐大,對研究者而言非常難以使用,因此國衛院會將健保局提供的資料建置為各類加值資料檔案,以利研究者使用,主要分成兩種:「制式光碟片」與「特殊需求申請」,其中制式光碟片又包括了①系統抽樣檔、②特定主題分檔及③抽樣歸人檔,以下將稍作說明。
一、 資料加值服務所提供的資料組合
(一) 原始資料檔
接著是原始資料檔,相較於基本資料檔,也就是無法一次拿到全台灣2300萬人的所有資料,而是要按照申請案的類型,看是「系統抽樣檔」或是「特殊需求申請」而提供某種特定個案的資料。按照我目前使用經驗,以下幾個檔案最常使用。
健保資料庫(National health insurance research database, NHIRD)目前可謂是醫學領域的顯學,在PubMed搜尋「NHIRD」的關鍵字,可發現2012年後每年至有200-300篇的文章被刊登,並且速度仍在增加當中,因此對於臨床醫師而言,已經不得不對健保資料庫有所瞭解了。
本系列文章旨在讓讀者對於健保資料庫的資料結構有所瞭解,當我們知道健保資料庫各次資料庫分別有什麼變項之後,可以幫助我們著手進行研究設計,最後我將討論健保資料庫的優勢以及面臨到的挑戰。
大家有常常在網路商城購物嗎??網路購物既便宜而且很多商品都可以送貨到家,實在是越來越普遍的趨勢。我平常都用PCHOME的平台購物,但是今天突發奇想,想說乾脆比較一下不同商城的商品價格,看看哪個商城才是最便宜的,所以我找了三個比較熟知的商城來比較,包括YAHOO超級商城,MOMO購物以及我最常用的PCHOME商城。我又擔心說在不同種類的商品上不同商城可能會有自己的優勢,所以我分成四個大的層面來調查,包括美妝、家電、筆電、日用品(原本還想多做一個食品,進行時發現食品有很多複雜的促銷,不太好比較價格),我每個層面都隨機抽10種商品調查價格,然後比較哪一個商城的商品最便宜或最貴,下面整理給大家:
最近有一個關於Google併購了Skybox這家公司的新聞,Skybox是專做衛星影像業務的公司,其過人之處在於製造與發射全球最小的高分辨率成像衛星,可提供次米級(sub-meter)精準度的圖像,以及來自衛星網路的90秒影片。
(4)勾選「主觀察值的指標(I)」,並選擇下方的「以各群組中的第一個觀察值為主(H)」,名稱改為「第一筆資料」,之後資料即將新增一個欄位名叫「第一筆資料」,且若該筆資料為受訪對象的第一筆資料時,該欄位的數值為「1」,其他則皆為「0」;反之,若選擇上方的「以各群組中的最後觀察值為主(L)」,名稱改為「最後一筆資料」之後資料即將新增一個欄位名叫「最後一筆資料」,且若該筆資料為受訪對象的最後一筆資料時,該欄位的數值為「1」,其他則皆為「0」。
(5)勾選「各群組中的相符觀察值循序個數」,名稱改為「次數」,之後資料即將新增一個欄位名叫「次數」,該欄位的數值即呈現該受試者的第幾次資料。
又到暑假囉,今年又要出國玩,之前做過一篇島嶼的比較,冠軍是蘇美島http://dasanlin888.pixnet.net/blog/post/34469489。今年想要去日本玩,同樣的鎖定了四個日本的地區做比較,看看哪個地區CP值比較高。
由於最近常在處理有關於資料處理的問題,小編這邊學到兩個還蠻好用的功能分享給大家:(1)為每一列的資料增加辨識碼,相當於流水號;(2)針對相同流水號(同一個人)的資料,再增加一欄辨識碼,相當於該列資料為該研究對象的第幾次資料。
一、增加流水號