公告版位
晨晰統計顧問有限公司在新北市板橋\服務市話:02-29602817\手機:0918-276-622\信箱:raising.statistic@gmail.com\網址:http://www.rai-stat.com.tw

 

在真實情境世界所蒐集的資料(real world data; RWD)所進行的真實世界研究(real world study; RDS),醫院的電子病歷資料庫(electronic health/medical records; EHRs or EMRs)佔了相當的比重。本篇文章旨在介紹目前台灣各家醫院在開放 EMRs 的現況。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

承襲筆者前陣子寫的文章,資料科學學習歷程(),筆者最近整理了一些網路資源,關於拿到一筆資料時,該進行那些基本的處理,讓資料之後能用於建置模型或更進一步的分析。這次的內容主要先以初步的數據探勘(步驟1-3)為主,筆者也整理了一些Python的實作語法供讀者參考,之後的文章也會進一步介紹如何利用Python進行初步的數據清洗。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

筆者在 2013 年曾經寫過一篇文章『醫學統計經常混淆的名詞』(https://dasanlin888.pixnet.net/blog/post/34469753),將醫學領域與其他領域的慣用使用統計名詞作了一些釐清。

本篇文章旨在討論在醫學領域很常被誤用的統計名詞,有些名詞甚至錯誤(或說不精確)名詞的使用頻率還高過正確名詞。主要討論多變項(multivariable)與多變量分析(multivariate)的差別以及雙變項/雙變量(bivariable or bivariate)還是單變量分析(univariable or univariate)的差別。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

各位好朋友,我們公司的顧問每周三下午兩點半都會在FB上直播討論自己遇到的統計問題,有些問題深有些淺,兩年多來我們將這些影片整理起來,希望可以讓有需要的人能方便使用。所以如果你有統計問題,不妨可以在這邊搜尋一下,然後點進去看看顧問們討論的內容是否對你有幫助,也順便參考一下統計顧問遇到這些問題時是怎樣去思考解決的。學習是一種不斷精進的過程,我們希望透過一群人一起努力,讓這個過程更美好,謝謝大家。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

筆者最近在Kaggle上開始學習如何透過Python進行資料分析的實作,因此想利用這幾個月的時間跟各位讀者分享學了甚麼,以及甚麼是Kaggle,初學者要如何在上面快速的學習與資料科學有關的內容。

這次我們先來講一下Kaggle到底是甚麼以及初學者要如何在上面快速的學習資料科學的應用好了,Kaggle是一個資料建模以及資料分析的競賽平台,成立於2010年,2017年的時候被Google公司收購,許多企業或研究單位會在上面放上各式各樣的資料,提供給加入這個平台的人,透過競賽的方式去分析這些資料並透過資料來去建模,以解決這些企業或研究單位所遇到的問題,Kaggle的目標其實很單純,其實就是透過眾人的力量來去解決現階段所遇到的問題,因為資料分析以及建模的作法非常的多元,研究單位或企業很難一開始就知道怎樣的做法能最好的解決目前所遇到的問題,所以透過競賽的方式能利用眾人的力量找到最佳的解決方法。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

我會與違章工廠結緣,是因為從事數據工作多年,深覺得資料應該與民眾生活結合才有意義。因此在2019初,選擇這個當時正發展中的議題,作為起手式。切入的角度為資料視覺化(Data Visualization),材料為公開資料(Open Data),工具為Power BI Desktop

歷經約三個月的討論與實作,終於把一個作品完成(1)。老實說,我並不是很滿意,原因有資料不夠完整,也有創意不夠多,更有覺得美感能力不足之感。但無論如何,這是一個開始,過程中收獲良多。隨著工輔法6/27修正通過,這個議題似乎有點偃旗息鼓,不過我相信只要污染的事實存在,這件事隨時會再引起大家關注。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

           在電子化醫學研究資料庫逐漸流行的時代,利用次級資料庫或是公務行政資料庫進行醫學研究逐漸普及。研究者需要運用許多資料處理的技術在大量資料點中,擷取出適合分析的樣本,再依取出的樣本進行後續的分析處理。一般研究設計中,病例組/治療組因為操作目標明確,通常是容易擷取的,但是對照組範圍很廣,且年齡、性別的分佈往往會跟病例組/治療組有很大差異 (可以想像一般年輕人比較不容易成為病例組,所以病例組的年齡常常是較年長的),造成兩者之間可比較性低。此時有許多技術操作可以挑選出具有可比較性、適合分析的對照組,以下分享一些容易操作的簡單小技巧「抽樣」來達成挑選對照組的任務。

        常見的抽樣方式「簡單隨機抽樣(Simple random sampling)」、「分層隨機抽樣(Stratified random sampling)」,其中分層隨機抽樣可再依操作方式分為「等比例隨機抽樣」跟「不等比例隨機抽樣」。以下簡單介紹透過SAS SURVEYSELECT Procedure來達成以上的抽樣操作。以上幾種常見的抽樣方式,在SURVEYSELECT Procedure語法的基本結構如下:

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

二、共變異數分析

8)回到模式的設定

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

搜尋了一下過去的文章,有寫過用SAS進行ANCOVA與詹森內曼法的教學,以及用SPSS進行詹森內曼法的教學,因此這篇將補足用SPSS進行ANCOVA的教學分析,畢竟ANCOVA應該算是在變異數分析裡比較熱門的分析方式,至於比較詳細的原理及教學,可以找一些變異數分析的專書,應該蠻好找到相關的內容。

多數的共變數分析,常出現在前後測的介入研究中,而且在多個研究領域上的接受度也是頗高的,除了使組別在後測的比較更精確之外,在統計方法的使用上也比使用獨立樣本t檢定或配對樣本t檢定來得好看。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

筆者前些日子去長庚醫院參加「資料庫研究的研究設計方法與測量」的研討會,這個演講主要分為兩大主題「健保資料庫研究設計與應用」、「資料庫藥物流病研究的測量」,筆者想跟讀者分享演講過程學到的知識以及筆者的一些心得。

  • 健保資料庫研究設計與應用

主要講述內容包含(1) 觀察性研究會遇到的偏差(bias)(2) 常見的研究設計與如何避免研究的偏差;(3) 演講者在實務研究上的分享

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼