公告版位
晨晰統計顧問有限公司在新北市板橋\服務市話:02-29602817\手機:0918-276-622\信箱:raising.statistic@gmail.com\網址:http://www.rai-stat.com.tw

筆者很榮幸收到臺北醫學大學大數據研究中心(http://bdrc.tmu.edu.tw/index.php)的邀約,於2016/5/10進行關於「健保資料庫之研究趨勢與案例分享」的經驗分享,演講講義PDF可於以下網址下載:http://bdrc.tmu.edu.tw/index.php/2016-02-25-02-26-46

演講內容大致分為四個區塊,(一)簡介健保資料庫,必須瞭解到健保署是唯一的健保支付者、保險涵蓋率接近100%以及健保申請的目的在於請款(會計帳);(二)健保資料庫的趨勢,瞭解到健保資料庫文章的數量呈現指數型成長、應用社會網絡分析(Social network analysis, SNA)整理群聚現象;(三)優勢與劣勢,優勢包括加值性極高(與其他國家資料庫相較之下)以及跟臨床試驗(Randomized clinical trial, RCT)比較的優勢,劣勢包括極容易作出假性相關(Spurious correlation)的研究;(四)如何作好健保資料庫研究,包括要透徹瞭解譯碼簿、測試收案與排除條件以及面臨統計上面臨的挑戰。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

進行迴歸分析時,類別變項需轉為虛擬變項(Dummy Variable)的處理,常會讓使用者覺得很麻煩,尤其當研究裡的類別變項較多時,處理起來真的需要比較多的時間。此時,我們可以利用SPSS所分享的公用程式,透過軟體來處理,說明中有提到,此公用程式可適用在SPSS 17.0之後的版本,且有安裝Python Essentials,本篇以SPSS 22.0版為操作介面,介紹安裝此公用程式及後續的操作。

在分析之前,先確認所有要做虛擬編碼(Dummy Code)的變項已做數值的標註,增加資料的可讀性。

晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()

當要討論兩個連續變項之間的關聯性時,一般會使用皮爾森積差相關進行檢定。通常呈現的表格形式有兩種,(1)矩陣式表格:進行相關分析的變項可明顯區分成兩個來源或目標;(2)自相關表格:進行相關分析的變項不需呈現來源或目標,或是希望看到完整的兩兩相關之結果。本篇將以兩個量表「工作滿意度量表」(包含同儕關係、主管關係、公司福利)與「組織承諾量表」各向度(包含組織認同、努力意願、留職傾向)示範之。

壹、矩陣式表格

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()


晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

      作迴歸分析(Regression analysis)時有種方法是以「自動選取」(Automatic variable selection)進行篩選有統計顯著意義的自變項,而自動選取的方法大致可分為向前選取法(Forward selection)、向後選取法(Backward selection)以及逐步選取法(Stepwise selection)這三種。

向前選取法是逐一增加自變項,直到任何一個自變項的額外貢獻量已經沒有統計意義(以線性迴歸 [linear regression] 來說就是Partial F; 以羅吉斯迴歸 [logistic regression] 來說則是LR卡方值);向後選取法則是逐一剔除自變項,直到當剔除任何一個自變項時,模式會損失過多的解釋力,此時即停止篩選變項;逐步選取法是同時結合了向前選取及向後選取兩種方法,最大不同處是逐步選取法可以允許被排除的變項又被選進模式,也允許被選進的變項最後又被模式排除。

晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()

談到RFM分組,一般常見為五等分,將客戶分成5×5×5 = 125等級中,如下所示。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

前二篇「SPSS來作RFM行銷分析」主要偏重技術面,本篇改用商業問題解決的應用角度來談RFM

首先談一個常見的概念,許多行業有「80%收入來自20%的客戶」的特性,所以在作銷售預測時,透過購買量的記錄,來辨別未來重要客戶,便成為理所當然的事。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()


晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

<精確配對(Exact match)>

精確配對指的是指定治療組(treated)與對照組(untreated)的某個變項的分配(或比例)要一模一樣,通常都是類別變項(Categorical variable),最常見的就是性別,亦即指定男性必須配男性,女性就配女性。RNCSS的傾向分數配對的操作介面皆有提供精確配對的選項,但是SAS卻沒有,而是要透過自己修改Macro(巨集)加以指定對某些變項精確配對。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在非隨機分派的觀察型研究中(Non-randomized observational study),如果欲比較介入或處置的效果(Treatment),在研究上的最大威脅就是選擇性偏差(Selection bias)的問題。對此,傾向分數配對(Propensity score matching)已被證實是最有效的工具,並且已經廣為使用。

本篇文章並未嘗試介紹傾向分數的原理與使用方式,而是在介紹目前較受歡迎的幾個統計軟體之間的比較。若對於傾向分數想要深入認識者,可參考以下兩篇論文。其中Rosenbaum1983)年的論文是經典文獻,在Google scholar上的引用次數已經超過14,000次;而d’Agostino1998)則是一步一步教學且實務理論兼顧的教學文章。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

Close

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

reload

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼