公告版位
- May 30 Mon 2016 11:03
數據話第6集~What is 成長駭客?
- May 23 Mon 2016 09:09
臺北醫學大學大數據研究中心之演講心得分享~晨晰統計林星帆顧問整理
筆者很榮幸收到臺北醫學大學大數據研究中心(http://bdrc.tmu.edu.tw/index.php)的邀約,於2016/5/10進行關於「健保資料庫之研究趨勢與案例分享」的經驗分享,演講講義PDF可於以下網址下載:http://bdrc.tmu.edu.tw/index.php/2016-02-25-02-26-46。
演講內容大致分為四個區塊,(一)簡介健保資料庫,必須瞭解到健保署是唯一的健保支付者、保險涵蓋率接近100%以及健保申請的目的在於請款(會計帳);(二)健保資料庫的趨勢,瞭解到健保資料庫文章的數量呈現指數型成長、應用社會網絡分析(Social network analysis, SNA)整理群聚現象;(三)優勢與劣勢,優勢包括加值性極高(與其他國家資料庫相較之下)以及跟臨床試驗(Randomized clinical trial, RCT)比較的優勢,劣勢包括極容易作出假性相關(Spurious correlation)的研究;(四)如何作好健保資料庫研究,包括要透徹瞭解譯碼簿、測試收案與排除條件以及面臨統計上面臨的挑戰。
- May 16 Mon 2016 09:13
SPSS Create Dummy Variables Tool(SPSS建立虛擬變數工具)
進行迴歸分析時,類別變項需轉為虛擬變項(Dummy Variable)的處理,常會讓使用者覺得很麻煩,尤其當研究裡的類別變項較多時,處理起來真的需要比較多的時間。此時,我們可以利用SPSS所分享的公用程式,透過軟體來處理,說明中有提到,此公用程式可適用在SPSS 17.0之後的版本,且有安裝Python Essentials,本篇以SPSS 22.0版為操作介面,介紹安裝此公用程式及後續的操作。
在分析之前,先確認所有要做虛擬編碼(Dummy Code)的變項已做數值的標註,增加資料的可讀性。
- May 09 Mon 2016 13:16
極速分析系統(三):相關分析
當要討論兩個連續變項之間的關聯性時,一般會使用皮爾森積差相關進行檢定。通常呈現的表格形式有兩種,(1)矩陣式表格:進行相關分析的變項可明顯區分成兩個來源或目標;(2)自相關表格:進行相關分析的變項不需呈現來源或目標,或是希望看到完整的兩兩相關之結果。本篇將以兩個量表「工作滿意度量表」(包含同儕關係、主管關係、公司福利)與「組織承諾量表」各向度(包含組織認同、努力意願、留職傾向)示範之。
壹、矩陣式表格
- Apr 29 Fri 2016 10:52
數據話第5集~怎樣告白成功機率最高呢???
- Apr 25 Mon 2016 09:20
為什麼向後選取法(Backward selection / Stepwise)保留的變項常常不顯著?~~晨晰統計林星帆顧問整理
作迴歸分析(Regression analysis)時有種方法是以「自動選取」(Automatic variable selection)進行篩選有統計顯著意義的自變項,而自動選取的方法大致可分為向前選取法(Forward selection)、向後選取法(Backward selection)以及逐步選取法(Stepwise selection)這三種。
向前選取法是逐一增加自變項,直到任何一個自變項的額外貢獻量已經沒有統計意義(以線性迴歸 [linear regression] 來說就是Partial F值; 以羅吉斯迴歸 [logistic regression] 來說則是LR卡方值);向後選取法則是逐一剔除自變項,直到當剔除任何一個自變項時,模式會損失過多的解釋力,此時即停止篩選變項;逐步選取法是同時結合了向前選取及向後選取兩種方法,最大不同處是逐步選取法可以允許被排除的變項又被選進模式,也允許被選進的變項最後又被模式排除。
- Apr 18 Mon 2016 09:17
用SPSS來作RFM行銷分析(四)
- Apr 11 Mon 2016 09:16
用SPSS來作RFM行銷分析(三)
前二篇「用SPSS來作RFM行銷分析」主要偏重技術面,本篇改用商業問題解決的應用角度來談RFM。
首先談一個常見的概念,許多行業有「80%收入來自20%的客戶」的特性,所以在作銷售預測時,透過購買量的記錄,來辨別未來重要客戶,便成為理所當然的事。
- Apr 01 Fri 2016 15:24
數據話第4集~威力強大的SEM
- Mar 28 Mon 2016 09:12
傾向分數配對(Propensity score matching)軟體大PK(下) ~晨晰統計林星帆顧問整理
<精確配對(Exact match)>
精確配對指的是指定治療組(treated)與對照組(untreated)的某個變項的分配(或比例)要一模一樣,通常都是類別變項(Categorical variable),最常見的就是性別,亦即指定男性必須配男性,女性就配女性。R與NCSS的傾向分數配對的操作介面皆有提供精確配對的選項,但是SAS卻沒有,而是要透過自己修改Macro(巨集)加以指定對某些變項精確配對。