晨晰統計部落格新站（統計、SPSS、BIG DATA討論園地）

May 23 Mon 2016 09:09
臺北醫學大學大數據研究中心之演講心得分享~晨晰統計林星帆顧問整理

筆者很榮幸收到臺北醫學大學大數據研究中心（http://bdrc.tmu.edu.tw/index.php）的邀約，於2016/5/10進行關於「健保資料庫之研究趨勢與案例分享」的經驗分享，演講講義PDF可於以下網址下載：http://bdrc.tmu.edu.tw/index.php/2016-02-25-02-26-46。

演講內容大致分為四個區塊，（一）簡介健保資料庫，必須瞭解到健保署是唯一的健保支付者、保險涵蓋率接近100％以及健保申請的目的在於請款（會計帳）；（二）健保資料庫的趨勢，瞭解到健保資料庫文章的數量呈現指數型成長、應用社會網絡分析（Social network analysis, SNA）整理群聚現象；（三）優勢與劣勢，優勢包括加值性極高（與其他國家資料庫相較之下）以及跟臨床試驗（Randomized clinical trial, RCT）比較的優勢，劣勢包括極容易作出假性相關（Spurious correlation）的研究；（四）如何作好健保資料庫研究，包括要透徹瞭解譯碼簿、測試收案與排除條件以及面臨統計上面臨的挑戰。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：我們的故事

▲top

May 16 Mon 2016 09:13
SPSS Create Dummy Variables Tool（SPSS建立虛擬變數工具）

進行迴歸分析時，類別變項需轉為虛擬變項（Dummy Variable）的處理，常會讓使用者覺得很麻煩，尤其當研究裡的類別變項較多時，處理起來真的需要比較多的時間。此時，我們可以利用SPSS所分享的公用程式，透過軟體來處理，說明中有提到，此公用程式可適用在SPSS 17.0之後的版本，且有安裝Python Essentials，本篇以SPSS 22.0版為操作介面，介紹安裝此公用程式及後續的操作。

在分析之前，先確認所有要做虛擬編碼（Dummy Code）的變項已做數值的標註，增加資料的可讀性。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(1) 人氣()

個人分類：迴歸與SEM

▲top

May 09 Mon 2016 13:16
極速分析系統（三）：相關分析

當要討論兩個連續變項之間的關聯性時，一般會使用皮爾森積差相關進行檢定。通常呈現的表格形式有兩種，（1）矩陣式表格：進行相關分析的變項可明顯區分成兩個來源或目標；（2）自相關表格：進行相關分析的變項不需呈現來源或目標，或是希望看到完整的兩兩相關之結果。本篇將以兩個量表「工作滿意度量表」（包含同儕關係、主管關係、公司福利）與「組織承諾量表」各向度（包含組織認同、努力意願、留職傾向）示範之。

壹、矩陣式表格

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：晨晰的宣傳與服務專案

▲top

Apr 29 Fri 2016 10:52
數據話第5集~怎樣告白成功機率最高呢???

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：數據話視頻

▲top

Apr 25 Mon 2016 09:20
為什麼向後選取法（Backward selection / Stepwise）保留的變項常常不顯著？~~晨晰統計林星帆顧問整理

作迴歸分析（Regression analysis）時有種方法是以「自動選取」（Automatic variable selection）進行篩選有統計顯著意義的自變項，而自動選取的方法大致可分為向前選取法（Forward selection）、向後選取法（Backward selection）以及逐步選取法（Stepwise selection）這三種。

向前選取法是逐一增加自變項，直到任何一個自變項的額外貢獻量已經沒有統計意義（以線性迴歸 [linear regression] 來說就是Partial F值; 以羅吉斯迴歸 [logistic regression] 來說則是LR卡方值）；向後選取法則是逐一剔除自變項，直到當剔除任何一個自變項時，模式會損失過多的解釋力，此時即停止篩選變項；逐步選取法是同時結合了向前選取及向後選取兩種方法，最大不同處是逐步選取法可以允許被排除的變項又被選進模式，也允許被選進的變項最後又被模式排除。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(1) 人氣()

個人分類：研究方法

▲top

Apr 18 Mon 2016 09:17
用SPSS來作RFM行銷分析(四)

談到RFM分組，一般常見為五等分，將客戶分成5×5×5 = 125等級中，如下所示。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：統計應用專題

▲top

Apr 11 Mon 2016 09:16
用SPSS來作RFM行銷分析(三)

前二篇「用SPSS來作RFM行銷分析」主要偏重技術面，本篇改用商業問題解決的應用角度來談RFM。

首先談一個常見的概念，許多行業有「80%收入來自20%的客戶」的特性，所以在作銷售預測時，透過購買量的記錄，來辨別未來重要客戶，便成為理所當然的事。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：統計應用專題

▲top

Apr 01 Fri 2016 15:24
數據話第4集~威力強大的SEM

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：數據話視頻

▲top

Mar 28 Mon 2016 09:12
傾向分數配對（Propensity score matching）軟體大PK（下） ~晨晰統計林星帆顧問整理

<精確配對（Exact match）>

精確配對指的是指定治療組（treated）與對照組（untreated）的某個變項的分配（或比例）要一模一樣，通常都是類別變項（Categorical variable），最常見的就是性別，亦即指定男性必須配男性，女性就配女性。R與NCSS的傾向分數配對的操作介面皆有提供精確配對的選項，但是SAS卻沒有，而是要透過自己修改Macro（巨集）加以指定對某些變項精確配對。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()

個人分類：研究方法

▲top

Mar 21 Mon 2016 10:34
傾向分數配對（Propensity score matching）軟體大PK（上） ~~晨晰統計林星帆顧問整理

在非隨機分派的觀察型研究中（Non-randomized observational study），如果欲比較介入或處置的效果（Treatment），在研究上的最大威脅就是選擇性偏差（Selection bias）的問題。對此，傾向分數配對（Propensity score matching）已被證實是最有效的工具，並且已經廣為使用。

本篇文章並未嘗試介紹傾向分數的原理與使用方式，而是在介紹目前較受歡迎的幾個統計軟體之間的比較。若對於傾向分數想要深入認識者，可參考以下兩篇論文。其中Rosenbaum（1983）年的論文是經典文獻，在Google scholar上的引用次數已經超過14,000次；而d’Agostino（1998）則是一步一步教學且實務理論兼顧的教學文章。

(繼續閱讀...)

晨晰部落格新站發表在痞客邦留言(0) 人氣()