之前晨晰統計的課程,有一堂透過SPSS進行傾向分數配對的教學,主要是利用SPSS安裝R Essentials,就可以透過R套件進行傾向分數配對分析,不過後來遇到一個問題,就是SPSS與R的版本之間會有相容性的問題,導致無法進行分析,當然您也可以透過其他軟體來進行分析,可以在我們部落格裡搜尋關鍵字”傾向分數配對”找到相關文章(如下圖),不過後來IBM SPSS有把這個功能收錄在SPSS的資料處理裡,這邊文章就來教大家如何使用。
之前晨晰統計的課程,有一堂透過SPSS進行傾向分數配對的教學,主要是利用SPSS安裝R Essentials,就可以透過R套件進行傾向分數配對分析,不過後來遇到一個問題,就是SPSS與R的版本之間會有相容性的問題,導致無法進行分析,當然您也可以透過其他軟體來進行分析,可以在我們部落格裡搜尋關鍵字”傾向分數配對”找到相關文章(如下圖),不過後來IBM SPSS有把這個功能收錄在SPSS的資料處理裡,這邊文章就來教大家如何使用。
當我們收集完資料並完成建檔後,在分析之前,一定要確實做到檢查的工作,檢查的重點,包含了數值的合理性,以及變數的遺漏狀況。我們用的分析方法,是最簡單及最常見的次數分配與描述性統計量,沒錯,只要分析有做到敘述統計的話,大致上都能檢查到資料的問題,下面我們將這些問題整理出來。
利用敘述統計探視變數的遺漏狀態:
當我們收集完資料並完成建檔後,在分析之前,一定要確實做到檢查的工作,檢查的重點,包含了數值的合理性,以及變數的遺漏狀況。我們用的分析方法,是最簡單及最常見的次數分配與描述性統計量,沒錯,只要分析有做到敘述統計的話,大致上都能檢查到資料的問題,下面我們將這些問題整理出來。
利用次數分配找到輸入錯誤的變數:
支持向量機(Support Vector Machine,SVM)是一種常見的機器學習演算法,主要用於監督式學習的二元分類問題。關於監督式學習是甚麼東西,可參考筆者過去寫的文章說明(https://reurl.cc/jDk4QD),SVM的基本想法是在數據點之間找到一條最優的超平面,如圖表 1的黃線,將不同類別的數據點分開,以達到分類的目的。