為了在R上面執行Adaboost的方法,我們首先要在R studio上先下載”adabag-package”,並載入晨晰部落格新站 發表在 痞客邦 留言(0) 人氣(357)
近期受託處理客戶申請的臺灣人體生物資料庫全基因體定型資料(Whole-genome genotyping),此資料庫研究個案計27000人;欲納入檢驗之情感性精神疾患相關基因序列亦有近13000組。我們在不斷試誤此研究個案甚多、檢驗變項也甚多的資料後,深感精煉精確的建置統計語法的重要性,在此分享我們的分析經驗,提供大家後續面對大筆資料時可以使用有效率且節省系統資源的處理方式。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣(199)
在上一篇文章中,筆者介紹了雙變數的趨勢分析(Bivariate analysis / univariate analysis
)的SPSS
操作程序與報表解讀,不過當我們要考慮控制變項(Control variable or covariate
)時,就必須使用多變項分析(Multivariable analysis
),本篇文章將介紹在調整其他變項效果之下的趨勢分析。晨晰部落格新站 發表在 痞客邦 留言(0) 人氣(6,283)
筆者在不久之前簡介了「P trend
」(趨勢分析)的應用時機與基本概念(http://goo.gl/CjfyWf),受到不少讀者的迴響,並且希望可以示範統計軟體的實作,因此本篇文章先以雙變數分析(Bivariate analysis / univariate analysis
)為例,以SPSS 22
版操作並且簡單解讀結果。晨晰部落格新站 發表在 痞客邦 留言(5) 人氣(17,296)

我在前一篇「用SPSS來作RFM行銷分析(一)」中舉的例子是用交易資料,即每一筆是一次交易,故可能多筆是屬於同一客戶的。如果已經將同一客戶的多次加總綜合成一筆,則為用客戶資料。如下圖所示。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣(1,795)
上次提到使用NodeXL分析email來往狀況,這次筆者繼續來分析台灣健保資料庫研究的熱絡狀況。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣(853)
柯文哲打贏了台北市長這漂亮的一仗,很多人都在傳他是依靠大數據分析,精準的做出諸多正確的反應與決定,據說他將來治理台北市也打算依靠大數據分析來協助決策,一下子數據分析好像變得很火很牛,大家都想要來應用一下跟上時代的腳步。
大數據分析可以幫助精準預測這是無庸置疑的,國外有許多成功的實例可以參考,但老實說就算不要加入複雜的運算,網路上大眾聚焦熱烈的議題,以及掌握主流民意的想法有那麼困難??
只要常常去幾個熱門的論壇爬爬文,細讀鄉民的回應,掌握個7
、8
成正確也是輕而易舉的,為什麼大家不做,甚至政府不做??
回頭看我們第一線在接觸的商業客戶,瞭解她們需求的同時,發現真正想用數據來瞭解問題,用數據來精進管理的比例實在低的可憐,90%
客戶都是把數據分析用來消化多餘的預算,或是做一份報告交差,這種輕忽數據的態度,才是我們的國家與產業真正的問題。晨晰部落格新站 發表在 痞客邦 留言(0) 人氣(1,336)
之前針對於探索性因素分析(Exploratory factor analysis, EFA)我已經寫過不少篇文章在介紹其使用時機、注意事項及其與驗證性因素分析(Confirmatory factor analysis, CFA)的不同,不過在實務上我們有協助一些學術研究者處理因素分析的結果,接著作後續的分析並且投稿,因此也接受到不少審稿者的意見與質疑,本篇文章擬將這些常問到的問題作個整理,提供給各位讀者做為未來投稿時呈現因素分析結果的參考。晨晰部落格新站 發表在 痞客邦 留言(1) 人氣(9,888)
最近去參加了聯合通商公司(和碩集團子公司)舉辦的產品說明會,想要了解一下如何在商業領域應用統計分析來協助決策,說明會的地點舉辦在遠東國際飯店的洛北園,場地十分高雅,大約可以坐50人,當天也是坐的滿滿滿,看來的確有許多商業人士對這一塊有興趣。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣(704)
8/7日,我參加了由奇美醫學中心舉辦的一場有趣的研討會,主題是「如何利用Rasch分析發表SCI(註1)論文(http://www.healthup.org.tw/rasch/)」,這對還在與博士論文或教授升等搏鬥中的人來說,這個絕對是一個很吸引人的研討會。有趣的是,這樣的研討會不是應該由大學或計量研究中心等學術機來辦才對嗎?怎麼會是醫學中心來辦呢? 晨晰部落格新站 發表在 痞客邦 留言(6) 人氣(3,556)