公告版位
晨晰統計顧問有限公司在新北市板橋\服務市話:02-29602817\手機:0918-276-622\信箱:raising.statistic@gmail.com\網址:http://www.rai-stat.com.tw

繼上篇分享了進行迴歸分析時所做的殘差診斷後,這一篇來講一下另一個做迴歸分析時老闆們更愛的東西-多元共線性診斷。無論進行線性迴歸或是羅吉斯迴歸,當自變項個數在2個以上時,而自變項之間的相關性比較高的時間,就有可能存在共線性的問題,而當共線性問題很嚴重時,我自己的經驗就容易出現以下幾種現象:

1)多自變項與依變項的相關性非常顯著,但迴歸分析出來的所有結果都不顯著。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

每個統計分析背後總是存在一些假設,當這些假設違反時,就有可能產生偏誤的結果,而在實務的應用上,您應該會發現每篇文章在這些假設性的檢驗都很少出現,不過偶爾還是會遇到客戶的老師要求,在2016年時曾經介紹過「迴歸分析之殘差基本假設-SPSS為例」,這一篇將以此為例來說明操作步驟,包含常態性、變異數同質性、獨立性。

1)點選「分析」→「迴歸」→「線性」

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

筆者在之前的文章(機器學習-Bias-Variance Tradeoff)有提到處理Overfitting的方式可透過Ridge regression, Lasso regression來去處理,本次文章主要會簡介這兩種方法的差別

一、Lasso regression

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在本系列前一篇文章中,筆者介紹了傳統方法的基本作法,接著在本文中將介紹當代的主流方法(最主要會介紹兩種:雙變量模型與階層模型),以及說明這些主流方法可以克服哪些傳統作法不合理的假設。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

統合分析(meta-analysis)普遍被應用在各種學科與領域,然而其中診斷型統合分析(meta-analysis for diagnosis)這個分支,無論在方法學的開展或普遍性的應用都是以醫學領域為主,主要用在於一個「標記」(marker)對於一個疾病或狀態(通常是二元變項)的區別/鑑別能力(discrimination)的評估。

下圖列出在 PubMed 搜尋診斷型統合分析的相關論文,很明顯發表的文章越來越多,顯示此方法的重要性。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

信效度是在寫論文時,最容易卡關的第一個統計問題,因為常常做出不符合預期的結果,為了能夠趕畢業,總是有人省略這一步驟,我的客戶就不在少數,等全部統計做完後,再回過頭來處理信效度的部分,如果很幸運得出良好信效度的結果也就沒事,但如果過程中需要刪除題目,那後面已做完的統計分析就得重來,千萬別再問我怎麼辦了。

那什麼是信效度,透過鏢靶圖就可以很容易的瞭解定義,假設內圈3圈是我們的目標…

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

有在進行學術研究的人應該都不陌生影響因子(Impact factor)這個指標,在搜尋論文的時候除了尋找與自己研究主題有關的外,有時候也會考慮論文刊登的期刊在那個研究領域的重要性與排名,筆者最近在搜尋論文的影響因子的時候發現到這個有用的網站(https://academic-accelerator.com/Review-Speed/zh),想跟各位讀者分享,這個網站主要整理了SCISSCI期刊的影響因子以及相關的資訊,並透過一些簡單的視覺化呈現,讓讀者可以很快的了解不同期刊在其研究領域的重要性,以及歷年影響力的變化情形等,可給予研究者在搜尋文獻以及之後的投稿有很大的幫助。

以下內容為筆者實際的搜尋過程:

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

Microsoft的資料儀表板軟體Power BI Desktop每個月都會更新一次,頻率算是快的,我有時一忙2~3個月沒有追踪update,都會被它的新科技嚇到,直呼「什麼時侯多了這功能?」。所以現在,只要有網友或同事詢問,Power BI可不可以作到某某功能,我都不敢直接回答沒有,因為更新速度實在太快了。

今天要介紹的是2019高雄MIZUNO馬拉松儀表板(註1)中所使用的一項「黑科技」,即Power BI Desktop 2018 3 月版本開始,正式推出的書籤」功能。雖然這已是整整二年前推出的功能,但對於Power BI中度以下使用者,仍很少人知道這項功能,加上它的名稱書籤」平淡無奇,很難讓人印象深刻。但是它的妙用可大了!!這裏介紹它的最大賣點——講故事功能。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在各類的醫學量化研究中,資料集中含有遺漏值(missing value)幾乎是無可避免的狀況。關於遺漏值的機制(mechanism),可分成三類:(一)Missing completely at random (MCAR)、(二)Missing at random (MAR) 以及(三)Missing not at randomMNAR)。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

筆者最近在coursera這個線上學習平台學習機器學習的課程,在機器學習實作的練習中,有用到一個Octave語言,想跟各位讀者分享,Octave是一種採用進階程式語言,主要用於數值分析的軟體,可用於解決線性和非線性問題,Octave語言其實可以把它當作MATLAB語言的替代版本,很多功能都跟MATLAB類似,但相較於MATLAB主要有幾個優點:

  1. 免費安裝(https://ftp.gnu.org/gnu/octave/windows/)
  2. 安裝容量較小(最新版本: 5.2.0, 1.71G)MATLAB全模組約13G

稍微介紹了一下Octave後,來介紹一下Octave的實際操作,當我們透過Octave的網頁下載程式後,安裝完成後,打開後會出現以下的畫面,跟Windows內建的命令視窗類似。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼