公告版位
晨晰統計顧問有限公司在新北市板橋\服務市話:02-29602817\手機:0918-276-622\信箱:raising.statistic@gmail.com\網址:http://www.rai-stat.com.tw

在資料科學的領域中,資料的處理大致是下圖的流程,從匯入資料、資料前處理(TidyTransform)、資料的探勘(視覺化:visualise、建模:model)、數據呈現。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

一   緣起:

筆者最近跟公司同事一起開發了一個網站 ”Stock buyer”,顧名思義,就是用來股票買賣的參考工具,有鑑於台股總開戶的人數從過去2015年961萬人到2020年1,124萬人,每一年新開戶的人數逐年的快速增加,特別是近幾年,每年都以一倍的人數增長,特別是20-30歲的年輕人增長的比率最快,剛好也是筆者這個年齡層。坊間也許多手機的app可供查詢股票合理價格,但鮮少有網頁版本可用,因此筆者跟同事們從台灣證券交易所、公開資訊觀測站透過Python去爬蟲所需的資料,加以整理與應用,開發了目前的”Stock buyer”網站version 1。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在做研究的過程中,最重要的就是如何透過表格以及圖形呈現重要的研究結果發現,在醫學研究的論文中,一般而言,表一(Table 1)都會先呈現研究族群的基本資料,因為大多數的研究幾乎都會需要表一,但如果是人工把分析的數字貼到word上再加以整理,難免會有貼錯的狀況,如果表格內容較多的時候可能一眼也不容易檢查出來,這樣會造成一些不必要的錯誤。

所幸有厲害的開發者Kazuki YoshidaR上面開發了一個package “tableone”,讓使用者可以快速的製作表一而不出錯,tableone可以應付常見的表一分析,筆者這次先示範產生不分組描述性統計的結果,之後會再針對分組比較的分析做進一步的說明跟示範。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

當研究所寫的文章是要用來投稿時,除了需要提到所使用的軟體以外,另外也要針對軟體的部分加以說明,包含軟體的版本,發行時間,機構名稱,以及城市/國家,因為最近剛好遇到客戶有這方面的需求,所使用的軟體為SPSSAMOS,我想大家的版本應該都有所不同,因此搜集了一下資料,分享給大家做使用。

首先是SPSS的部分,由於SPSS2009年時被IBM收購,因此在這之前與之後就會出現兩種格式的分水嶺,在收購前的18版本以前,屬於SPSS公司發行,而19版之後,則是IBM公司發行,以下是IBM官網中所提供引用寫法

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

六、如何決定軌跡的形狀與數量(Andruff’s tutorial

2009 年時,Heather Andruff 發表了一篇非常清楚的 GBTM 教學文章,裡頭也是使用 Bobby Jones 撰寫的 SAS procedure 進行示範3。在該文章中,Andruff 提出了他們的實務經驗操作流程,主要有兩個重點。第一,應該要剔除模式中不顯著的二次方項或三次方項,一次方項(線性效果)則無論顯著與否都應該保留;第二,每一個軌跡組別最好要有至少包括 5% 的人數。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

                     在臨床研究中常見重複測量的資料,或稱為縱貫資料(longitudinal data),而用來分析縱貫資料的分析方法有許多種,當代主流的分析方法有(1)混合模式(Mixed model)或稱為隨機效果模型(Random effect model/多層次模型(Multilevel model)以及(2)廣義估計方程式(Generalized estimating equation; GEE),此兩種分析方法在過去晨晰統計部落格已有許多介紹,有興趣的讀者可以搜尋相關文章。

一、使用 GBTM 的時機

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

想上POWER BI課程嗎??

報名網址:https://www.rai-stat.com.tw/#row2

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

每當評估一個新的案件,當然是直接翻到第三章的研究方法,除了看看研究架構與假設之外,還要看一下使用的統計方法,關於護理領域的研究,根據多年的經驗,主要的設計有兩種,一種是實驗研究,近期最多人使用的,就是利用廣義估計方程(Generalized estimating equation, GEE)探討介入的效果,另一種是關聯性研究,瞭解變項之間的關係,統計方法不外乎就是卡方、獨立tANOVA,最後再迴歸分析為主軸作為收尾,固定的統計方法卻能讓論文一直不斷被產出,除了因為樣本的多樣性與特殊性之外,另一個極大的優勢,就是有非常多已經發展具有信效度的研究量表,這將為護理研究人員省下許多的時間與精力。

如果您對於上述的統計方法都做到膩了,不如嘗試比較進階一點的結構方程模式(structural equation modeling, SEM),這裡講的是較進階,並不是較新,畢竟結構方程SEM算是比較有資歷的統計方法了,您或許會有疑問,為什麼沒聽過,這也是我的疑問,因為我也很少遇到護理研究有使用,所以推薦給你們,另外搭配軟體AMOS,您一定會很意外,這好像也沒有很困難。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

複選題分析

36)開始進入分析,利用SPSS讀取已整理好的複選題資料

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

資料處理方法二

不同於上一種方法,此種方式是透過函數來判斷,雖然比較困難,但如果能熟悉此作法,就算選項不多,一樣好用。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

Close

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

reload

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼