公告版位
晨晰統計顧問有限公司在新北市板橋\服務市話:02-29602817\手機:0918-276-622\信箱:raising.statistic@gmail.com\網址:http://www.rai-stat.com.tw


晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

          本篇為Power BI 模板來源介紹系列的第二篇,這次介紹的是微軟跟Intel合作,在中國舉辧的視覺化比賽(大陸地區叫可視化大賽)。這個比賽從2017年起,每年舉辦可視化大賽吸引各方Power BI好手互相交流,至2022年止,已舉辦了5屆,由於提供3C獎品,每次都吸引100多個作品參賽,2022年參賽作品更來到200多個。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()


晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

前陣子遇到一個諮詢問題,有些變項因為不同組別的標準不一樣,在做分析時會先按照個別的標準轉換成新的變數,再利用此變數進行後續的統計分析,譬如說男女性的腰圍,通常男性的標準範圍為小於90公分,而女性應小於80公分,因此都會先依照標準轉成二元變數後,再進行統計分析,但如果今天我們想利用原始的測量數據來分析,又該如何處理呢?答案很簡單,不同組別進行個別的標準化。

變數的標準化以公式來說,首先要求出該變數的平均數與標準差,接著讓樣本減掉平均值後,最後再除以標準差即可,不過在SPSS裡更為簡單,我們只需要透過描述性統計分析的功能,進一步把標準化的變數儲存下來。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()


晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在生物醫學統計中,多變項迴歸(Multivariable regression)是極為重要且常用的分析手段,其指的是迴歸方程式中,同時有 2 個或 2 個以上的解釋變項,反應變項(Response variable, Y)則可能是各種尺度的變項,常見的有線性(連續變項)、二元、計數與存活資料等,分別適用線性迴歸(Linear regression)、羅吉斯迴歸(Logistic regression)、卜瓦松迴歸(Poisson regression)及Cox比例危險模型(Cox proportional hazard model)等。

多變項迴歸分析在研究目的上,大致上可以區分成兩大類,第一:當該結果變項(Outcome)的危險因子已被充分研究過,而我們試圖證明某個變項(例如:檢驗值、狀態或治療)可能是新的危險因子。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

                  我在晨晰統計公司開的Power BI課程,多以模板為教學材料,這是因為套用模板好處很多,一是提高BI報表質感,二是加快開發速度,三是學習新的技巧(可搜尋快速套用Power BI模板的祕笈這篇文章)。至於模板來源,我在7個線上最受歡迎的模板(,)文章中,有推薦微軟的Data Story Gallary。這裏常有神人出沒,有很多非常酷炫的BI圖表,這對於想要設計出超凡作品,參加BI創作比賽的人,是一個絕佳的參考。不過它的缺點是不一定有原始pbix檔,而且若只是一般職場工作,可能需要較為實用報表。因此,我打算推出一系列文章,介紹更多實用的模板來源,並下載幾個模板作評論。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

Immortal time bias(不死時間偏誤)在早期的醫學文獻稱之為存活偏差(Survival bias),最早於 1993 年從知名醫學雜誌《Lancet》發表過一篇短文,這是醫學文獻中首次標題出現「Survival bias」的出版品,當時有一系列的個案控制研究(Case-control study)指出,抽煙是阿茲海默症的(Alzheimer’s disease)保護因子,這意味著抽煙對於腦神經系統是有保護的1

但該文作者提出這很可能是存活偏差所造成,因為抽煙者的死亡率一定會比非抽煙者高上許多,因此在個案控制研究往過去回溯受訪者的抽煙狀態時,已經死掉的人是沒機會進入到研究的,而因為基因上面的差異,很可能阿茲海默症的個案組與沒有罹病的控制組在這個比例(因為抽煙而先死亡,來不及進入研究收案)是有差異的,而這個差異如果能夠在統計上校正,作者相信原本「抽煙是阿茲海默症的保護因子」的論述會不攻自破。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()


晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

 

這篇要介紹的是SPSS中一個資料處理的功能-分割檔案(Split Files),當研究者需要針對一筆資料中的不同組別來進行相同分析時,就可以使用此資料處理功能,譬如說在分析人口學變項的敘述統計時,除了針對全體對象以外,還想針對男性或女性個別檢視,我們有三種作法,第一種方式是將原始檔案依組別拆開另存新檔,形成男性一個檔案,女性一個檔案,再開始個別檔案進行分析;第二種方式是在原始檔案中,利用以前教學過的篩選條件,先篩選男性樣本進行分析後,再改篩選女性進行分析;第三種則是本篇的主題,分割檔案(Split Files),透過指定變項進行檔案分割後,所有分析都會以各組別的結果輸出,因此分析只要做一次,不用重複進行,否則今天若有一筆全國資料,需要針對不同縣市個別進行,若採用前兩種方式處理,那麼同一種分析就得進行22次。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

Close

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

reload

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼