公告版位
晨晰統計顧問有限公司在新北市板橋\服務市話:02-29602817\手機:0918-276-622\信箱:raising.statistic@gmail.com\網址:http://www.rai-stat.com.tw

下方的DM是晨晰2021即將舉辦的三種統計課程,請大家參考之後到我們公司網站上線上報名即可,今年比較特別的是試辦兩堂線上課程,觀察看看上課的成效如何,畢竟網路上課應該是未來的趨勢,希望大家可以踴躍報名參加。目前我們的課程都是小班制而且不增班,如果有興趣的好朋友們可以提早報名,學術研究的路上你需要推你一把的好夥伴

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在醫學統計的領域中,針對信度的分析,若研究者有一個新的測量工具想與黃金指標(Gold standard)或是過去常用的測量工具進行比較時,我們一般希望新的方法與黃金指標(Gold standard) 或是過去常用的測量工具兩者之間具有相當程度的一致性(agreement),這樣才能證明新的測量工具具有一定的準確性。當針對類別型資料(categorical data),實務上最常使用的是 kappa 統計量,計算方式如下:

如表格所示,假設今天研究者想比較新工具與黃金指標工具在測量上的一致性,藉以用來作為新工具是否能用於實務上的標準,因此蒐集了兩種工具使用在同樣條件(協助測量的人、測量的時間等等非隨機因素)下,針對同一群人進行測量的結果。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

微軟的Power BI身為資料視覺化之王,連結各種資料庫的強大能力早已不是新鮮事;而GA作為google的主力產品,也已建立了廣大使用者與分析服務的生態系。那麼二者強強結合,激盪出的火花,想必非常精彩。今天我要來介紹一個在Power BI.com上的AppGA模板,讓你可以輕鬆使用Power BI的強大圖像,提供你有別於googleGA儀表版。

首先,你必須有Power BI Pro帳號,如果沒購買,可以申請試用60天。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

貳、用重新編碼(recode)處理分組問題

操作步驟(年齡分三組à年齡分兩組)

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

貳、用重新編碼(recode)處理分組問題

     最常出現的兩種情況,原本的欄位屬於開放題,譬如說年齡,因應研究需要而分成N組年齡層,如畫面中的age,依照15歲以下、16-20歲、21歲以上分成三組,形成變項『年齡分三組』;另一種情況,原本已經分組的變項,可能某一組樣本數較少,而併入其他組別中,如畫面中的年齡分三組,試圖將15歲以下、16-20歲合併成一組,成變項『年齡分兩組』,分別為20歲以下與21歲以上。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

     執行量化分析的過程,應該是資料輸入à資料清理à資料處理à資料分析,資料輸入是將紙本的資料轉換為數位化的過程,隨著網路問卷越來越多人使用,或許有些研究者可以略過這一步驟;再來是資料清理,必須把資料整備到可以分析的狀態,包含定義廢卷、處理異常值、量表遺漏值、邏輯性;接著是資料處理,根據研究問題與假設,把需要用到的變數建立出來,通常會使用兩大功能,重新編碼(recode)與計算(compute);最後就可以開始分析。

     公司部落格的過去文章,其實包含了很多統計方法的介紹,或是操作的說明,資料處理也有,但多數是些比較特殊的狀況,今天我們就回過頭來,學學這簡單且重要的處理技能。一般問卷調查最常出現的設計型態,就是放上一些個人背景變項的題目,以及用兩三個量表去收集受訪者的心理特質,只要是這樣的設計,那重新編碼(recode)與計算(compute)就一定得用到,這邊我們定義成三種情形,(一)用重新編碼(recode)處理反向題轉向計分;(二)用重新編碼(recode)處理分組問題;(三)用計算(compute)產出因素或量表總分。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

筆者最近經常會在機器學習的課程中聽到Tensorflow,為了滿足自己的好奇心,就搜尋了一下這個單字,結果發現TensorFlow是一個機器學習框架,如果使用者有非常多的資料就可以透過TensorFlow快速的訓練一個有用的模式(例如:利用類神經網路做文字的辨識)。TensorFlow是一個開源軟體庫(2015年開始使用),用於各種感知和語言理解任務的機器學習。目前被50個團隊用於研究和生產許多Google商業產品,如語音辨識、Gmail、Google 相簿和搜尋,其中許多產品曾使用過其前代軟體DistBelief (2011年開始使用,它是Google推出的第一代內部深度學習框架,能夠幫助Google利用自家的數據中心構建大型的神經網絡)

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

            "日期表"90%以上Power BI資料模型(Data Model)中不可或缺的元素,舉凡你的資料為客戶管理、業務銷售、廣告促銷、股票資訊、流量分析、財務交易、進銷庫存、學習歷程、重複測量等,都可能包含了日期數據,這需要連結到一個完整的日期表,叫用日期的不同屬性。例如,比較週一至週日,哪一天的銷售最好,就需要叫用日期表的星期欄。

完整的日期表,包含了各式各樣的日期欄位資訊(年、月、日、周等),與主要事實表建立關聯後,前述欄位資訊就能夠被數據模型輕鬆叫用!創建日期表有以下幾種常規方法:

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

不知大家面對SAS產生的報表是用何種方式整理的呢?土法煉鋼式地用複製貼上嗎?如果要跑的結果變項甚多、或是分析條件前後修改多次,每次都要再重新複製貼上,寶貴的時間就這麼浪費了呀!在此介紹SASODS語法,善用下述技巧,一定能讓您的報表整理更有效率!

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

筆者前一陣子有遇到一個分析的案子,這個案子很特別,收集資料的方式是以季為單位,每一個有乾癬診斷的病人,會去收集以乾癬診斷的那一天開始起算,往後追蹤每一季的資料,因此每個人的資料筆數為每三個月一筆,直到2013/12/31或是退保日期(死亡)為止。因此這個資料的筆數相當的驚人,假設某個病人從我們資料中最早的2001/1/1開始往後追蹤,中間都沒發生死亡,因此這個病人最多會有52筆資料(一年有四季*13年的追蹤),實際上,我們這個資料最後的筆數將近400萬筆資料,這應該也稱得上是所謂的大數據(Big data)了吧!

為了幫助讀者理解資料的長相,如下圖所示,每一筆的資料其實是一季的收集,以第一個人為例,這個人在13年的追蹤過程中,共有8筆(8季的資料)。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

Close

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

reload

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼