公告版位
晨晰統計顧問有限公司在板橋~~服務市話:02-29602817 手機:0918-276-622 聯絡信箱:raising.statistic@gmail.com。 網址:http://www.rai-stat.com.tw。 歡迎大家踴躍發問,問問題請用facebook問(http://tinyurl.com/raising100)會盡量回覆!

Power BI資料視覺化系列5中,介紹了資料表(Tables)的功能,這裏進一步介紹矩陣(Matrixes)。

矩陣與資料表最大的不同,打個比喻:資料表類似原始資料表,每一直欄為一個屬性(或變項),橫列數即為資料筆數,它其實像是原始資料的呈現視窗。而矩陣則類似交叉表,它是某二變項的交叉,細格中呈現的是個數或平均數。

以下圖為例,這是一個展覽活動的遊客資料。左邊為資料表,展示每每個人前來的次數及交通工具,這時你看到的是每一筆原始資料;右邊則是矩陣,它是頻率與交通工具的交叉表,表中的數字是人數,這時你可以看到坐火車前來的225人中,有123人是第1次來。

 

1.jpg

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

資料視覺化原始目的是把成千上萬筆的資料,彙整、計算後呈現在一張圖中,讓我們可以快速看出大小或趨勢關係,獲得資料結果。但是如果我們也想讓使用者同時深入每一筆資料中,細看個案情形,那我們就需要用到矩陣和資料表功能(Tables and matrixes)。

下面是資料表(Tables)的示意圖,我們可以從資料表中細看每一製造商的每一種產品營收,最下方會顯示總和。它有幾個特點:

1.     您可以按一下資料行的標題,切換為遞增或遞減順序,來手動排序每個資料行。è因此可以快速的找到較低或較高的資料

2.     如果資料行的寬度不足以顯示所有內容,請按一下並左右拖曳標題將它展開è讓畫面完整呈現,尤其是在投影簡報或多人討論時,特別有用

3.    如果筆數太多,資料表可以從右方的捲軸,來展示視窗外資料。

 

1.jpg

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

  延續上一章節,本篇將持續透過官方範例檔與示範程式(如下圖所示),簡介程序實際操作之後產出的報表,以及報表中各項目的涵義。  

  執行完上段程序後,首先產出的報表會描述進行傾向分數配對的變數細節(如下圖所示)。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

大家好,如果你是數據話的忠實觀眾,本集(數據話第十七集)我們改變一個方式,看看別人怎麼說。

有位Youtober 叫Curbal(訂閱數8596 at 2018/4/3),錄了一段視頻,標題是「How to connect Google Sheet with Power BI」(如合連結google表單與Power BI) https://www.youtube.com/watch?v=2hFCeduIP6k ,時間不長才5分鐘,請先看完。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

  呈上個章節簡單介紹觀察型研究中的存活偏誤(Survival bias),本章節導讀文獻中提出的常見的5種研究設計方法,前2種會受到存活偏誤(Survival bias)影響,導致研究結果產生傾向於某一方有優勢,後3種為控制存活偏誤(Survival bias)的研究設計方法,以下將逐一介紹。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

  觀察型研究中,由於介入/治療行為並非由研究者施予及分組,非受試者與受試者在受到其他許多背景、環境等因素操弄之下,而形成他們在研究中被觀察到的組別或治療型態。而醫學研究中,常見的觀察性研究資料類型多數為病歷回顧或是資料庫形式。當研究者從現有的資料集中萃取研究個案將其分組,並觀察追蹤期間的結果時,會因為【分組】這個動作而產生存活偏誤(Survival bias),或是不死的時間偏誤(Immortal time bias)。舉例來說,研究者從現有資料庫中篩選出一群急性心肌梗塞(AMI)的病人,看病人出院後90天內的Statin藥物使用狀況,將病人分成Statin組跟Non-statin組,並觀察病人從AMI出院之後發生AMI再住院或死亡的風險。這看似順風順水的研究設計,潛藏著一個干擾觀察結果的偏誤(bias),出院後90天內因為有使用Statin而被分到Statin組的人,從病人出院到使用Statin的這段時間是保證存活(意即活著的人才有機會被開Statin),因為死亡而來不及使用Statin的人就會被分到Non-statin組。在比較Statin與Non-statin組在AMI出院之後的AMI再住院與死亡時,就可能會發現Non-statin組死亡率比較高且AMI再住院率比較低,這是因為死亡而來不及用藥的人都在Non-statin組,而死亡的人也比較不容易被觀察到AMI的再住院,這個現象就稱為不死的時間偏誤(Immortal time bias)。

  流行病學研究設計中,有幾種處理不死的時間偏誤(Immortal time bias)的方式,以下援引American Journal of Epidemiology於2005年介紹的5種研究設計方式,其中方法1跟方法2都是會強烈受到偏誤(bias)影響研究結果,而方法3~5則是控制偏誤(bias)的方式,下一章節將逐一導讀介紹文獻中的5種研究設計方法,以及這5種研究設計之下對結果產生的影響。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

接續「Power BI學習心得分享一」,本篇介紹資料表關聯

Power BI有所謂的建立資料模型(Modeling),乍看不知何意,其實就是建立資料表之間的關聯性。因為實務上,資料表可能來自不同來源,比如訂單資料來自業務部,人事資料來自人事部,廠商資料來自採購部,各自維護更新,當需要分析時再串連一起。又如同樣是紀錄廠商資料,會計部重點在統編、銀行帳戶、匯款紀錄、發票地址等,而採購部重點在產品型號、價格、數量等,平常各自為政,當需要串連時,就要用到資料表關聯。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

  延續上一章節,本篇將透過官方範例檔,簡介程序實際操作的狀況,以及程序指令代表的意思。

  首先,下圖列出範例檔案的前10筆觀察值。StudentID為收案編號;Music在此作為研究組別,分為YesNo兩組,在此Yes組視為治療組(Treated)No組視為對照組(Control)Gender為類別型共變數;Absence為連續型共變數。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

(2018)3月上旬參加數位時代所舉辦的「PowerBI圖像式資料分析」,雖然只有短短一天的課程,但對於在資料視覺化領域鑽研一段時間的人來說,仍可以有相當大的幫助。

話說微軟因應大數據分析需求,從Excel 2010開始,逐步增加各種增益集,像Power PivotPower ViewPower QueryPower Map等四大天王,給予使用者自助式商業智慧功能。到了Excel 2016,這些功能變為內建,使用更為方便(後二者更名為「新查詢」、「3D地圖」)

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

  近幾年已有越來越多醫學研究的研究設計採用配對法比較試驗組與對照組的差異,在眾多配對方式中,本篇文章簡單分享筆者較為常用的配對方式。

  在觀察型研究中,為了提升試驗組與對照組之間的可比較性(Comparability),將兩組的背景干擾變項(例如:年齡、性別、共病等)作配對,使兩組在試驗介入以外的其他變項達到均衡。配對後的兩組便能在假設無其他因素干擾之下,比較試驗介入本身對觀察結果的影響。當然,此項假設是理想的假設情境,實際上,配對只能考慮研究者有納入配對的變項,因此配對後的兩組只會在有配對的變項上達到平衡,研究者沒有考慮到的因素可能還是分佈不均衡的。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼