公告版位
晨晰統計顧問有限公司在板橋~~服務市話:02-29602817 手機:0918-276-622 聯絡信箱:raising.statistic@gmail.com。 網址:http://www.rai-stat.com.tw。 歡迎大家踴躍發問,問問題請用facebook問(http://tinyurl.com/raising100)會快速回覆喔,我們每週才會統一回一次部落格上的問題。

大家好,如果你是數據話的忠實觀眾,本集(數據話第十七集)我們改變一個方式,看看別人怎麼說。

有位Youtober 叫Curbal(訂閱數8596 at 2018/4/3),錄了一段視頻,標題是「How to connect Google Sheet with Power BI」(如合連結google表單與Power BI) https://www.youtube.com/watch?v=2hFCeduIP6k ,時間不長才5分鐘,請先看完。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

  呈上個章節簡單介紹觀察型研究中的存活偏誤(Survival bias),本章節導讀文獻中提出的常見的5種研究設計方法,前2種會受到存活偏誤(Survival bias)影響,導致研究結果產生傾向於某一方有優勢,後3種為控制存活偏誤(Survival bias)的研究設計方法,以下將逐一介紹。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

  觀察型研究中,由於介入/治療行為並非由研究者施予及分組,非受試者與受試者在受到其他許多背景、環境等因素操弄之下,而形成他們在研究中被觀察到的組別或治療型態。而醫學研究中,常見的觀察性研究資料類型多數為病歷回顧或是資料庫形式。當研究者從現有的資料集中萃取研究個案將其分組,並觀察追蹤期間的結果時,會因為【分組】這個動作而產生存活偏誤(Survival bias),或是不死的時間偏誤(Immortal time bias)。舉例來說,研究者從現有資料庫中篩選出一群急性心肌梗塞(AMI)的病人,看病人出院後90天內的Statin藥物使用狀況,將病人分成Statin組跟Non-statin組,並觀察病人從AMI出院之後發生AMI再住院或死亡的風險。這看似順風順水的研究設計,潛藏著一個干擾觀察結果的偏誤(bias),出院後90天內因為有使用Statin而被分到Statin組的人,從病人出院到使用Statin的這段時間是保證存活(意即活著的人才有機會被開Statin),因為死亡而來不及使用Statin的人就會被分到Non-statin組。在比較Statin與Non-statin組在AMI出院之後的AMI再住院與死亡時,就可能會發現Non-statin組死亡率比較高且AMI再住院率比較低,這是因為死亡而來不及用藥的人都在Non-statin組,而死亡的人也比較不容易被觀察到AMI的再住院,這個現象就稱為不死的時間偏誤(Immortal time bias)。

  流行病學研究設計中,有幾種處理不死的時間偏誤(Immortal time bias)的方式,以下援引American Journal of Epidemiology於2005年介紹的5種研究設計方式,其中方法1跟方法2都是會強烈受到偏誤(bias)影響研究結果,而方法3~5則是控制偏誤(bias)的方式,下一章節將逐一導讀介紹文獻中的5種研究設計方法,以及這5種研究設計之下對結果產生的影響。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

接續「Power BI學習心得分享一」,本篇介紹資料表關聯

Power BI有所謂的建立資料模型(Modeling),乍看不知何意,其實就是建立資料表之間的關聯性。因為實務上,資料表可能來自不同來源,比如訂單資料來自業務部,人事資料來自人事部,廠商資料來自採購部,各自維護更新,當需要分析時再串連一起。又如同樣是紀錄廠商資料,會計部重點在統編、銀行帳戶、匯款紀錄、發票地址等,而採購部重點在產品型號、價格、數量等,平常各自為政,當需要串連時,就要用到資料表關聯。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

  延續上一章節,本篇將透過官方範例檔,簡介程序實際操作的狀況,以及程序指令代表的意思。

  首先,下圖列出範例檔案的前10筆觀察值。StudentID為收案編號;Music在此作為研究組別,分為YesNo兩組,在此Yes組視為治療組(Treated)No組視為對照組(Control)Gender為類別型共變數;Absence為連續型共變數。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

(2018)3月上旬參加數位時代所舉辦的「PowerBI圖像式資料分析」,雖然只有短短一天的課程,但對於在資料視覺化領域鑽研一段時間的人來說,仍可以有相當大的幫助。

話說微軟因應大數據分析需求,從Excel 2010開始,逐步增加各種增益集,像Power PivotPower ViewPower QueryPower Map等四大天王,給予使用者自助式商業智慧功能。到了Excel 2016,這些功能變為內建,使用更為方便(後二者更名為「新查詢」、「3D地圖」)

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

  近幾年已有越來越多醫學研究的研究設計採用配對法比較試驗組與對照組的差異,在眾多配對方式中,本篇文章簡單分享筆者較為常用的配對方式。

  在觀察型研究中,為了提升試驗組與對照組之間的可比較性(Comparability),將兩組的背景干擾變項(例如:年齡、性別、共病等)作配對,使兩組在試驗介入以外的其他變項達到均衡。配對後的兩組便能在假設無其他因素干擾之下,比較試驗介入本身對觀察結果的影響。當然,此項假設是理想的假設情境,實際上,配對只能考慮研究者有納入配對的變項,因此配對後的兩組只會在有配對的變項上達到平衡,研究者沒有考慮到的因素可能還是分佈不均衡的。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

完成對處置變項的羅吉斯迴歸之後,根據每個個案的基本特性(年齡、性別與共病狀況)會得到預測機率,即此人成為治療組的機率。在接著往下進行傾向分數的分析之前,要先評估治療組與控制組在傾向分數的分布情形。可以使用兩種方法來判斷,第一種是畫圖,第二種是看C-statistics(即C-indexAUROC)。C-statistics代表的是預測變項對處置變項(1=treated, 0=untreated)整體的區別力,0.5為完全無法區別,1代表完美區別。

下圖列出傾向分數可以非常有效區分治療組與控制組的結果,兩組在傾向分數的分布截然不同,而且重疊區域很少(中間灰色底的common support),這種狀況是很難進行後續的傾向分數分析的,不管進行任何一種傾向分數分析,都無法有效降低混淆因子的效果。當出現這種情形時,檢查是否有對處置變項的強烈預測變項,例如「有洗腎的病人一定不會開Metformin」或是存在工具變數。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

在現今的醫學研究中,傾向分數分析(propensity score analysis, PSA)儼然扮演非常重要的角色。下圖為筆者在Pubmed以關鍵字「propensity score」搜尋得到的文獻筆數,由結果可知,以傾向分數作為研究方法的文獻呈現非線性的增加,到了2017年,單年度超過3千篇文獻使用傾向分數,可見傾向分數已為醫學研究當中的顯學。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

本篇文章將介紹針對結構方程常用的配適度指標作介紹,除了整理各指標的判斷標準及參考文獻之外,亦針對一些特殊的情況進行說明。

九、比較性配適指標(Comparative fit index, CFI

CFI類似於NFI,但對樣本數有加以懲罰,因此CFIRMSEA一樣較不受到樣本數大小的影響(Fan, Thompson, & Wang, 1999),即使在小樣本之下,CFI對模式配適度的估計表現仍相當好(Bentler, 1995)。CFI介於0~1之間,CFI指數越接近1代表模型契合度越理想,表示能夠有效改善中央性的程度。傳統上認為CFI0.9以上為良好配適(李茂能,2006;陳正昌、程炳林、陳新豐與劉子鍵,2003;張偉豪,2011)。而有學者認為要以大於.95為通過門檻,用來評估模式適配度才夠穩定(Bentler, 1995; Hu & Bentler, 1999; 邱皓政,2011),但1不代表是完美配適,只代表模型卡方值小於假設模型的自由度。CFI在巢型結構中也是個常用的指標,巢型結構模型中CFI差異的大小決定模型是否不同(Cheung & Rensvold, 2002)。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼