公告版位
晨晰統計顧問有限公司在板橋~~服務市話:02-29602817 手機:0918-276-622 聯絡信箱:raising.statistic@gmail.com。 網址:http://www.rai-stat.com.tw。 歡迎大家踴躍發問,問問題請用facebook問(http://tinyurl.com/raising100)會盡量回覆!

因素分析是在做量表型研究時,最常用來進行效度分析的統計方法,而因素分析又分為探索性因素分析(Exploratory Factor Analysis, EFA)與驗證性因素分析(Confirmatory Factor Analysis, CFA),因此有兩個常被問到的問題,兩者的差別在哪,以及兩者的使用時機為何,兩者的差異在張偉豪與鄭時宜(2012)一書中有清楚的介紹與彙整,因此本篇也截錄一些重點與大家方享。

探索性因素分析被提出的時間早於驗證性因素分析,主要的目的是在探索一組觀察變項中有多少的潛在因素,其流程是先設定一群觀察變項會受到同一個共同因素的影響,計算其共變程度,再來排除掉共變程度後,再尋找下一個可以解釋剩下共變關係的因素,直到所有變異量被解釋完為止(如下圖左半部),此時所萃取因素的個數剛好就是等於觀察變項的總題數,不過由於多數因素能解釋共變的程度不高,因此就會有許多方式來決定因素個數,譬如說下圖右半部採取特徵值大於一的方式來決定,或是用陡坡圖來決定適合的因素個數。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

 

晨晰統計累積多年在滿意度調查上的工作經驗,今年針對全國各地政事務所員工經常舉辦的民眾洽公滿意度,把最常見的題目,整理出二個版本(A版、B版),並把題目內容放上網路,免費提供大家申請使用。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

Power BI資料視覺化系列5中,介紹了資料表(Tables)的功能,這裏進一步介紹矩陣(Matrixes)。

矩陣與資料表最大的不同,打個比喻:資料表類似原始資料表,每一直欄為一個屬性(或變項),橫列數即為資料筆數,它其實像是原始資料的呈現視窗。而矩陣則類似交叉表,它是某二變項的交叉,細格中呈現的是個數或平均數。

以下圖為例,這是一個展覽活動的遊客資料。左邊為資料表,展示每每個人前來的次數及交通工具,這時你看到的是每一筆原始資料;右邊則是矩陣,它是頻率與交通工具的交叉表,表中的數字是人數,這時你可以看到坐火車前來的225人中,有123人是第1次來。

 

1.jpg

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

資料視覺化原始目的是把成千上萬筆的資料,彙整、計算後呈現在一張圖中,讓我們可以快速看出大小或趨勢關係,獲得資料結果。但是如果我們也想讓使用者同時深入每一筆資料中,細看個案情形,那我們就需要用到矩陣和資料表功能(Tables and matrixes)。

下面是資料表(Tables)的示意圖,我們可以從資料表中細看每一製造商的每一種產品營收,最下方會顯示總和。它有幾個特點:

1.     您可以按一下資料行的標題,切換為遞增或遞減順序,來手動排序每個資料行。è因此可以快速的找到較低或較高的資料

2.     如果資料行的寬度不足以顯示所有內容,請按一下並左右拖曳標題將它展開è讓畫面完整呈現,尤其是在投影簡報或多人討論時,特別有用

3.    如果筆數太多,資料表可以從右方的捲軸,來展示視窗外資料。

 

1.jpg

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

  延續上一章節,本篇將持續透過官方範例檔與示範程式(如下圖所示),簡介程序實際操作之後產出的報表,以及報表中各項目的涵義。  

  執行完上段程序後,首先產出的報表會描述進行傾向分數配對的變數細節(如下圖所示)。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

大家好,如果你是數據話的忠實觀眾,本集(數據話第十七集)我們改變一個方式,看看別人怎麼說。

有位Youtober 叫Curbal(訂閱數8596 at 2018/4/3),錄了一段視頻,標題是「How to connect Google Sheet with Power BI」(如合連結google表單與Power BI) https://www.youtube.com/watch?v=2hFCeduIP6k ,時間不長才5分鐘,請先看完。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

  呈上個章節簡單介紹觀察型研究中的存活偏誤(Survival bias),本章節導讀文獻中提出的常見的5種研究設計方法,前2種會受到存活偏誤(Survival bias)影響,導致研究結果產生傾向於某一方有優勢,後3種為控制存活偏誤(Survival bias)的研究設計方法,以下將逐一介紹。

 

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

  觀察型研究中,由於介入/治療行為並非由研究者施予及分組,非受試者與受試者在受到其他許多背景、環境等因素操弄之下,而形成他們在研究中被觀察到的組別或治療型態。而醫學研究中,常見的觀察性研究資料類型多數為病歷回顧或是資料庫形式。當研究者從現有的資料集中萃取研究個案將其分組,並觀察追蹤期間的結果時,會因為【分組】這個動作而產生存活偏誤(Survival bias),或是不死的時間偏誤(Immortal time bias)。舉例來說,研究者從現有資料庫中篩選出一群急性心肌梗塞(AMI)的病人,看病人出院後90天內的Statin藥物使用狀況,將病人分成Statin組跟Non-statin組,並觀察病人從AMI出院之後發生AMI再住院或死亡的風險。這看似順風順水的研究設計,潛藏著一個干擾觀察結果的偏誤(bias),出院後90天內因為有使用Statin而被分到Statin組的人,從病人出院到使用Statin的這段時間是保證存活(意即活著的人才有機會被開Statin),因為死亡而來不及使用Statin的人就會被分到Non-statin組。在比較Statin與Non-statin組在AMI出院之後的AMI再住院與死亡時,就可能會發現Non-statin組死亡率比較高且AMI再住院率比較低,這是因為死亡而來不及用藥的人都在Non-statin組,而死亡的人也比較不容易被觀察到AMI的再住院,這個現象就稱為不死的時間偏誤(Immortal time bias)。

  流行病學研究設計中,有幾種處理不死的時間偏誤(Immortal time bias)的方式,以下援引American Journal of Epidemiology於2005年介紹的5種研究設計方式,其中方法1跟方法2都是會強烈受到偏誤(bias)影響研究結果,而方法3~5則是控制偏誤(bias)的方式,下一章節將逐一導讀介紹文獻中的5種研究設計方法,以及這5種研究設計之下對結果產生的影響。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

接續「Power BI學習心得分享一」,本篇介紹資料表關聯

Power BI有所謂的建立資料模型(Modeling),乍看不知何意,其實就是建立資料表之間的關聯性。因為實務上,資料表可能來自不同來源,比如訂單資料來自業務部,人事資料來自人事部,廠商資料來自採購部,各自維護更新,當需要分析時再串連一起。又如同樣是紀錄廠商資料,會計部重點在統編、銀行帳戶、匯款紀錄、發票地址等,而採購部重點在產品型號、價格、數量等,平常各自為政,當需要串連時,就要用到資料表關聯。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

  延續上一章節,本篇將透過官方範例檔,簡介程序實際操作的狀況,以及程序指令代表的意思。

  首先,下圖列出範例檔案的前10筆觀察值。StudentID為收案編號;Music在此作為研究組別,分為YesNo兩組,在此Yes組視為治療組(Treated)No組視為對照組(Control)Gender為類別型共變數;Absence為連續型共變數。

晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()

您尚未登入,將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

請輸入左方認證碼:

看不懂,換張圖

請輸入驗證碼