多數論文的研究問題,都會討論到變項之間的影響或預測,此時會利用迴歸模型,分析多個自變項(X)對於依變項(Y)的預測結果,除了知道每個自變項(X)對於依變項(Y)的影預測是否顯著之外,還可以知道其預測的方向性及強度,最後,我們可以根據此迴歸結果,建立迴歸預測的方程式,針對後續新進的樣本,可以迴歸方程式中需要的自變項代入,用來得到依變項(Y)的預測結果。
本篇文章準備了示範資料,樣本數為140人,共包括了5個自變項(X)與依變項(Y)-睡眠品質分數,分數越高,代表睡眠困擾越嚴重,5個自變項(X)介紹如下。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
每當評估一個新的案件,當然是直接翻到第三章的研究方法,除了看看研究架構與假設之外,還要看一下使用的統計方法,關於護理領域的研究,根據多年的經驗,主要的設計有兩種,一種是實驗研究,近期最多人使用的,就是利用廣義估計方程(Generalized estimating equation, GEE)探討介入的效果,另一種是關聯性研究,瞭解變項之間的關係,統計方法不外乎就是卡方、獨立t、ANOVA,最後再迴歸分析為主軸作為收尾,固定的統計方法卻能讓論文一直不斷被產出,除了因為樣本的多樣性與特殊性之外,另一個極大的優勢,就是有非常多已經發展具有信效度的研究量表,這將為護理研究人員省下許多的時間與精力。
如果您對於上述的統計方法都做到膩了,不如嘗試比較進階一點的結構方程模式(structural equation modeling, SEM),這裡講的是較進階,並不是較新,畢竟結構方程SEM算是比較有資歷的統計方法了,您或許會有疑問,為什麼沒聽過,這也是我的疑問,因為我也很少遇到護理研究有使用,所以推薦給你們,另外搭配軟體AMOS,您一定會很意外,這好像也沒有很困難。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
上篇介紹完關於無預設因素的EFA,不過實務上研究者在設計量表題目時,大多數都是根據文獻並設定好所有題項的因素歸類(如下圖),因此會希望因素分析的分類結果能夠與自己設定的因素一樣,但這樣的結果可遇不可求,因為根據筆者過去的經驗,結果好一點的話刪除個2~4題,還能維持原有的預設因素及分類狀況;若狀況不理想,那結果整個大走鐘(台語),再來就得看是否堅持一定要維持原來的因素結構,而採取較不正規的作法,或是改用無預設因素的方式繼續往下進行。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
只要論文提到影響或預測,就會讓人直覺聯想到要進行迴歸分析,去年年底有發表過一篇文章『該選什麼迴歸分析』,現在想想覺得不夠深入,因此這篇將分享個人的習慣作法,給有需要的人參考,就如同之前說的,線性迴歸的比例仍佔大多數,因此這篇就以線性迴歸為例來跟大家討論(不過好像沒差XDDDD)。
當拿到客戶的第三章研究方法,就會知道有沒有需要做迴歸,不過除非客戶在統計方法的章節交代很清楚,否則我們只能知道要做迴歸或不用做迴歸,那我們要做怎樣的迴歸呢?站在客戶的立場,結果一定是越顯著越好,所以就會有幾種的組合來做嘗試,分為兩個面向(1)自變項全部放入 or 挑選單變量有顯著(或p<某個標準值,如0.2)的變項;(2)要選全部進入法(Enter) or 逐步法(Stepwise),形成以下交叉表
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
最近跑因素分析真的跑到昏天暗地,因為跑出來的結果跟原先預想的不一樣,就得跟指導教授確認哪些題目需要刪除,或是構面要如何建立,真的花費了不少時間,但如果論文有做因素分析的必要時,這一步絕對不能馬虎,時間要花就是得花,結果要確認就是得確認,才能確保後續不會走冤枉路。
其實我們公司部落格過去寫過蠻多篇因素分析的文章,大家應該也都略知一二,如果是碩士論文,大概都會用探索性因素分析去分析量表的建構效度。探索性因素分析,顧名思義,應該是要用來探索量表的因素結構,所以一開始並不會預設量表包含幾個因素,以及每個因素下包含哪些題目,不過實務上,每個量表的因素結構都會事先被設計好,因此當因素分析的結果不符合預期,此時就得開始進行修正。不論研究是否有預設結構,因素分析的最後結果,就是要能夠判斷每個題目的最後歸屬,如下表所示。
晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()
繼上篇分享了進行迴歸分析時所做的殘差診斷後,這一篇來講一下另一個做迴歸分析時老闆們更愛的東西-多元共線性診斷。無論進行線性迴歸或是羅吉斯迴歸,當自變項個數在2個以上時,而自變項之間的相關性比較高的時間,就有可能存在共線性的問題,而當共線性問題很嚴重時,我自己的經驗就容易出現以下幾種現象:
(1)多自變項與依變項的相關性非常顯著,但迴歸分析出來的所有結果都不顯著。
晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()
每個統計分析背後總是存在一些假設,當這些假設違反時,就有可能產生偏誤的結果,而在實務的應用上,您應該會發現每篇文章在這些假設性的檢驗都很少出現,不過偶爾還是會遇到客戶的老師要求,在2016年時曾經介紹過「迴歸分析之殘差基本假設-以SPSS為例」,這一篇將以此為例來說明操作步驟,包含常態性、變異數同質性、獨立性。
(1)點選「分析」→「迴歸」→「線性」
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
有關統計方法的諮詢,迴歸分析是最常被詢問的統計方法之一,如何操作軟體、如何解讀報表、如何呈現結果,這些相信在坊間教科書或是上網就可以找到一堆教學資料,前提是要輸入對的關鍵字,因此我們這篇就來討論『該選什麼迴歸分析』。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
區別效度分析旨在驗證不同兩個構面相關在統計上是否存在差異,在不同構面的題目應該不具有高度相關,如有高度相關,就表示這些題目是衡量同一件事,同常這會發生在構面的定義有過度重疊的時候(張偉豪,2011)。
最常用來驗證區別效度的方法,應該算是平均變異數萃取法(如下表),因為在進行驗證性因素分析(confirmatory factor analysis, CFA)的同時,即可透過所得到因素間的相關係數,以及透過報告收歛效度(convergent validity)時所得到的平均變異萃取量(average variance extracted, AVE)就能完成下列表格,至於判斷的標準,就是該因素的AVE開根號值要高於所有與該因素的相關係數,以下圖因素B為例,AVE開根號為.78,要高於所有與因素B的相關係數.42至.72,則代表有區別效度。
晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()
因素分析是在做量表型研究時,最常用來進行效度分析的統計方法,而因素分析又分為探索性因素分析(Exploratory Factor Analysis, EFA)與驗證性因素分析(Confirmatory Factor Analysis, CFA),因此有兩個常被問到的問題,兩者的差別在哪,以及兩者的使用時機為何,兩者的差異在張偉豪與鄭時宜(2012)一書中有清楚的介紹與彙整,因此本篇也截錄一些重點與大家方享。
探索性因素分析被提出的時間早於驗證性因素分析,主要的目的是在探索一組觀察變項中有多少的潛在因素,其流程是先設定一群觀察變項會受到同一個共同因素的影響,計算其共變程度,再來排除掉共變程度後,再尋找下一個可以解釋剩下共變關係的因素,直到所有變異量被解釋完為止(如下圖左半部),此時所萃取因素的個數剛好就是等於觀察變項的總題數,不過由於多數因素能解釋共變的程度不高,因此就會有許多方式來決定因素個數,譬如說下圖右半部採取特徵值大於一的方式來決定,或是用陡坡圖來決定適合的因素個數。
晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()
本篇文章將介紹針對結構方程常用的配適度指標作介紹,除了整理各指標的判斷標準及參考文獻之外,亦針對一些特殊的情況進行說明。
九、比較性配適指標(Comparative fit index, CFI)
CFI類似於NFI,但對樣本數有加以懲罰,因此CFI與RMSEA一樣較不受到樣本數大小的影響(Fan, Thompson, & Wang, 1999),即使在小樣本之下,CFI對模式配適度的估計表現仍相當好(Bentler, 1995)。CFI介於0~1之間,CFI指數越接近1代表模型契合度越理想,表示能夠有效改善中央性的程度。傳統上認為CFI在0.9以上為良好配適(李茂能,2006;陳正昌、程炳林、陳新豐與劉子鍵,2003;張偉豪,2011)。而有學者認為要以大於.95為通過門檻,用來評估模式適配度才夠穩定(Bentler, 1995; Hu & Bentler, 1999; 邱皓政,2011),但1不代表是完美配適,只代表模型卡方值小於假設模型的自由度。CFI在巢型結構中也是個常用的指標,巢型結構模型中CFI差異的大小決定模型是否不同(Cheung & Rensvold, 2002)。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
本篇文章將介紹針對結構方程常用的配適度指標作介紹,除了整理各指標的判斷標準及參考文獻之外,亦針對一些特殊的情況進行說明。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
本篇文章將介紹針對結構方程常用的配適度指標作介紹,除了整理各指標的判斷標準及參考文獻之外,亦針對一些特殊的情況進行說明。
一、卡方檢定(Chi square test)
卡方值是SEM最原始的指標,因為它直接從ML估計法的函數【(N-1)FML】計算而得。卡方值是愈小愈好,但也沒有一定的標準,因為卡方值不但會受到樣本數的影響,也會受到模型複雜度的影響,幾乎所有的模式都可能被拒絕(Bnetler & Bonett, 1980; Marsh & Hocevar, 1985; Marsh, Balla, & McDonald., 1988),算不上是實用的指標,因此顯少採用,但它是許多配適度指標的計算基礎,所以在SEM分析中需要呈現。
晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()
(二)Points system
如上所述,nomogram不適用於解釋變項太多的情況(例如>10),當我們的多變項分析同時包括10個甚至15個變項時,此時則可以考慮以points system來呈現多變項模式的結果。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
多變項迴歸分析(Multivariable or multi-predictor regression analysis)指的是迴歸方程式中,同時有2個或2個以上的解釋變項,反應變項(Response variable, Y)則可能是各種尺度的變項,常見的有線性(連續變項)、二元、計數與存活資料等,分別適用線性迴歸(Linear regression)、羅吉斯迴歸(Logistic regression)、卜瓦松迴歸(Poisson regression)及Cox比例危險模型(Cox proportional hazard model)等。
呈現多變項分析結果最常見的方式就是列表,列出迴歸係數、勝算比或危險比的值、信賴區間以及顯著性,如下表所示。方程式除了列解釋變項的迴歸係數(或勝算比、危險比)之外,也列出截距項(Intercept or constant)的數值,以利讀者可以帶入特定值,以計算出預測的結果變項的數值,例如50歲男性且Creatinine是0.8,此人的預測Y值是多少。預測Y值在線性迴歸跟卜瓦松迴歸代表的是平均值,在羅吉斯迴歸與Cox模型則是代表發生事件的機率。
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
晨晰部落格新站 發表在 痞客邦 留言(4) 人氣()
多元中介,顧名思義是模式之中包含兩個以上的中介變項(mediator variable),而多元中介又分「平行式(parallel)中介」與「串聯式(serial)中介」(又稱遠程中介)。
晨晰部落格新站 發表在 痞客邦 留言(2) 人氣()
迴歸分析是蠻常採用的統計方法之一,而在進行迴歸分析之前,針對殘差的部分存在幾項基本的假設,當資料違反這些基本假設而進行分析時,通常會使研究結果產生偏誤,至於偏誤的程度,當然就視資料違反的程度而定,其假設包含:
(1)常態性
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()
進行迴歸分析時,類別變項需轉為虛擬變項(Dummy Variable)的處理,常會讓使用者覺得很麻煩,尤其當研究裡的類別變項較多時,處理起來真的需要比較多的時間。此時,我們可以利用SPSS所分享的公用程式,透過軟體來處理,說明中有提到,此公用程式可適用在SPSS 17.0之後的版本,且有安裝Python Essentials,本篇以SPSS 22.0版為操作介面,介紹安裝此公用程式及後續的操作。
在分析之前,先確認所有要做虛擬編碼(Dummy Code)的變項已做數值的標註,增加資料的可讀性。
晨晰部落格新站 發表在 痞客邦 留言(1) 人氣()
晨晰部落格新站 發表在 痞客邦 留言(0) 人氣()