筆者在 2013 年曾經寫過一篇文章『醫學統計經常混淆的名詞』(https://dasanlin888.pixnet.net/blog/post/34469753),將醫學領域與其他領域的慣用使用統計名詞作了一些釐清。
本篇文章旨在討論在醫學領域很常被誤用的統計名詞,有些名詞甚至錯誤(或說不精確)名詞的使用頻率還高過正確名詞。主要討論多變項(multivariable)與多變量分析(multivariate)的差別以及雙變項/雙變量(bivariable or bivariate)還是單變量分析(univariable or univariate)的差別。
Univariate vs. Bivariable
假設現在有一個解釋變項(因,cause)以及結果變項(果,outcome),當我們要探討這『兩者』之間的關係時,精確來說應該要使用雙變項或雙變量分析。然而在醫學領域更常見使用的是單變量分析(univariate analysis),不過寬鬆定義之下,這個名詞也是正確名稱,因為相較於多變量分析(multivariate analysis)而言,雙變量分析指的是正在進行的這個統計分析只有一個結果變項。
常見的雙變項分析非常多種,主要是根據解釋變項(因)與結果變項(果)的資料尺度類型,分成符合常態分配的連續變項、連續但不符合常態分配或是順序變項(rank or ordinal)以及名義變項(nominal or categorical)。不同尺度的解釋變項與結果變項的組合之下,所使用的統計方法都不同(詳見下表或是筆者的書籍:https://www.books.com.tw/products/0010705011)。
但嚴格來說,所謂『Uni』指的是只有一個變項/變量,也就是單獨一個變項(無論是因還是果)的敘述統計,譬如人數、百分比、平均數、標準差、全距、中位數、四分位數(quartile)、百分位(percentile)等。因此在此會建議讀者未來盡量使用 bivariate analysis,最好是使用 bivariable analysis。
圖片來源:Toxicol Pathol. 2018 Aug;46(6):647-652. doi: 10.1177/0192623318785097
Multivariate vs. Multivariable
多變量分析是筆者認為在醫學領域論文最常被誤用的名詞。相較於單變量分析是指該統計分析只有一個結果變項,嚴謹定義之下的多變量分析是指『同時有 2 個或 2 個以上的結果變項』。
醫學領域常見的嚴謹定義之下的多變量分析包括:集群分析(cluster analysis,特別常使用在基因研究)、主成分分析(principal component analysis,也是常使用在基因研究)。以及潛在變項模式(latent variable model),例如 latent class model、latent class growth model(group-based trajectory analysis)、latent transition model或結構方程模式(structural equation model)等。
在寬鬆定義之下,醫學統計常用的 multinomial logistic regression、存活分析(survival analysis,包括 log-rank test, proportional hazard models等)可以算是多變量分析。因為可以說它們的結果變項是『2 個或 2 個以上』,譬如說 multinomial logistic regression 的結果變項至少是 3 個;存活分析則是同時有兩個結果變項,分別是事件發生與否以及存活時間。
相較之下,多變項分析(multivariable analysis)的定義就明確多了,亦即只要該統計分析同時包括 2 個或 2 個以上解釋變項就稱為多變項分析,也就是『多個解釋變項的分析』。
在此會建議無論該統計分析有一個或多個結果變項,只要同時使用到2 個或 2 個以上解釋變項,未來讀者一律都使用 multivariable analysis這個名詞。
推薦參考讀物
本文章提到的概念,特別是多變量與多變項的區別,近年在許多醫學雜誌已有不少作者也在提倡,有興趣的讀者可以進一步閱讀。
1. Arndt S. Statistical Commentary:“Multivariable Versus Multivariate”. The American Journal of Geriatric Psychiatry. 2019;27(3):279.
2. Bunce C, Czanner G, Grzeda MT, Doré CJ, Freemantle N. Ophthalmic statistics note 12: multivariable or multivariate: what’s in a name? : BMJ Publishing Group Ltd; 2017.
3. Hidalgo B, Goodman M. Multivariate or multivariable regression? American journal of public health. 2013;103(1):39-40.
4. Peters TJ. Multifarious terminology: multivariable or multivariate? univariable or univariate? Paediatric and perinatal epidemiology. 2008;22(6):506-506.
5. Reboldi G, Angeli F, Verdecchia P. Multivariable analysis in cerebrovascular research: practical notes for the clinician. Cerebrovascular Diseases. 2013;35(2):187-193.
6. Ricci S. Multivariate, Multivariable, Confusion and... the Light! Cerebrovascular Diseases. 2013;35(2):186.
留言列表