在上一篇「市場調查與地理資訊的完美搭配──建立一份客戶地圖」文章中,介紹了利用Power Map展示了市場調查資料的分析結果。對行銷人員或企劃人員來說,好不容易蒐集了許多產品資料,花了許多時間分析,如果不能給決策者一個震憾的展示,豈不功虧一簣?
在上一篇「市場調查與地理資訊的完美搭配──建立一份客戶地圖」文章中,介紹了利用Power Map展示了市場調查資料的分析結果。對行銷人員或企劃人員來說,好不容易蒐集了許多產品資料,花了許多時間分析,如果不能給決策者一個震憾的展示,豈不功虧一簣?
在醫學期刊中想要成功發表Clinical paper,多變項分析(Multivariable or multi-predictor or multivariate analysis)可說是家常便飯,在最後的迴歸模式中(無論是linear, logistic, Poisson, or Cox regression model)同時包括2個或以上的變項即可稱為多變項模式,而通常我們會把最終模式中達統計顯著的變項稱之為預測因子(Predictive factor or predictor),其實比較保守的說法是關聯因子(Associated factor)。
然而很常見的模式建立(Model building)的策略為研究者先做一系列的雙變項分析(Bivariate analysis),例如t-test, chi-square或是雙變項的迴歸分析(就是一次只放一個自變項),接著研究者會說:『將P小於0.05的變項進一步放到多變項分析』,這是現行期刊中非常普遍(甚至被廣為接受)的模式建立方法之一,但其實此作法存在著很大的問題。
從1990~2000年代起實證醫學(Evidence-based medicine, EBM)儼然已成為醫學研究的顯學,基於以問題解決的方式(Problem-solving approach)來回答臨床問題,使用目前最具有實證證據的措施介入,以對病人有最好的治療與照顧。而如何提出問題則是實證醫學的開端,在臨床上醫師或護理人員必須先對於提問主題有足夠背景知識,才有可能將臨床問題轉化為實證可以回答的問題。
在商圈的市場分析(Market Analysis)領域有一個項目叫立地條件分析,目的是為了讓投資者對該地區有所瞭解,並評估該區是否為合適設店地點。它衡量某地區的交通條件、產業結構、家戶消費、人口組成、成長沿革、重要設施等,這是屬於客觀的「時」、「地」、「物」方面的調查。接著,必須再輔以消費者需求、客層分析、廠商意願、競爭者調查等「人」、「事」方面的市場調查,結合二者方能完成一份完整的可行性評估。
再來,是依變項的部分,我們知道每個受訪者會發生運動傷害的機率與不會發生運動傷害的機率相加,一定是100%(P(會發生)+P(不會發生)=1),在羅吉斯迴歸的方程式中,公式以P(會發生)/P(不會發生)做為一個人會不會發生依變項=1(有運動傷害)的風險(又稱勝算,odds),如果今天一個人會發生的機率是50%的話,不會發生的機率也一定是50%,此時所算出來的風險(odds)就會剛好是1,如果今天算出來的風險(odds)超過1的話,就代表該受訪者比較可能有依變項=1(有運動傷害)的現象;反之(odds)低於1的話,就代表該受訪者比較不可能有依變項=1(有運動傷害)的現象,所以1即為決定方向性的重要標準。再繼續延伸到下表裡的OR值(odds ratio),OR值可以想成把兩群對象的風險(odds)進行比較,如果有一群對象A的風險(odds)為0.6,另一群對象B的風險為0.3,那對象A相較於對象B的OR值則為2(A比B容易發生),或解釋成對象B相較於對象A的OR值則為0.5(B比A不容易發生),因此仍以1作為OR值判斷的標準,OR值超過1,越容易發生Outcome=1(有運動傷害),或可以解釋發生風險比較高。
如果上述的教學您還可以接受的話,那麼恭喜您,應該對羅吉斯的迴歸解釋有相當瞭解,若您對於上述不是很明白,也不用擔心,最後要教您最快解釋報表的方法,同樣的以自變項及依變項拆成兩段解釋。
一篇研究在經過多種量化分析的統計方法後,經常以找尋預測因子或影響因子作為Ending,所使用的統計方法即是大家常看到的迴歸分析,一般所指的迴歸分析若沒有特別強調,通常都是線性迴歸(Linear Regression),而且是多個自變項所組成的多元線性迴歸(Multiple Linear Regression),不過根據我的經驗,多數客戶學線性迴歸並沒有太大的問題,就算拿書自學也都能輕易上手;而這篇所要介紹的是從統計方法聽起來就比較難的二元羅吉斯迴歸。
二元羅吉斯迴歸與線性迴歸的差別,僅在於依變項/Outcome尺度的不同,當依變項為二類的類別變項(通常Coding 1 & 0)時,會採用二元羅吉斯迴歸進行分析;而當依變項為連續尺度的變項時,則是使用線性迴歸。(當依變項的水準為三類以上,則採用多項式羅吉斯迴歸)。
在投稿的各階段中,以審查回覆(Response to reviewers)為最關鍵的階段,Reviewer(s)跟Editor只要對於文章或作者回覆內容不滿意,可能就會將文章直接拒絕,因此我們都應該盡力回答Reviewers的問題,以及盡量做到Reviewers的要求,儘管有些要求確實不太合理。
筆者從事統計諮詢的多年經驗中,曾檢視過數百篇Reviewer’s comments,根據回應策略與最後是否成功被accepted,領略了一些回應上的技巧,在此分享給各位研究人員作參考。