三、Methods(Item no. 10-12)
第 10 點是關於統計分析,是只針對發展模型的文章,又分成 5 個小點。「10a」是描述在分析時如何處理預測變項,這邊指的是主要分成連續變項與類別變項兩大類。連續變項部分,TRIPOD statement 建議盡量保持為連續變項,避免重新分組成類別變項,尤其是根據資料驅動(Data-driven)的二分法(Dichotomization)更要避免使用。連續變項也要檢視與結果變項之間的非線性關係,目前主要建議使用 fractional polynomial(FP)以及 restricted cubic splines(RCS),兩者中又以 FP 的模型可解釋性比較高。關於 RCS,筆者與同事之前有分享過一些文章(https://reurl.cc/8WOqNb、https://reurl.cc/pWVL54、https://reurl.cc/R6OEqG以及https://reurl.cc/2b8yjm)。
「10b」裡頭有五個小點,分別是統計模型的種類、在分析之前如何選擇預測變項、在分析時如何篩選預測變項、交互作用項以及內部驗證(Internal validation)。統計模型部分(10b-1),橫斷面的二元結果變項大多使用 Logistic regression,Time to event 的結果變項通常使用 Cox model。
「10b-2」關於在分析 “之前” 如何選擇預測變項,通常資料集所包括的共變項數量會遠多於最後多變項模型所保留的預測變項。因此,建議使用外部的證據來選取,通常來自於系統性回顧或是醫學專家的意見。另外有些相關性比較高的預測變項,可以考慮二擇一做為代表,例如舒張壓與收縮壓、Total cholesterol 與 LDL 等。
「10b-3」關於 “在分析時” 如何篩選預測變項,主要有兩種作法,一種是先作雙變項分析(Bi-variable or univariate analysis),然後再將達顯著(通常是 P <0.05)的預測變項放到多變項模型;另一種是用自動選取法(Automated selection),其中又以向後選取法(Backward elimination)較為建議使用,且建議不要使用P <0.05 作為選入的標準(註:不是指雙變項分析的顯著性,而是指向後選取法的模型選入所謂「顯著」的標準)。關於向後選取法,筆者之前有分享過文章,請參考:https://reurl.cc/X493gR以及https://reurl.cc/WkVWgy。
「10b-4」是關於交互作用項(Interaction terms),TRIPOD statement 建議如果要考慮變項之間的交互作用,最好是基於事前判斷與醫學脈絡,而不建議直接用統計檢定去測試變項之間可能存在的交互作用,後者極可能造成模式的過度契合(Over-fitting)以及一般來說也對模式的預測能力幫助不大。
「10b-5」是關於內部驗證,常見作法有分割樣本(Split sample)、K-fold 交叉驗證(Cross-validation)以及自我重複抽樣法(Bootstrap validation)。分割樣本就是樣本根據50/50或70/30的比例分割成兩組,前者用於發展、後者用於驗證,但不建議使用這種作法,除非樣本數極為龐大,且建議採用根據不同年代或區域的分割。目前比較推薦使用 K-fold 或 Bootstrap validation,尤其是後者,筆者之前有撰寫過介紹文章,可以參考:https://reurl.cc/oeqq7j以及https://reurl.cc/e6ZZdx。
「10c」是單純的驗證既有模型時適用,要交代欲驗證既有模型的模式完整結果,通常包含每一個預測變項的迴歸係數以及截距項(若是 time to event outcome,則是特定時間點的 baseline survival function),最理想是已發表的既有模型有提供線上計算器的網頁。這邊值得注意,所謂驗證既有模型的作法,不是單純只是用新的驗證資料集(Validation data)去重複配適既有模型最後的結果,而是必須限制驗證資料集的估計迴歸係數必須與已發表既有模型的一樣,才是正確的作法。
「10d」提供各種關於模式表現的測量,如果可能的話也提供比較多個模型的結果。這部分內容很多,主要可以分成模式整體表現(Overall performance measures)、校準(Calibration)、鑑別(Discrimination)以及重新分類(Reclassification)等。筆者在之前有寫過不少關於這部分的文章,概念介紹可參考:https://reurl.cc/Goll7D、https://reurl.cc/9OQQM8、https://reurl.cc/yQllxy以及https://reurl.cc/02yyY6。R 軟體操作可參考:https://reurl.cc/GolLrd、https://reurl.cc/MbGLdX、https://reurl.cc/yQl4gl、https://reurl.cc/oeqq7j以及https://reurl.cc/e6ZZdx。
「10e」是單純的驗證既有模型時適用,如果該研究不只是驗證既有模型,而是還更新了既有模型的結果。經常會碰到驗證模型的模式表現明顯變得比較差,研究人員有幾個選擇:拒絕該既有模型、使用驗證資料重新估計結果(用跟既有模型一樣的預測變項,但不限制迴歸係數要一樣)或是甚至發展一個全新的模型。但 TRIPOD statement 原則上不鼓勵發展一個全新的模型,他們鼓勵盡量想辦法修正並提升模式表現(在不改變既有模型的預測變項之下),TRIPOD statement 的技術說明文章裡頭有列具很多方法,讀者可以參考(https://www.acpjournals.org/doi/10.7326/M14-0698)。
第 11 點是關於風險組別(Risk groups)。常見作法是根據多變項模型的預測機率(Predicted probability)將病人分組,通常分成 3 組以上。大多數根據預測機率分組的閾值是沒有根據的,常見作法有根據機率的分布分組(例如第 25、75 百分數位)、特定機率值分組(例如5%、20%)。在少數的疾病或預後,治療指引(Reporting guideline)具有明確的機率分組,例如心臟病的長期發生率就有這方面的指引。
第 12 點是單純的驗證既有模型時適用,必須詳細報告用來驗證的資料集在跟原始既有模型的資料集有何不同,包括以下面向:收案情境、納入與排除條件、結果變項與預測變項的定義。倘若驗證資料集在以上面向有跟原始資料不完全一致之處,也應該要揭露,讓讀者自行評估模型的通用性(Model transportability)。
留言列表