|
臨床/流行病學研究有一條廣泛認可的原則: 要加進模型的協(xié)變量應該是“有可能發(fā)生混雜的變量”:即,那些既影響暴露(或分組),也影響結(jié)局結(jié)果因素(醫(yī)學、臨床預設的因果路徑), 不要亂加“中介變量”(暴露→結(jié)局路徑上的變量),會把效應“調(diào)沒”, 不要加一堆“純預測因子”或臆想變量、和暴露/結(jié)局都沒啥關(guān)系的變量,純純噪音,且增加模型不確定性。 一句話: “既不過度調(diào)整,也不遺漏關(guān)鍵混雜,只涵蓋真正有可能產(chǎn)生混雜的變量”——這就是理想的回歸模型配置。 工具/經(jīng)驗法則參考: 10 events per variable(EPV)原則:每進1個變量,需至少10個結(jié)局事件(如100例發(fā)生心梗,最多建10個協(xié)變量模型)——防止過擬合/不穩(wěn)定。 Directed acyclic graph(DAG,因果圖):用來理論上判定該納入誰,少走彎路。 經(jīng)驗+文獻+統(tǒng)計診斷工具結(jié)合。 |
|
|