电竞比分网-中国电竞赛事及体育赛事平台

分享

什么樣的模型是“最好的”?有金標準嗎?

 醫(yī)學數(shù)據(jù)科學 2025-08-06 發(fā)布于天津

臨床/流行病學研究有一條廣泛認可的原則:

要加進模型的協(xié)變量應該是“有可能發(fā)生混雜的變量”:即,那些既影響暴露(或分組),也影響結(jié)局結(jié)果因素(醫(yī)學、臨床預設的因果路徑),

不要亂加“中介變量”(暴露→結(jié)局路徑上的變量),會把效應“調(diào)沒”,

不要加一堆“純預測因子”或臆想變量、和暴露/結(jié)局都沒啥關(guān)系的變量,純純噪音,且增加模型不確定性。

一句話:

“既不過度調(diào)整,也不遺漏關(guān)鍵混雜,只涵蓋真正有可能產(chǎn)生混雜的變量”——這就是理想的回歸模型配置。

工具/經(jīng)驗法則參考:

10 events per variable(EPV)原則:每進1個變量,需至少10個結(jié)局事件(如100例發(fā)生心梗,最多建10個協(xié)變量模型)——防止過擬合/不穩(wěn)定。

Directed acyclic graph(DAG,因果圖):用來理論上判定該納入誰,少走彎路。

經(jīng)驗+文獻+統(tǒng)計診斷工具結(jié)合。

    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多