电竞比分网-中国电竞赛事及体育赛事平台

分享

【技能提升】標(biāo)準(zhǔn)化回歸系數(shù)你會用嗎?

 松哥精鼎統(tǒng)計 2020-10-23

 

標(biāo)準(zhǔn)化回歸系數(shù)


在多元線性回歸中,SPSS、SAS等統(tǒng)計軟件都會在模型參數(shù)中輸出非標(biāo)準(zhǔn)化回歸系數(shù)和標(biāo)準(zhǔn)化系數(shù)。如上圖,為SPSS的多元線性回歸分析結(jié)果。

那該如何對標(biāo)準(zhǔn)化回歸系數(shù)進行解釋呢?

咱們分兩步來闡明:

第一步:為你打開標(biāo)準(zhǔn)化回歸系數(shù)計算的“黑匣子”,弄懂統(tǒng)計軟件計算標(biāo)準(zhǔn)化回歸系數(shù)的具體思路

第二歩:介紹標(biāo)準(zhǔn)化系數(shù)的實際意義及其應(yīng)該場景。

第一步

標(biāo)準(zhǔn)化回歸系數(shù)的‘黑匣子’

 1 

標(biāo)準(zhǔn)化回歸系數(shù)的由來

在多元線性回歸中,通常各自變量取值的單位及其離散程度是不同的,所以量綱不同的各回歸系數(shù)之間不能直接比較大小。

為此,可先對所有的自變量和因變量進行標(biāo)準(zhǔn)化轉(zhuǎn)換,即將變量減去其均值后再除以標(biāo)準(zhǔn)差。隨后,以標(biāo)準(zhǔn)化變換后的因變量為因變量,以標(biāo)準(zhǔn)化后的各自變量為自變量,重新建立回歸方程,得到的回歸系數(shù)即標(biāo)準(zhǔn)化回歸系數(shù)。這就是SPSS、SAS等統(tǒng)計軟件計算標(biāo)準(zhǔn)化回歸系數(shù)的“黑匣子”。

2

標(biāo)準(zhǔn)化回歸系數(shù)的計算思路驗證

平常我們在SPSS中進行一般的多元線性回歸操作,都會得出如下的輸出結(jié)果:

現(xiàn)在,我們按照標(biāo)準(zhǔn)化回歸系數(shù)的生成思路,一步步生成標(biāo)準(zhǔn)化回歸系數(shù),看與上面結(jié)果是否一致:

步驟一、對所有的自變量和因變量進行標(biāo)準(zhǔn)化轉(zhuǎn)換,即將變量減去其均值,之后再除以標(biāo)準(zhǔn)差。

SPSS操作步驟如下:


由上圖可以看出,已生成標(biāo)準(zhǔn)化變量。

步驟二、以標(biāo)準(zhǔn)化變換后的因變量為因變量,以標(biāo)準(zhǔn)化后的各自變量為自變量,重新建立回歸方程,得到的回歸系數(shù)即標(biāo)準(zhǔn)化回歸系數(shù)。

由上圖與開篇的第一張圖比較可以看出,藍(lán)色框中的非標(biāo)準(zhǔn)化回歸系數(shù)與一般線性回歸操作的標(biāo)準(zhǔn)化回歸系數(shù)一致。

其實,從上圖中就可以看出:變量標(biāo)準(zhǔn)化后的回歸分析中,得到的非標(biāo)準(zhǔn)化回歸系數(shù)即標(biāo)準(zhǔn)化回歸系數(shù)(藍(lán)色框與紅色框結(jié)果一致)。

至此,第一步驗證成功!

第二歩

標(biāo)準(zhǔn)化系數(shù)的實際應(yīng)用

 1 

標(biāo)準(zhǔn)化回歸系數(shù)的可比性闡述

由于因變量與自變量的標(biāo)準(zhǔn)化轉(zhuǎn)換后,標(biāo)準(zhǔn)化變量均是服從均值為0,標(biāo)準(zhǔn)差為1 的標(biāo)準(zhǔn)正態(tài)分布,且十分重要的一點是,所有的標(biāo)準(zhǔn)化變量均沒有了量綱,且離散程度相同(標(biāo)準(zhǔn)差均為1)。

所以,計算出的標(biāo)準(zhǔn)化回歸系數(shù)不受變量的量綱影響。進而,各自變量的標(biāo)準(zhǔn)化回歸系數(shù)之間是可以直接比較大小的。

標(biāo)準(zhǔn)化的變量是以一個變量自身的標(biāo)準(zhǔn)差為單位的。標(biāo)準(zhǔn)化回歸系數(shù)也就是其他自變量保持不變的情況下,該自變量變化一個單位(也就是一個標(biāo)準(zhǔn)差),因變量變化多少個單位的標(biāo)準(zhǔn)差。

2

實際意義及應(yīng)用

各自變量的標(biāo)準(zhǔn)化回歸系數(shù)的比較反映各自變量對因變量的貢獻(xiàn)誰大誰小。

在實際應(yīng)用中,遇到“各自變量對因變量的作用大小比較”的問題。在排除了強影響點和多重共線性的前提下,應(yīng)看各自變量的標(biāo)準(zhǔn)化回歸系數(shù)。因為標(biāo)準(zhǔn)化回歸系數(shù)消除了自變量單位的影響,具有可比性。

下面,將開篇的案例結(jié)果進行解釋:


根據(jù)上表結(jié)果可以看出,對肺活量的貢獻(xiàn)大小,從高到低依次為身高、體重、胸圍。在這三個自變量中,身高對肺活量的影響作用最大。

總結(jié)

標(biāo)準(zhǔn)化回歸系數(shù)是指數(shù)據(jù)標(biāo)準(zhǔn)化以后算出來的回歸系數(shù),非標(biāo)準(zhǔn)化回歸系數(shù)就是用原來的數(shù)據(jù)算出來的回歸系數(shù)。

如果是要寫出回歸方程的話,就要用非標(biāo)準(zhǔn)化回歸系數(shù)。

如果是要比較各自變量對因變量的貢獻(xiàn)大小,就要用標(biāo)準(zhǔn)化回歸系數(shù)來比較。

ps:另外,路徑分析中的路徑參數(shù)就是標(biāo)準(zhǔn)化回歸系數(shù)。標(biāo)準(zhǔn)化回歸系數(shù)還可以用于進一步的路徑分析中。統(tǒng)計分析方法學(xué)到最后你會發(fā)現(xiàn)很多相互連通的地方,很有意思。


松哥說:多元線性回歸中不可避免會碰到非標(biāo)準(zhǔn)化回歸系數(shù)和標(biāo)準(zhǔn)化回歸系數(shù)的結(jié)果解釋。跟著本期一起,自己動手驗證一下標(biāo)準(zhǔn)化回歸系數(shù)的計算思路,加深印象,懂了思路才會應(yīng)用哦!一句話:用標(biāo)準(zhǔn)化回歸系數(shù)來比較各自變量對因變量的貢獻(xiàn)大小,其他的應(yīng)用(如路徑分析等)后續(xù)有機會再聊。一起加油吧!

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多