|
標(biāo)準(zhǔn)化回歸系數(shù) 那該如何對標(biāo)準(zhǔn)化回歸系數(shù)進行解釋呢? 咱們分兩步來闡明: 第一步:為你打開標(biāo)準(zhǔn)化回歸系數(shù)計算的“黑匣子”,弄懂統(tǒng)計軟件計算標(biāo)準(zhǔn)化回歸系數(shù)的具體思路; 第二歩:介紹標(biāo)準(zhǔn)化系數(shù)的實際意義及其應(yīng)該場景。 第一步 標(biāo)準(zhǔn)化回歸系數(shù)的‘黑匣子’ 在多元線性回歸中,通常各自變量取值的單位及其離散程度是不同的,所以量綱不同的各回歸系數(shù)之間不能直接比較大小。 為此,可先對所有的自變量和因變量進行標(biāo)準(zhǔn)化轉(zhuǎn)換,即將變量減去其均值后再除以標(biāo)準(zhǔn)差。隨后,以標(biāo)準(zhǔn)化變換后的因變量為因變量,以標(biāo)準(zhǔn)化后的各自變量為自變量,重新建立回歸方程,得到的回歸系數(shù)即標(biāo)準(zhǔn)化回歸系數(shù)。這就是SPSS、SAS等統(tǒng)計軟件計算標(biāo)準(zhǔn)化回歸系數(shù)的“黑匣子”。 平常我們在SPSS中進行一般的多元線性回歸操作,都會得出如下的輸出結(jié)果: 現(xiàn)在,我們按照標(biāo)準(zhǔn)化回歸系數(shù)的生成思路,一步步生成標(biāo)準(zhǔn)化回歸系數(shù),看與上面結(jié)果是否一致: 步驟一、對所有的自變量和因變量進行標(biāo)準(zhǔn)化轉(zhuǎn)換,即將變量減去其均值,之后再除以標(biāo)準(zhǔn)差。 SPSS操作步驟如下: 由上圖可以看出,已生成標(biāo)準(zhǔn)化變量。 步驟二、以標(biāo)準(zhǔn)化變換后的因變量為因變量,以標(biāo)準(zhǔn)化后的各自變量為自變量,重新建立回歸方程,得到的回歸系數(shù)即標(biāo)準(zhǔn)化回歸系數(shù)。 由上圖與開篇的第一張圖比較可以看出,藍(lán)色框中的非標(biāo)準(zhǔn)化回歸系數(shù)與一般線性回歸操作的標(biāo)準(zhǔn)化回歸系數(shù)一致。 其實,從上圖中就可以看出:變量標(biāo)準(zhǔn)化后的回歸分析中,得到的非標(biāo)準(zhǔn)化回歸系數(shù)即標(biāo)準(zhǔn)化回歸系數(shù)(藍(lán)色框與紅色框結(jié)果一致)。 至此,第一步驗證成功! 第二歩 標(biāo)準(zhǔn)化系數(shù)的實際應(yīng)用 由于因變量與自變量的標(biāo)準(zhǔn)化轉(zhuǎn)換后,標(biāo)準(zhǔn)化變量均是服從均值為0,標(biāo)準(zhǔn)差為1 的標(biāo)準(zhǔn)正態(tài)分布,且十分重要的一點是,所有的標(biāo)準(zhǔn)化變量均沒有了量綱,且離散程度相同(標(biāo)準(zhǔn)差均為1)。 所以,計算出的標(biāo)準(zhǔn)化回歸系數(shù)不受變量的量綱影響。進而,各自變量的標(biāo)準(zhǔn)化回歸系數(shù)之間是可以直接比較大小的。 標(biāo)準(zhǔn)化的變量是以一個變量自身的標(biāo)準(zhǔn)差為單位的。標(biāo)準(zhǔn)化回歸系數(shù)也就是其他自變量保持不變的情況下,該自變量變化一個單位(也就是一個標(biāo)準(zhǔn)差),因變量變化多少個單位的標(biāo)準(zhǔn)差。 各自變量的標(biāo)準(zhǔn)化回歸系數(shù)的比較反映各自變量對因變量的貢獻(xiàn)誰大誰小。 在實際應(yīng)用中,遇到“各自變量對因變量的作用大小比較”的問題。在排除了強影響點和多重共線性的前提下,應(yīng)看各自變量的標(biāo)準(zhǔn)化回歸系數(shù)。因為標(biāo)準(zhǔn)化回歸系數(shù)消除了自變量單位的影響,具有可比性。 下面,將開篇的案例結(jié)果進行解釋: 根據(jù)上表結(jié)果可以看出,對肺活量的貢獻(xiàn)大小,從高到低依次為身高、體重、胸圍。在這三個自變量中,身高對肺活量的影響作用最大。 總結(jié) 標(biāo)準(zhǔn)化回歸系數(shù)是指數(shù)據(jù)標(biāo)準(zhǔn)化以后算出來的回歸系數(shù),非標(biāo)準(zhǔn)化回歸系數(shù)就是用原來的數(shù)據(jù)算出來的回歸系數(shù)。 如果是要寫出回歸方程的話,就要用非標(biāo)準(zhǔn)化回歸系數(shù)。 如果是要比較各自變量對因變量的貢獻(xiàn)大小,就要用標(biāo)準(zhǔn)化回歸系數(shù)來比較。 ps:另外,路徑分析中的路徑參數(shù)就是標(biāo)準(zhǔn)化回歸系數(shù)。標(biāo)準(zhǔn)化回歸系數(shù)還可以用于進一步的路徑分析中。統(tǒng)計分析方法學(xué)到最后你會發(fā)現(xiàn)很多相互連通的地方,很有意思。 松哥說:多元線性回歸中不可避免會碰到非標(biāo)準(zhǔn)化回歸系數(shù)和標(biāo)準(zhǔn)化回歸系數(shù)的結(jié)果解釋。跟著本期一起,自己動手驗證一下標(biāo)準(zhǔn)化回歸系數(shù)的計算思路,加深印象,懂了思路才會應(yīng)用哦!一句話:用標(biāo)準(zhǔn)化回歸系數(shù)來比較各自變量對因變量的貢獻(xiàn)大小,其他的應(yīng)用(如路徑分析等)后續(xù)有機會再聊。一起加油吧! |
|
|