电竞比分网-中国电竞赛事及体育赛事平台

分享

SPSS:任你是非獨(dú)立的連續(xù)變量還是分類變量,都可以用它來(lái)處理!

 teszsz 2017-03-19

一、問(wèn)題與數(shù)據(jù)

在臨床研究中,經(jīng)常會(huì)比較兩種治療方式對(duì)患者結(jié)局的影響,并且多次測(cè)量結(jié)局。例如,為了研究?jī)煞N降壓藥物對(duì)血壓的控制效果是否存在差異,研究者會(huì)對(duì)兩個(gè)人群服藥后在不同時(shí)間點(diǎn)記錄血壓值,然后評(píng)價(jià)降壓效果?;蛘邔?duì)兩組動(dòng)物分別施加兩種干預(yù),連續(xù)記錄多個(gè)時(shí)間點(diǎn)的結(jié)局,然后比較兩種干預(yù)的效果。


這種設(shè)計(jì)可以用如下示意圖表示:


另外,有時(shí)研究只需要收集一個(gè)時(shí)間點(diǎn)的數(shù)據(jù),但是一個(gè)研究對(duì)象會(huì)提供多個(gè)部位的數(shù)據(jù)點(diǎn)。例如,研究者想評(píng)價(jià)冠心病患者在冠脈搭橋術(shù)后應(yīng)用阿司匹林是否可以有效降低患者血管的再堵塞,評(píng)價(jià)的方法是術(shù)后1年做冠脈造影觀察血管是否堵塞,但是每個(gè)患者可能會(huì)在同一次手術(shù)中對(duì)多條冠狀動(dòng)脈血管進(jìn)行搭橋,因此有的患者可能會(huì)貢獻(xiàn)多組數(shù)據(jù)。


這種設(shè)計(jì)可以用如下示意圖表示:


以上兩種設(shè)計(jì),不管是臨床試驗(yàn)還是動(dòng)物試驗(yàn)都非常常見(jiàn),它的特點(diǎn)在于數(shù)據(jù)間非獨(dú)立,同一個(gè)體間數(shù)據(jù)具有相關(guān)性。對(duì)于這樣的設(shè)計(jì)類型,該如何分析呢? 


今天我們來(lái)介紹另外一種非常好的方法——廣義估計(jì)方程(GEE)。GEE既可以處理連續(xù)型結(jié)局變量也可以處理分類型結(jié)局變量,它實(shí)際上代表了一種模型類別,即在傳統(tǒng)模型的基礎(chǔ)上對(duì)相關(guān)性數(shù)據(jù)進(jìn)行了校正,可以擬合Logistic回歸、泊松回歸、Probit回歸、一般線性回歸等廣義線性模型。


本文將以阿司匹林預(yù)防冠脈搭橋后血管再堵塞為例介紹運(yùn)用SPSS進(jìn)行GEE的操作方法。以下為數(shù)據(jù)格式:


表1. 數(shù)據(jù)格式


每名患者貢獻(xiàn)數(shù)據(jù)量不等。如編號(hào)為1的患者只對(duì)一根血管進(jìn)行了搭橋手術(shù),編號(hào)為2的患者則有兩根血管進(jìn)行搭橋手術(shù)。


表2. 變量賦值

(注:本例中數(shù)據(jù)純屬虛構(gòu),分析結(jié)果不能產(chǎn)生任何結(jié)論。性別為待調(diào)整變量。)

二、SPSS分析方法

1. 數(shù)據(jù)錄入SPSS


首先在SPSS變量視圖(Variable View)中新建上述表2中變量,然后在數(shù)據(jù)視圖(Data View)中錄入數(shù)據(jù)。


 

2. 選擇Analyze → Generalized Linear Models → Generalized Estimating Equations



3. 選項(xiàng)設(shè)置


在Repeated模塊中,將患者ID選入Subject variables 框,搭橋血管Num選入Within-subject variables框。在Working Correlation Matrix的Structure下拉列表中選擇同一患者貢獻(xiàn)數(shù)據(jù)的相關(guān)性結(jié)構(gòu)。其有5個(gè)選項(xiàng),分別為:


  • Independent:各數(shù)據(jù)間獨(dú)立,即同一患者貢獻(xiàn)的數(shù)據(jù)可以視為來(lái)源于不同個(gè)體。


  • AR(1):自相關(guān),用于不同時(shí)間點(diǎn)的數(shù)據(jù),相鄰時(shí)間點(diǎn)相關(guān)性最大,時(shí)間間距越大相關(guān)性越小。


  • Exchangeable:等相關(guān),各數(shù)據(jù)點(diǎn)的相關(guān)性均相等。


  • M-dependent:相鄰相關(guān),僅臨近的M+1個(gè)數(shù)據(jù)相關(guān)。


  • Unstructured:不限定相關(guān)結(jié)構(gòu),由數(shù)據(jù)本身決定。


本例中,同一患者搭橋的血管互相之間應(yīng)等同看待,兩兩間相關(guān)性應(yīng)相等,因此選擇等相關(guān)更合適。其他維持默認(rèn)。


 

在Type of Model模塊中設(shè)置模型類型


在此界面有6種模型類型可選:


  • Scale Response:結(jié)局變量為連續(xù)型變量


  • Ordinal Response:結(jié)局變量為有序分類變量


  • Counts:結(jié)局變量為計(jì)數(shù)


  • Binary Response or Events/Trials Data:結(jié)局變量為二分類變量


  • Mixture:結(jié)局變量為T(mén)weedie分布變量


  • Custom:自定義


以上6大類類型下還需選擇連接函數(shù)。本例中結(jié)局變量為二分類變量,Logistic回歸應(yīng)用更加普遍,因此我們選擇Binary logistic來(lái)擬合校正數(shù)據(jù)相關(guān)性的Logistic回歸模型。


 

在Response模塊指定結(jié)局變量


將Outcome變量選入Dependent Variable,在Reference Category中選擇最小值作為參考值(本例中0為最小值,代表未發(fā)生結(jié)局)。


 

在Predictors模塊中將要納入模型的Treatment和Sex變量選入Covariates中。Covariates應(yīng)放入連續(xù)型變量,F(xiàn)actors中放入分類變量,但是本例中兩自變量均為二分類變量,放入Covariates處也可。


 

在Model模塊中將Treatment和Sex選入Model框內(nèi),還可納入交互項(xiàng),本例中不納入。


 

在Statistics模塊中除默認(rèn)外,另外勾選Include exponential parameter estimates以獲得OR值,然后點(diǎn)擊OK。


三、結(jié)果解讀

結(jié)果中首先給出的是一些模型基本信息,在此略過(guò)。這里僅介紹模型參數(shù)估計(jì)值結(jié)果:


 

從結(jié)果可以看到,Treatment變量的系數(shù)值(B)為-1.077,Exp(B)為0.341,即OR值,P=0.046,說(shuō)明術(shù)后使用阿司匹林的患者1年后發(fā)生血管再堵塞的風(fēng)險(xiǎn)是使用安慰劑組的0.341倍且有統(tǒng)計(jì)學(xué)意義,即阿司匹林具有保護(hù)作用。另外我們納入校正的性別變量Sex OR值為0.692,但P=0.531未達(dá)顯著水平。


如果我們不考慮數(shù)據(jù)間的相關(guān)性,直接采用傳統(tǒng)的Logistic回歸模型,那么將得到以下結(jié)果(詳情可看: SPSS實(shí)例教程:二分類Logistic回歸):


 

從結(jié)果中可以看到,盡管Treatment的OR值與GEE模型中相差不大,但其P值卻不再顯著。從本例中可以看到,如果在數(shù)據(jù)分析中方法選用錯(cuò)誤將可能得不到正確結(jié)論。

四、結(jié)果匯總

冠脈搭橋術(shù)后患者應(yīng)用阿司匹林可以有效降低發(fā)生血管堵塞的風(fēng)險(xiǎn)。服用阿司匹林組患者發(fā)生血管堵塞風(fēng)險(xiǎn)是服用安慰劑組患者的0.341倍(P=0.046)。

五、總結(jié)與拓展

對(duì)于文首提及的兩個(gè)例子,常見(jiàn)的分析方法有重復(fù)測(cè)量方差分析和多水平模型,但是重復(fù)測(cè)量方差分析要求結(jié)局變量為連續(xù)變量,不適用于分類變量。多水平模型處理相關(guān)性數(shù)據(jù)時(shí)非常靈活,結(jié)局可以為連續(xù)變量,也可以為分類變量,應(yīng)用非常廣泛。


GEE的應(yīng)用似乎沒(méi)有前兩種廣泛,但其具有非常好的特性。GEE既可以處理連續(xù)型結(jié)局變量也可以處理分類型結(jié)局變量,其優(yōu)勢(shì)在于,即使設(shè)定的數(shù)據(jù)間相關(guān)結(jié)構(gòu)與實(shí)際有偏差,在樣本量較大時(shí)其模型估計(jì)參數(shù)仍然具有無(wú)偏性。GEE模型中自變量系數(shù)估計(jì)值準(zhǔn)確性的論證相較于多水平模型更加充分,因此部分研究者更加推薦使用GEE。


雖然GEE模型中數(shù)據(jù)間相關(guān)結(jié)構(gòu)指定錯(cuò)誤時(shí)模型系數(shù)也具有無(wú)偏性,但前提是樣本量要足夠大。在同樣的樣本量下,正確的相關(guān)結(jié)構(gòu)更可能得到準(zhǔn)確的參數(shù)估計(jì)和置信區(qū)間,因此應(yīng)仔細(xì)分析數(shù)據(jù)類型,選擇最可能正確的相關(guān)結(jié)構(gòu)。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多