|
一、問(wèn)題與數(shù)據(jù) 在臨床研究中,經(jīng)常會(huì)比較兩種治療方式對(duì)患者結(jié)局的影響,并且多次測(cè)量結(jié)局。例如,為了研究?jī)煞N降壓藥物對(duì)血壓的控制效果是否存在差異,研究者會(huì)對(duì)兩個(gè)人群服藥后在不同時(shí)間點(diǎn)記錄血壓值,然后評(píng)價(jià)降壓效果?;蛘邔?duì)兩組動(dòng)物分別施加兩種干預(yù),連續(xù)記錄多個(gè)時(shí)間點(diǎn)的結(jié)局,然后比較兩種干預(yù)的效果。 這種設(shè)計(jì)可以用如下示意圖表示: 另外,有時(shí)研究只需要收集一個(gè)時(shí)間點(diǎn)的數(shù)據(jù),但是一個(gè)研究對(duì)象會(huì)提供多個(gè)部位的數(shù)據(jù)點(diǎn)。例如,研究者想評(píng)價(jià)冠心病患者在冠脈搭橋術(shù)后應(yīng)用阿司匹林是否可以有效降低患者血管的再堵塞,評(píng)價(jià)的方法是術(shù)后1年做冠脈造影觀察血管是否堵塞,但是每個(gè)患者可能會(huì)在同一次手術(shù)中對(duì)多條冠狀動(dòng)脈血管進(jìn)行搭橋,因此有的患者可能會(huì)貢獻(xiàn)多組數(shù)據(jù)。 這種設(shè)計(jì)可以用如下示意圖表示: 以上兩種設(shè)計(jì),不管是臨床試驗(yàn)還是動(dòng)物試驗(yàn)都非常常見(jiàn),它的特點(diǎn)在于數(shù)據(jù)間非獨(dú)立,同一個(gè)體間數(shù)據(jù)具有相關(guān)性。對(duì)于這樣的設(shè)計(jì)類型,該如何分析呢? 今天我們來(lái)介紹另外一種非常好的方法——廣義估計(jì)方程(GEE)。GEE既可以處理連續(xù)型結(jié)局變量也可以處理分類型結(jié)局變量,它實(shí)際上代表了一種模型類別,即在傳統(tǒng)模型的基礎(chǔ)上對(duì)相關(guān)性數(shù)據(jù)進(jìn)行了校正,可以擬合Logistic回歸、泊松回歸、Probit回歸、一般線性回歸等廣義線性模型。 本文將以阿司匹林預(yù)防冠脈搭橋后血管再堵塞為例介紹運(yùn)用SPSS進(jìn)行GEE的操作方法。以下為數(shù)據(jù)格式: 表1. 數(shù)據(jù)格式 每名患者貢獻(xiàn)數(shù)據(jù)量不等。如編號(hào)為1的患者只對(duì)一根血管進(jìn)行了搭橋手術(shù),編號(hào)為2的患者則有兩根血管進(jìn)行搭橋手術(shù)。 表2. 變量賦值 (注:本例中數(shù)據(jù)純屬虛構(gòu),分析結(jié)果不能產(chǎn)生任何結(jié)論。性別為待調(diào)整變量。) 二、SPSS分析方法 1. 數(shù)據(jù)錄入SPSS 首先在SPSS變量視圖(Variable View)中新建上述表2中變量,然后在數(shù)據(jù)視圖(Data View)中錄入數(shù)據(jù)。
2. 選擇Analyze → Generalized Linear Models → Generalized Estimating Equations 3. 選項(xiàng)設(shè)置 ① 在Repeated模塊中,將患者ID選入Subject variables 框,搭橋血管Num選入Within-subject variables框。在Working Correlation Matrix的Structure下拉列表中選擇同一患者貢獻(xiàn)數(shù)據(jù)的相關(guān)性結(jié)構(gòu)。其有5個(gè)選項(xiàng),分別為:
本例中,同一患者搭橋的血管互相之間應(yīng)等同看待,兩兩間相關(guān)性應(yīng)相等,因此選擇等相關(guān)更合適。其他維持默認(rèn)。
② 在Type of Model模塊中設(shè)置模型類型 在此界面有6種模型類型可選:
以上6大類類型下還需選擇連接函數(shù)。本例中結(jié)局變量為二分類變量,Logistic回歸應(yīng)用更加普遍,因此我們選擇Binary logistic來(lái)擬合校正數(shù)據(jù)相關(guān)性的Logistic回歸模型。
③ 在Response模塊指定結(jié)局變量 將Outcome變量選入Dependent Variable,在Reference Category中選擇最小值作為參考值(本例中0為最小值,代表未發(fā)生結(jié)局)。
④ 在Predictors模塊中將要納入模型的Treatment和Sex變量選入Covariates中。Covariates應(yīng)放入連續(xù)型變量,F(xiàn)actors中放入分類變量,但是本例中兩自變量均為二分類變量,放入Covariates處也可。
⑤ 在Model模塊中將Treatment和Sex選入Model框內(nèi),還可納入交互項(xiàng),本例中不納入。
⑥ 在Statistics模塊中除默認(rèn)外,另外勾選Include exponential parameter estimates以獲得OR值,然后點(diǎn)擊OK。
三、結(jié)果解讀 結(jié)果中首先給出的是一些模型基本信息,在此略過(guò)。這里僅介紹模型參數(shù)估計(jì)值結(jié)果:
從結(jié)果可以看到,Treatment變量的系數(shù)值(B)為-1.077,Exp(B)為0.341,即OR值,P=0.046,說(shuō)明術(shù)后使用阿司匹林的患者1年后發(fā)生血管再堵塞的風(fēng)險(xiǎn)是使用安慰劑組的0.341倍且有統(tǒng)計(jì)學(xué)意義,即阿司匹林具有保護(hù)作用。另外我們納入校正的性別變量Sex OR值為0.692,但P=0.531未達(dá)顯著水平。 如果我們不考慮數(shù)據(jù)間的相關(guān)性,直接采用傳統(tǒng)的Logistic回歸模型,那么將得到以下結(jié)果(詳情可看: SPSS實(shí)例教程:二分類Logistic回歸):
從結(jié)果中可以看到,盡管Treatment的OR值與GEE模型中相差不大,但其P值卻不再顯著。從本例中可以看到,如果在數(shù)據(jù)分析中方法選用錯(cuò)誤將可能得不到正確結(jié)論。 四、結(jié)果匯總 冠脈搭橋術(shù)后患者應(yīng)用阿司匹林可以有效降低發(fā)生血管堵塞的風(fēng)險(xiǎn)。服用阿司匹林組患者發(fā)生血管堵塞風(fēng)險(xiǎn)是服用安慰劑組患者的0.341倍(P=0.046)。 五、總結(jié)與拓展 對(duì)于文首提及的兩個(gè)例子,常見(jiàn)的分析方法有重復(fù)測(cè)量方差分析和多水平模型,但是重復(fù)測(cè)量方差分析要求結(jié)局變量為連續(xù)變量,不適用于分類變量。多水平模型處理相關(guān)性數(shù)據(jù)時(shí)非常靈活,結(jié)局可以為連續(xù)變量,也可以為分類變量,應(yīng)用非常廣泛。 GEE的應(yīng)用似乎沒(méi)有前兩種廣泛,但其具有非常好的特性。GEE既可以處理連續(xù)型結(jié)局變量也可以處理分類型結(jié)局變量,其優(yōu)勢(shì)在于,即使設(shè)定的數(shù)據(jù)間相關(guān)結(jié)構(gòu)與實(shí)際有偏差,在樣本量較大時(shí)其模型估計(jì)參數(shù)仍然具有無(wú)偏性。GEE模型中自變量系數(shù)估計(jì)值準(zhǔn)確性的論證相較于多水平模型更加充分,因此部分研究者更加推薦使用GEE。 雖然GEE模型中數(shù)據(jù)間相關(guān)結(jié)構(gòu)指定錯(cuò)誤時(shí)模型系數(shù)也具有無(wú)偏性,但前提是樣本量要足夠大。在同樣的樣本量下,正確的相關(guān)結(jié)構(gòu)更可能得到準(zhǔn)確的參數(shù)估計(jì)和置信區(qū)間,因此應(yīng)仔細(xì)分析數(shù)據(jù)類型,選擇最可能正確的相關(guān)結(jié)構(gòu)。 |
|
|
來(lái)自: teszsz > 《生物學(xué)知識(shí)》