电竞比分网-中国电竞赛事及体育赛事平台

分享

唐金陵:病因、病因模型與因果關(guān)系推斷(五)

 yuhaizju 2019-08-04

目錄

第一節(jié) 病因的基本概念

第二節(jié) 病因?qū)W說與病因模型

第三節(jié) 充分病因-組分病因模型

第四節(jié) 發(fā)現(xiàn)和驗證病因

第五節(jié) 因果關(guān)系推論

一、科學(xué)推論的一般原則

二、評價單個研究的真實性

(一)真實性和研究質(zhì)量

(二)決定研究質(zhì)量的因素

(三)評價研究質(zhì)量的方法

三、綜合所有證據(jù)的推論:希爾準(zhǔn)則

四、綜合所有證據(jù)的推論:系統(tǒng)綜述

五、病因推論的困難

第五節(jié) 因果關(guān)系推論

探索因果關(guān)系的流行病學(xué)研究是在人群中尋找因果關(guān)系三個基本條件的研究。和其他研究一樣,所有流行病學(xué)研究都不可能完全排除誤差存在的可能性,即使隊列研究和隨機對照試驗也不例外。根據(jù)研究設(shè)計和研究過程的特征,對研究中誤差及其大小進行評估,并利用現(xiàn)有知識進一步判斷研究結(jié)果的合理性,最后對因果關(guān)系存在的可能性做出判斷,這就是流行病研究推論因果關(guān)系的程序。

一、科學(xué)推論的一般原則

科學(xué)推論(scientific inference)是依據(jù)科學(xué)研究的結(jié)果對事物的本質(zhì)或普遍規(guī)律進行的推斷??茖W(xué)推論需要遵循一定的原則,按照一定的程序,推論的一個重要部分是對結(jié)論正確性的評估。

推論有三個層次,一是根據(jù)某具體研究進行的推論,二是根據(jù)所有同類研究進行的推論,三是根據(jù)所有有關(guān)證據(jù)進行的推論(表5)。每一項科學(xué)研究都是對其所探索的問題進行的一次探索。在單個研究層面上,推論結(jié)果的正確性首先取決于研究的相關(guān)性和設(shè)計類型。比如,動物實驗發(fā)現(xiàn)的病因未必能外推到人類。再如,病例系列研究可以用來探索病因,但是由于其設(shè)計框架的問題,無論研究的其他方面多么的嚴(yán)謹(jǐn),其因果關(guān)系的推論也不可能十分可靠。如果是一項高質(zhì)量的隨機對照試驗,其發(fā)現(xiàn)的因果關(guān)系應(yīng)是迄今可獲得的最可靠的結(jié)果。其次,推論的正確性取決于研究的方法學(xué)質(zhì)量和樣本量,研究質(zhì)量越高,樣本量越大,推論結(jié)果的正確性就越高。研究質(zhì)量的重要性大于樣本量,如果質(zhì)量很低,無論樣本量多大,結(jié)果都是不可信的。

表5 病因推論的兩個層次和兩個方面

A)病因推論的兩個層次

     ·單一研究內(nèi)(真實性)的推論

     ·基于現(xiàn)有所有相關(guān)證據(jù)的推論

     ·基于所有有關(guān)證據(jù)的推論

B)病因推論的兩個方面

     ·對定性結(jié)論的推論

     ·對定量結(jié)果的推論

假如一項研究是完美的,其人群代表性是高的,設(shè)計是合理的,測量是準(zhǔn)確的,執(zhí)行是嚴(yán)謹(jǐn)?shù)?,結(jié)果沒有任何誤差和偏倚,樣本量足夠大,那么該研究本身就足以對所研究的問題做出正確的推論。然而,完美的研究是不存在的,任何研究都可能存在這樣或那樣的問題,或多或少存在誤差和偏倚,因此可靠的推論往往不能基于單一的研究,而是建立在很多同類研究甚至相關(guān)研究的基礎(chǔ)之上。另外,其他有關(guān)知識和研究(如動物研究)結(jié)果可用來解釋因果關(guān)系的合理性,作為支持因果推論的補充證據(jù)。

下面將圍繞基于單個研究及所有證據(jù)的推論,討論因果關(guān)系推論的原則、程序和對結(jié)論正確性的判斷。

二、評價單個研究的真實性

即使是依據(jù)多項研究進行推論,原始研究的真實性(validity)仍然是推論正確性的重要決定因素,因此對原始研究真實性的評估是推論的前提。同理,評估一項研究的真實性也是流行病學(xué)病因推論的基礎(chǔ)。

(一)真實性和研究質(zhì)量

這里的真實性特指一項研究的內(nèi)部真實性(internal validity),即在研究條件下觀察的結(jié)果與真實的接近程度。研究的目的在于求得真實,觀察與真實之間的差別叫偏倚或系統(tǒng)誤差。一項研究的偏倚與其結(jié)果的內(nèi)部真實性成反比。決定研究結(jié)果內(nèi)部真實性的是研究的方法學(xué)質(zhì)量,或簡稱研究質(zhì)量(methodological quality)。研究質(zhì)量是對研究偏倚控制程度的總體衡量。因此,研究質(zhì)量決定研究結(jié)果的真實性,質(zhì)量越高,偏倚就越小,結(jié)果的真實性就越高,結(jié)論正確的可能性就越大。

(二)決定研究質(zhì)量的因素

研究的質(zhì)量由研究的偏倚控制措施決定。首先,研究設(shè)計是一項研究控制偏倚最基本的方法,一項研究的質(zhì)量首先取決于研究設(shè)計的種類。比如,評價療效時,從設(shè)計上講,隨機對照試驗的質(zhì)量一般應(yīng)高于非隨機的對照試驗,后者又高于病例對照研究。對于病因研究,隊列研究的質(zhì)量高于病例對照研究,后者又高于病例系列研究。

第二,研究的質(zhì)量進一步取決于流行病學(xué)研究的一般偏倚控制措施,如收集資料的準(zhǔn)確性、組間測量的一致性、樣本的代表性、減少失訪、足夠的觀察時間等。

第三,研究的質(zhì)量還取決于一類研究設(shè)計特有的偏倚控制措施,比如臨床試驗可使用隨機分組、分組隱匿、盲法、維持原隨機分組(intention-to-treat)分析等偏倚控制措施。但一項研究不一定采取所有這些措施。使用的越多,偏倚控制就越好,質(zhì)量就越高。

另外,樣本量決定抽樣誤差的大小,決定結(jié)果估計的精確性,本質(zhì)上也是研究結(jié)果與真實接近程度的決定因素之一。

(三)評價研究質(zhì)量的方法

評價一項研究的質(zhì)量就是對該研究設(shè)計和偏倚控制措施進行分析和評價。一個簡單、快速、粗略的評價方法是根據(jù)研究設(shè)計的類型,將研究質(zhì)量(或研究提供的證據(jù)質(zhì)量)進行分級。圖10 是對病因證據(jù)的分級,不同研究提供的證據(jù)質(zhì)量自下而上逐漸遞增。證據(jù)分級(hierarchy of evidence)是快速評估真實性常用的參考工具。對于療效證據(jù)的分級,隊列研究上面還有隨機對照試驗。

圖10 研究設(shè)計與證據(jù)質(zhì)量

在研究設(shè)計的基礎(chǔ)上,更詳細的評價方法允許對同一類研究,根據(jù)其偏倚控制措施的多少和嚴(yán)謹(jǐn)程度,做進一步的質(zhì)量劃分。比如,對于一項隊列研究,可根據(jù)其收集資料的準(zhǔn)確性、樣本的代表性、失訪率、觀察時間的長短、混雜控制等,以及這些措施實施的適當(dāng)程度,將隊列研究的質(zhì)量進一步分為幾個等級。

將證據(jù)更加詳細地分級在理論上是可行的,但詳細證據(jù)分級方法的可重復(fù)性和實用價值有待研究。一般認(rèn)為將研究質(zhì)量分為3-5級就可以滿足病因推論的需要。比如:1, 高質(zhì)量:本研究的結(jié)論很可能是正確的;2, 中等質(zhì)量:未來研究有可能會改變本研究的結(jié)論;3, 低質(zhì)量:未來研究很有可能會改變本研究的結(jié)論;4, 很低質(zhì)量:本研究的結(jié)論很可能是錯誤的。

三、綜合所有證據(jù)的推論:希爾準(zhǔn)則

因果關(guān)系推斷就是判定兩個因素之間是否存在真實的因果關(guān)系,是科學(xué)推論的一種。病因推斷是因果關(guān)系推斷的一種,就是判定某因素是否某疾病真正的病因。

全面的病因推斷必須基于目前所有相關(guān)的研究,研究人類疾病病因,在人群中進行的流行病學(xué)研究提供了最重要最直接的證據(jù),而其他(如離體和動物)研究的證據(jù)或可用于形成病因假設(shè),或可用做人群研究的補充證據(jù)。

嚴(yán)格來講,因果關(guān)系推斷包括兩個層面,一是兩個事件之間是否存在因果關(guān)系,二是該因果關(guān)系的強弱,前者是對定性結(jié)論的推斷,后者是對定量結(jié)論的推斷,相對更難(表5)。目前常講的因果推斷主要指定性推斷。希爾(Hill)的九個條件是依據(jù)多項研究進行病因推論時常用的準(zhǔn)則。

1962年多爾(Doll)和希爾提出用流行病研究結(jié)果判斷病因的5條標(biāo)準(zhǔn),1965年又將此標(biāo)準(zhǔn)增加為9條(表6)。今天,該標(biāo)準(zhǔn)常被簡稱為希爾準(zhǔn)則 (Hill's Criteria),仍廣泛地用于人群研究中判斷因果關(guān)系。

表6 希爾病因推斷的九條標(biāo)準(zhǔn)

1.時間順序(temporal order)

2.關(guān)聯(lián)強度(strength of association)

3.劑量反應(yīng)關(guān)系(dose-response  relation)

4.結(jié)果的一致性(consistency)

5.實驗證據(jù)(experimental evidence)

6.合理性(plausibility)

7.生物學(xué)一致性(coherence)

8.特異性(specificity)

9.相似性(analogy)

· [預(yù)測力(predictive   performance), Susser 1991]

1.時間順序(temporal order)  時間順序指因必須先于果發(fā)生的時間關(guān)系,是判斷因果關(guān)系的必要條件。時間順序是任何一項流行病學(xué)研究必須提供的證據(jù),它寓于研究設(shè)計之中。例如,在隊列研究伊始,可疑病因已經(jīng)存在,但結(jié)果事件還沒有發(fā)生。在時間順序的可信度上,臨床試驗、隊列研究、病例對照研究和橫斷面研究依次降低。

2.關(guān)聯(lián)強度(strength of association)  關(guān)聯(lián)強度是用來評價病因和疾病之間關(guān)聯(lián)度高低的指標(biāo),一般用相對危險指標(biāo)衡量,如相對危險度和比值比。兩個因素間關(guān)聯(lián)強度越高,該結(jié)果完全由于偏倚產(chǎn)生的可能性就越小,二者間存在因果關(guān)聯(lián)的可能性就越大。比如,吸煙和肺癌之間的相對危險度約為13,是極少見的高關(guān)聯(lián)強度,因此認(rèn)為吸煙是肺癌病因的可能性很大。關(guān)聯(lián)強度指標(biāo)也是任何一項流行病學(xué)研究必須提供的信息。

3.劑量反應(yīng)關(guān)系(dose-response relation)  指疾病的發(fā)生率隨可疑病因的強度或數(shù)量的變化而變化的現(xiàn)象。劑量反應(yīng)關(guān)系的存在進一步支持因果關(guān)系的存在。

時間順序、關(guān)聯(lián)強度和劑量反應(yīng)關(guān)系指標(biāo)都是一項流行病學(xué)研究內(nèi)部即可提供的信息。

4.研究的一致性(consistency)  指同類研究結(jié)果的一致性,一致性越高,因果關(guān)系的可能性就越大。評估一致性需要比較不同的研究,不能在一個研究內(nèi)得出一致性的結(jié)論。一致性又叫可重復(fù)性(repeatability),是不同時間、不同地點、不同人群、不同研究者使用類似的研究方法可重復(fù)獲得相同或類似結(jié)果的可能性。被重復(fù)的次數(shù)越多,一致性越高,因果關(guān)系存在的可能性就越大。

5.實驗證據(jù)(experimental evidence)  實驗證據(jù)指關(guān)于某關(guān)聯(lián)的實驗性研究證據(jù)。在人群中的病因研究都屬于觀察性研究,觀察性研究的結(jié)論可能出錯,可以用更可靠的實驗性研究加以確證。例如,用隨機對照試驗證明在人群中減少吸煙可以降低肺癌的發(fā)病率,就是實驗證據(jù)。

6.生物學(xué)合理性(plausibility)  生物學(xué)合理性指某病因假設(shè)與該疾病有關(guān)的事實、知識和理論相符合或一致的程度,或前者與后者不相悖的程度。生物學(xué)合理性越高,因果關(guān)系的可能就越大。

7.生物學(xué)一致性(coherence)  生物學(xué)一致性指某病因假設(shè)與現(xiàn)有更一般的生物醫(yī)學(xué)事實、知識和理論相符合或一致的程度,或前者可以被后者解釋的程度。生物學(xué)一致性越高,因果關(guān)系的可能就越大。有人認(rèn)為,生物學(xué)合理性和生物學(xué)一致性十分近似,可以合二為一。

8.特異性(specificity)  特異性指病因和疾病之間的排他性或特異程度。如果一種病因只能引起一種疾病,或只在某特殊人群引起疾病,且該疾病只有一種病因,該病因與疾病的關(guān)系具有高度特異性。特異性越高,因果關(guān)系的可能就越大。

9.相似性(analogy)  相似性指存在已知的類似的病因和疾病的因果關(guān)系,由于可以類比的因果關(guān)系的存在,將加強新的因果關(guān)系的可能性。例如,如果已知某化學(xué)物有致癌作用,當(dāng)發(fā)現(xiàn)另一種類似的化學(xué)物與同一種癌癥也存在關(guān)聯(lián)時,類似的化學(xué)物質(zhì)也可致癌的可能性將加大。

10.在希爾準(zhǔn)則的基礎(chǔ)上,1991年美國流行病學(xué)家Marvyn Susser增加了預(yù)測力(predictive performance)一項,使該準(zhǔn)則共有10項標(biāo)準(zhǔn)。這是一項十分重要的補充。在科學(xué)上,對一個理論檢驗最有力的方法就是評估它的預(yù)測能力,簡單地說,就是利用該理論提出一個對未來或是過去的預(yù)測,然后再收集數(shù)據(jù)評估預(yù)測的正確性。比如,根據(jù)相對論可以預(yù)測核能的可能性,原子彈和核電站的成功反過來證明了相對論的正確性。再如,觀察性研究發(fā)現(xiàn)高血壓可能是心血管病的病因,依此可以預(yù)測降低血壓可以減少心血管病的發(fā)生,這個預(yù)測的確得到了抗高血壓藥物隨機對照試驗的支持,更進一步證明了高血壓是心血管病的病因的假說。

總之,以上10個標(biāo)準(zhǔn)中,存在關(guān)聯(lián)(包括劑量反應(yīng)關(guān)系)以及關(guān)聯(lián)的時間特征是判斷因果關(guān)系的必要條件和特異條件。必要的意思是它們必須存在,如果不存在,就可以否定因果關(guān)系的存在;特異的意思是這兩個條件是確立因果關(guān)系特有的條件,是每一項病因研究必須提供的信息,但不是論證其他問題的必要條件,如論證診斷的準(zhǔn)確性時則不需要。而其他7項條件是有關(guān)研究之間的信息或流行病學(xué)研究之外的知識,是非特異的條件,是科學(xué)推論中使用的一般性標(biāo)準(zhǔn),其中結(jié)果的一致性最為重要。它們又是非必要的條件,即缺乏任何一項或所有7項,都不能足以否定因果關(guān)系的存在。另外,所有10項條件都不是充分條件,即使兩個事件的關(guān)系滿足了所有10項條件,也不能百分百肯定它是因果關(guān)系。

希爾準(zhǔn)則存在幾個明顯的重要的缺陷:第一,沒有考慮收集的原始研究是否全面和完整。第二,對原始研究證據(jù)的真實性(即原始研究的方法學(xué)質(zhì)量)沒有考評。如果兩個因素之間符合所有10個條件,提示二者很可能存在因果關(guān)系,但是如果關(guān)于這些條件的證據(jù)是不可信的,則沒有理由相信該因果關(guān)系的存在。

第三,希爾準(zhǔn)則將一個研究內(nèi)提供的信息以及可在研究間觀察到的信息和流行病學(xué)研究以外的信息混為一談,認(rèn)為它們是同等重要的。顯然,在判斷因果關(guān)系上,存在關(guān)聯(lián)(或劑量反應(yīng)關(guān)系)以及關(guān)聯(lián)的時間順序是特異的和必要條件,是判斷因果關(guān)系的基本條件,是特異的準(zhǔn)則。在非特異性準(zhǔn)則中,與生物學(xué)合理性、生物學(xué)一致性、特異性和相似性比較,研究的一致性、實驗證據(jù)和預(yù)測能力則更具有因果關(guān)系的判定能力。

第四,在非特異的標(biāo)準(zhǔn)中,一致性是最關(guān)鍵的條件,但是希爾對什么是一致性沒有量化的界定,因此很難判斷。況且,缺乏一致性可能是交互作用造成的,交互作用的存在支持了病因推斷的特異性的標(biāo)準(zhǔn),因此一致性不好不一定是因果關(guān)系不存在,甚至很可能相反,不可一概而論。

四、綜合所有證據(jù)的推論:系統(tǒng)綜述

20世紀(jì)末,循證醫(yī)學(xué)出現(xiàn),把對醫(yī)學(xué)領(lǐng)域因果關(guān)系的研究和推論推向了新的階段。循證醫(yī)學(xué)呼吁,臨床決策必須基于現(xiàn)有最好的證據(jù),這些證據(jù)主要指人群中進行的醫(yī)學(xué)應(yīng)用型研究。依據(jù)證據(jù)進行實踐,首先必須對證據(jù)的真實性進行評估。但是,循證醫(yī)學(xué)首先關(guān)注的不是病因,而是治療的效果和副作用,治療與其產(chǎn)生的效果和副作用的關(guān)系也是因果關(guān)系,因此循證醫(yī)學(xué)關(guān)注的主要是隨機對照臨床試驗,推斷的是治療與其效應(yīng)之間的因果關(guān)系。其次,提出和參與循證醫(yī)學(xué)的不是傳統(tǒng)關(guān)注病因研究的公共衛(wèi)生領(lǐng)域的流行病學(xué)家,而是關(guān)注臨床醫(yī)學(xué)人群研究的臨床流行病學(xué)家。

由于循證醫(yī)學(xué)這兩個特征,在證據(jù)評估的問題上,循證醫(yī)學(xué)似乎一開始就忽略了希爾的病因推論準(zhǔn)則,而是采納了新的系統(tǒng)綜述(systematic review) 和meta分析(meta-analysis) 提供的思路和方法。系統(tǒng)綜述加強了對原始研究收集的系統(tǒng)性以及對結(jié)果定量的推論,并在原始研究結(jié)果真實性、精確性和一致性方面,系統(tǒng)地提出了一套統(tǒng)一的定量評估方法。然而,殊途同歸,原始研究和系統(tǒng)綜述的設(shè)計和分析要素里包含了希爾的主要準(zhǔn)則,如時間順序、關(guān)聯(lián)強度、劑量反應(yīng)關(guān)系、實驗證據(jù)、一致性等。時間順序是隨機對照試驗的設(shè)計特征決定的,關(guān)聯(lián)強度和劑量反應(yīng)關(guān)系反映在隨機對照試驗的結(jié)果里,它們是進行因果關(guān)系推斷的必要因素,因為每項隨機對照試驗都必須具備,因此無需進行再評估。對于實驗證據(jù),隨機對照試驗提供的就是人群的實驗證據(jù)。對于一致性,系統(tǒng)綜述更是采用了定量的評估方法,即異質(zhì)性檢驗。系統(tǒng)綜述還提出了對異質(zhì)性原因的探究方法,是新的貢獻。

希爾的另4個標(biāo)準(zhǔn),即生物學(xué)合理性、生物學(xué)一致性、特異性和相似性比較,對判斷因果關(guān)系不十分重要,是系統(tǒng)綜述在結(jié)果討論中所涵蓋的內(nèi)容。比如,如果流行病學(xué)研究的結(jié)論與其他各種有關(guān)的研究結(jié)論一致,而且根據(jù)現(xiàn)有生物醫(yī)學(xué)知識判斷是合理的,因果關(guān)系的可能性進一步提高。

系統(tǒng)綜述可以說是對希爾準(zhǔn)則的科學(xué)的、系統(tǒng)的、定量的應(yīng)用和發(fā)展,并明確提出對原始研究質(zhì)量進行嚴(yán)格的評估。作為一種總結(jié)和評估研究文獻的方法,系統(tǒng)綜述也可能出現(xiàn)偏倚,降低其結(jié)論的可靠性。如何依據(jù)系統(tǒng)綜述進行因果關(guān)系推論,針對這個問題,近些年國際上開發(fā)了一些評估系統(tǒng)綜述真實性的工具,如“國際醫(yī)學(xué)推薦分級的研究、開發(fā)和評估(Grading of Recommendations Assessment, Development and Evaluation, GRADE)工作組”的工作,它們對真實性影響因素的討論和分析很值得參考。

五、病因推論的困難

有關(guān)病因推論,希爾曾說,我提出的九個準(zhǔn)則沒有一項可以對因果關(guān)系的存在與否提出確定無疑的證據(jù)。因果關(guān)系最多不過是一個嘗試性的主觀上的推論。任何科學(xué)工作都不是完美無缺的,所有科學(xué)證據(jù)都可能被顛覆或修正,科學(xué)推論永遠都帶著不確定性,我們永遠無法確切地知道一項研究結(jié)果的真實性,但是,證據(jù)的不確定性并不賦予我們可以無視現(xiàn)有證據(jù)的權(quán)利,不能作為延遲必要行動的理由和借口。

50年后,我們的確發(fā)展了一套更完善更合理的因果關(guān)系推論系統(tǒng)和準(zhǔn)則,但是在方法變得更加細致和量化的同時,人們再一次認(rèn)識到,科學(xué)推論的本質(zhì)是主觀的、模糊的,且?guī)е淮_定性,嚴(yán)謹(jǐn)?shù)姆椒ê土炕慕Y(jié)果未必能相應(yīng)地增加我們對決策的信心。因為在如何利用證據(jù)真實性進行決策的問題上,我們遠沒有找到滿意的答案。比如,當(dāng)證據(jù)質(zhì)量達到什么水平,我們就可以肯定地說結(jié)果是真實的?證據(jù)真實性是如何影響決策的?證據(jù)真實性的差別對決策的影響是什么?在滿意回答這些問題之前,追求更精確更定量的證據(jù)評估似乎有點盲目。在這些方面,系統(tǒng)綜述也不是最后答案,也許我們永遠也不會有最后的答案,因為證據(jù)只是影響決策的因素之一,其他因素包括資源的多少和人們的價值取向,而且同一證據(jù)在不同決策中的作用是變化的,不是固定不變的。

參考文獻

1.Rothman J. Causes. Am J Epidemiol. 1976;104:587-92.

2.Susser M. What is a cause and how do we know one? A grammar for pragmatic epidemiology. Am J Epidemiol. 1991;133:635-48.

3. Hill AB.The environment and disease: association or causation? Proc R Soc Med. 1965;58:295-300.

4.唐金陵. 第五章: 病因、病因模型與因果關(guān)系推斷. 見: 李立明. 流行病學(xué). 第一卷. 第三版. 北京: 人民衛(wèi)生出版社, 2015: 86-112.

5.唐金陵, 楊祖耀. 第十四章: 系統(tǒng)綜述與Meta分析. 見: 李立明. 流行病學(xué). 第一卷. 第三版. 北京: 人民衛(wèi)生出版社, 2015: 261-90.

(全文完)

原文出處:唐金陵. 第八章: 病因及其發(fā)現(xiàn)和推斷. 見: 詹思延. 流行病學(xué). 第八版. 北京: 人民衛(wèi)生出版社, 2017.

編輯:馮琦、黃蔚然、傅曉紅

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多