电竞比分网-中国电竞赛事及体育赛事平台

分享

吳家睿:“多學(xué)科研究的三種形態(tài)”

 菌心說 2021-05-19

《中國科學(xué)基金》2021年第35卷第2期封面

專題:交叉科學(xué)前沿與發(fā)展

      【編者按】2020年11月29日,國家自然科學(xué)基金委員會(huì)交叉科學(xué)高端學(xué)術(shù)論壇在京召開。來自計(jì)算數(shù)學(xué)、人工智能、生物物理、人因工程、量子計(jì)算、納米生物學(xué)、地磁學(xué)、類腦科學(xué)、材料學(xué)等跨學(xué)科交叉研究領(lǐng)域的32位專家學(xué)者出席會(huì)議。與會(huì)專家一致認(rèn)為,學(xué)科交叉融合是未來科學(xué)發(fā)展的必然趨勢(shì),是加速科技創(chuàng)新的重要驅(qū)動(dòng)力。為進(jìn)一步推動(dòng)交叉學(xué)科繁榮發(fā)展,《中國科學(xué)基金》編輯部會(huì)同交叉科學(xué)部就本次高端學(xué)術(shù)論壇組約了“交叉科學(xué)前沿與發(fā)展”專題,特邀中國科協(xié)名譽(yù)主席韓啟德院士、吳家睿研究員、張禮和院士、潘永信院士、杜江峰院士、趙宇亮院士、陳善廣研究員(國際宇航科學(xué)院院士)、雒建斌院士等專家,分別撰寫了專題文章,以饗讀者。 

本次推送《中國科學(xué)基金》2021年第2期“交叉科學(xué)前沿與發(fā)展”專題系列文章之二——吳家睿:“多學(xué)科研究的三種形態(tài)”。歡迎廣大讀者轉(zhuǎn)載、推送、引用。
查看期刊更多文章信息請(qǐng)點(diǎn)擊文末 閱讀原文。
  
多學(xué)科研究的三種形態(tài)  

吳家睿1,2*

1. 中國科學(xué)院大學(xué) 杭州高等研究院生命與健康科學(xué)學(xué)院,杭州

2. 中國科學(xué)院 分子細(xì)胞科學(xué)卓越創(chuàng)新中心,上海

吳家睿  中國科學(xué)院分子細(xì)胞科學(xué)卓越創(chuàng)新中心研究員;現(xiàn)任國科大杭州高等研究院生命與健康科學(xué)學(xué)院執(zhí)行院長,中國科學(xué)院系統(tǒng)生物學(xué)重點(diǎn)實(shí)驗(yàn)室主任。擔(dān)任Journal of Molecular Cell Biology主編,BMC Systems BiologyFrontiers in Systems Physiology副主編,《醫(yī)學(xué)與哲學(xué)》和《生命的化學(xué)》副主編,中國生物化學(xué)與分子生物學(xué)會(huì)分子系統(tǒng)生物學(xué)專業(yè)委員會(huì)主任委員。國家杰出青年科學(xué)基金獲得者,中國科學(xué)院“百人計(jì)劃”入選者;上海市領(lǐng)軍人才入選者。發(fā)表學(xué)術(shù)論文100多篇。

摘  要

多學(xué)科研究在現(xiàn)代科學(xué)的發(fā)展中扮演著重要角色,呈現(xiàn)出三種主要形態(tài)。第一種形態(tài)是交叉學(xué)科研究,往往通過不同學(xué)科之間的高度融合而形成全新的學(xué)科,如物理學(xué)、化學(xué)與生物學(xué)交叉形成了分子生物學(xué)。第二種形態(tài)是會(huì)聚研究,即不同學(xué)科的專業(yè)知識(shí)和技術(shù)進(jìn)行集成和協(xié)作,用以解決涉及多個(gè)領(lǐng)域之間的界面上重大科學(xué)問題或者社會(huì)挑戰(zhàn)。第三種形態(tài)是當(dāng)前大數(shù)據(jù)時(shí)代所特有的——數(shù)據(jù)驅(qū)動(dòng)型研究,它利用大數(shù)據(jù)及其相應(yīng)的技術(shù)打通或者跨越各門學(xué)科的邊界,進(jìn)而可以開展跨領(lǐng)域的研究。

關(guān)鍵詞:多學(xué)科研究;交叉學(xué)科研究;會(huì)聚研究;數(shù)據(jù)驅(qū)動(dòng)型研究

中國科教領(lǐng)域最近迎來了一個(gè)發(fā)展多學(xué)科研究的高潮。2020年8月,國務(wù)院學(xué)位委員會(huì)會(huì)議決定,將“交叉學(xué)科”定為中國教育體系中的第14個(gè)學(xué)科門類;教育部網(wǎng)站隨后公布了160所高校提交的549個(gè)交叉學(xué)科備案名單。同年11月,國家自然科學(xué)基金委員會(huì)正式成立“交叉科學(xué)部”,負(fù)責(zé)統(tǒng)籌交叉科學(xué)領(lǐng)域基金資助等相關(guān)工作。2021年1月,國務(wù)院學(xué)位委員會(huì)、教育部發(fā)布《關(guān)于設(shè)置“交叉學(xué)科”門類、“集成電路科學(xué)與工程”和“國家安全學(xué)”一級(jí)學(xué)科的通知》,除了以法規(guī)的形式正式確立了“交叉學(xué)科”之地位,還首次批準(zhǔn)設(shè)立了屬于該門類的兩個(gè)一級(jí)學(xué)科。

然而,對(duì)許多人而言,多學(xué)科研究的具體內(nèi)涵并不一定很清楚,往往簡單地望文生義,理解為只要涉及到兩個(gè)或多個(gè)學(xué)科的研究就可以稱為交叉學(xué)科研究。從教育部公布的交叉學(xué)科備案名單就可以看到這個(gè)問題的存在。首先,許多高校提出了同樣的交叉學(xué)科名稱,但涉及到的一級(jí)學(xué)科卻各不一樣,如“生物信息學(xué)”作為一門交叉學(xué)科被3所高校列入其交叉學(xué)科名單中,但是,3所高校在其涉及到的一級(jí)學(xué)科卻有著不同的內(nèi)容:A學(xué)校標(biāo)出“生物學(xué)、數(shù)學(xué)”;B學(xué)校給出“生物學(xué)、生物醫(yī)學(xué)工程,基礎(chǔ)醫(yī)學(xué)”;C學(xué)校則提出“數(shù)學(xué)、生物學(xué)、計(jì)算機(jī)科學(xué)與技術(shù)”。此外,另有一所學(xué)校在“醫(yī)學(xué)生物信息學(xué)”的名稱下列入3個(gè)一級(jí)學(xué)科:數(shù)學(xué)、控制科學(xué)與工程、基礎(chǔ)醫(yī)學(xué);還有一所學(xué)校在“生物信息技術(shù)”的名稱下給出這樣3個(gè)一級(jí)學(xué)科:控制科學(xué)與工程、計(jì)算機(jī)科學(xué)與技術(shù)、生物醫(yī)學(xué)工程。其次,有些顯然不應(yīng)該屬于交叉學(xué)科范疇,如一所醫(yī)學(xué)院校把“包蟲病學(xué)”列入“交叉學(xué)科”,涉及到基礎(chǔ)醫(yī)學(xué)、臨床醫(yī)學(xué)、公共衛(wèi)生與預(yù)防醫(yī)學(xué)、藥學(xué)、公共管理等5個(gè)一級(jí)學(xué)科。按照這種邏輯,任何一種疾病的研究都可以稱之為一門“交叉學(xué)科”,因?yàn)橹辽僖婕暗脚R床醫(yī)學(xué)和藥學(xué)兩個(gè)一級(jí)學(xué)科。讓人更為擔(dān)心的是,有的單位對(duì)交叉學(xué)科的命名比較隨意,“生物功能分子學(xué)”是研究什么?從字面上看,與生物學(xué)有關(guān),但在學(xué)校列出的相關(guān)一級(jí)學(xué)科里,包括了化學(xué)、藥學(xué)、基礎(chǔ)醫(yī)學(xué)、食品科學(xué)與工程,唯獨(dú)沒有生物學(xué)。

從術(shù)語稱謂來看,“多學(xué)科研究”一詞的英文為Multidisciplinary Research,常常與“交叉學(xué)科研究”(Interdisciplinary Research)混用;而“交叉學(xué)科”則往往有一個(gè)非規(guī)范的英文名詞“Interdiscipline”,并有時(shí)等同于“交叉科學(xué)”(Interdisciplinary Science);近年來新興的“會(huì)聚科學(xué)”(Convergence Science)也常常被用來代表“交叉科學(xué)”。

從科學(xué)發(fā)展史來看,多學(xué)科研究是20世紀(jì)推動(dòng)科學(xué)和技術(shù)發(fā)展的主要?jiǎng)恿Γ贿M(jìn)入21世紀(jì),多學(xué)科研究的重要性只增不減。通過對(duì)生命科學(xué)發(fā)展歷程的梳理,筆者分析了多學(xué)科研究具有的主要形態(tài)及其相應(yīng)的特征,進(jìn)而揭示出多學(xué)科研究在科學(xué)進(jìn)程中的角色多樣性以及對(duì)科研范式影響的復(fù)雜性。

1 高度整合的交叉學(xué)科研究
隨著化學(xué)的發(fā)展,尤其是19世紀(jì)初期化學(xué)的一個(gè)分支學(xué)科——有機(jī)化學(xué)在歐洲的形成,研究者開始把化學(xué)與生物學(xué)整合在一起,如當(dāng)時(shí)的德國已經(jīng)出現(xiàn)了Zeitschrift fur Physiologische Chemie(《生理化學(xué)雜志》)這樣明顯具有交叉學(xué)科色彩的科學(xué)期刊。1905年的美國也誕生了一本相似的期刊——Journal of Biological Chemistry(《生物化學(xué)雜志》);在該雜志的第一屆編委會(huì)成員中,一位來自伯克利大學(xué)的科學(xué)家婁伯(Loeb J)在給主編的信中表達(dá)了他對(duì)學(xué)科交叉的信念:“生物學(xué)的未來建立在從化學(xué)的角度來研究生物學(xué)問題”[1]。

這種交叉學(xué)科首先體現(xiàn)在對(duì)生命本質(zhì)的研究之上。早期的研究者認(rèn)為,生物體的構(gòu)成材料與非生物體的有著根本的區(qū)別,前者稱為有機(jī)物,后者稱為無機(jī)物,且前者只能來自生物體而不能人為地用后者合成。1828年,德國化學(xué)家維勒(Wohler F)首次在實(shí)驗(yàn)室用氰酸和氨水兩種無機(jī)分子合成了一種有機(jī)分子“尿素”,從而證明了構(gòu)成生命的物質(zhì)和非生命的之間并沒有一個(gè)不可逾越的界限。研究者由此開始了對(duì)生物體的核酸、蛋白質(zhì)、糖和脂類等各種生物分子的研究;隨后誕生了一門化學(xué)與生物學(xué)高度整合的交叉學(xué)科——生物化學(xué)(Biochemistry);它被《大英百科全書》定義為:涉及發(fā)生在植物、動(dòng)物和微生物的化學(xué)物質(zhì)和過程的科學(xué)研究領(lǐng)域。也就是說,在研究者的眼里,生命只不過是化學(xué)研究中一種特定的對(duì)象,它的存在及其功能都建立在其構(gòu)成材料以及構(gòu)成方式之上。
生命科學(xué)領(lǐng)域中最重要的交叉學(xué)科是誕生于20世紀(jì)中葉的分子生物學(xué)。20世紀(jì)40年代,奧地利物理學(xué)家薛定諤(Schrodinger E)發(fā)表了《生命是什么》一書;他在書中明確提出,生命和非生命一樣,“在它內(nèi)部發(fā)生的事件必須遵循嚴(yán)格的物理學(xué)定律”[2];因此,研究者可以通過物理和化學(xué)的技術(shù)和方法來研究生物體的屬性或特征。最有代表性的是美國化學(xué)家鮑林(Pauling L)對(duì)蛋白質(zhì)空間結(jié)構(gòu)的研究;他應(yīng)用量子化學(xué)和X射線晶體學(xué)技術(shù)分析了蛋白質(zhì)上連接氨基酸殘基的肽鍵(C—N鍵),認(rèn)為肽鍵具有部分雙鍵的性質(zhì)而不能自由旋轉(zhuǎn),導(dǎo)致連接肽鍵兩端6個(gè)原子的空間位置處在一個(gè)相對(duì)接近的平面上,稱為“肽鍵平面”;他在此基礎(chǔ)上進(jìn)一步提出,蛋白質(zhì)內(nèi)的各個(gè)肽鍵平面之間可以通過連接它們的α-碳原子進(jìn)行旋轉(zhuǎn),從而可以形成α螺旋等二級(jí)結(jié)構(gòu)。此外,著名的DNA雙螺旋結(jié)構(gòu)也同樣是在物理學(xué)家、化學(xué)家和生物學(xué)家的通力合作下得以闡明;而遺傳密碼的主要提出人則是著名的物理學(xué)家伽莫夫(Gamow G)。由此可見,分子生物學(xué)是高度整合了物理學(xué)、化學(xué)和生物學(xué)的一門交叉學(xué)科(圖1A)。

圖1 多學(xué)科研究的三種形態(tài)

分子生物學(xué)的成功使得還原論思維成為了現(xiàn)代生命科學(xué)的主流方法論。在分子生物學(xué)家建構(gòu)的生命科學(xué)大廈里,所有研究對(duì)象無論是簡單的原核生物還是復(fù)雜的動(dòng)植物,都不過是一架按照物理和化學(xué)規(guī)律運(yùn)轉(zhuǎn)的“分子機(jī)器”;研究者的任務(wù)就是從分子層面去認(rèn)識(shí)和揭示這種規(guī)律,即尋找分子機(jī)器運(yùn)行的因果關(guān)系。對(duì)還原論者而言,生命科學(xué)的主要目標(biāo)通常就是去研究有關(guān)某種生理或病理活動(dòng)的因果關(guān)系之科學(xué)假設(shè)。因此,建立在分子生物學(xué)基礎(chǔ)上的現(xiàn)代生命科學(xué)采用的就正是這種“假設(shè)驅(qū)動(dòng)”的研究范式。美國著名腫瘤生物學(xué)家溫伯格(Weinberg R)在一篇題為“假設(shè)優(yōu)先”的文章中做過一個(gè)很好的總結(jié):“在20世紀(jì),生物學(xué)從傳統(tǒng)的描述性科學(xué)轉(zhuǎn)變成為一門假設(shè)驅(qū)動(dòng)的實(shí)驗(yàn)科學(xué)。與此緊密聯(lián)系的是還原論占據(jù)了統(tǒng)治地位,即對(duì)復(fù)雜生命系統(tǒng)的理解可以通過將其拆解為組成的零部件并逐個(gè)地拿出來進(jìn)行研究”[3]

2 緊密協(xié)同的會(huì)聚科學(xué)研究
盡管多學(xué)科研究推動(dòng)了生物化學(xué)和分子生物學(xué)等交叉學(xué)科的誕生,進(jìn)而使得生命科學(xué)在20世紀(jì)下半葉取得了巨大的發(fā)展,但研究者還希望要進(jìn)一步提升多學(xué)科研究的能力,以滿足維護(hù)人類健康和防止環(huán)境污染等重大社會(huì)需求。2001年末,美國的國家科學(xué)基金會(huì)(NSF)等政府部門圍繞著“會(huì)聚四大技術(shù),提升人類能力”的主題,舉行了一次科學(xué)家與政府官員等各界人物參與的研討會(huì),在會(huì)議上首次提出了“會(huì)聚技術(shù)”(Converging Technologies)的概念,并特別強(qiáng)調(diào)了來自四個(gè)科學(xué)技術(shù)領(lǐng)域協(xié)同作用的“會(huì)聚技術(shù)”——納米技術(shù)、生物技術(shù)、信息技術(shù)和認(rèn)知科學(xué)(其簡化英文的聯(lián)式為Nano-Bio-Info-Cogno,縮寫為NBIC)。NSF基于這次會(huì)議編寫了一份報(bào)告:《提升人類能力的會(huì)聚技術(shù)》。

會(huì)聚科學(xué)研究的目標(biāo)與20世紀(jì)生物學(xué)領(lǐng)域的交叉學(xué)科研究的目標(biāo)有明顯的區(qū)別。后者是要揭示生命的活動(dòng)規(guī)律,屬于基礎(chǔ)研究領(lǐng)域;而前者則是要提高社會(huì)的創(chuàng)新能力或滿足社會(huì)重大需求,屬于應(yīng)用研究領(lǐng)域。例如,美國麻省理工學(xué)院(MIT)在2016年發(fā)布了一份報(bào)告,題目就是“會(huì)聚:健康研究領(lǐng)域的未來”(Convergence: The Future of Health)。在美國科學(xué)家夏普(Sharp PA)等人看來,分子生物學(xué)和基因組學(xué)是過去生物醫(yī)學(xué)領(lǐng)域的兩次革命,而會(huì)聚研究則代表第三次生物醫(yī)學(xué)革命,“工程師和物質(zhì)科學(xué)研究者將與生物學(xué)家和醫(yī)生一道去解答眾多新的醫(yī)學(xué)挑戰(zhàn)”[4]。他們還特別通過“組織工程”(Tissue-Engineering)為例討論了會(huì)聚研究與交叉學(xué)科研究的不同:“這不同于典型的交叉學(xué)科形態(tài)(Interdisciplinary Situation)——把一種確定的細(xì)胞類型給工程師或者讓工程師能夠確定在某種生物系統(tǒng)中什么樣的材料是有用的;相反,這種(組織工程)從一開始就要進(jìn)行多學(xué)科合作(Multidisciplinary Collaboration),所有的參與者都要有共同的參考點(diǎn)和語言。這一領(lǐng)域如果沒有會(huì)聚方法(Convergence Approach)是不會(huì)存在的”[4]。

會(huì)聚研究的一個(gè)重要特點(diǎn)是對(duì)工程學(xué)的強(qiáng)調(diào),這與會(huì)聚研究偏重應(yīng)用的目標(biāo)是高度一致的。例如,美國科學(xué)院研究理事會(huì)2014年發(fā)表的戰(zhàn)略報(bào)告的題目就是“會(huì)聚觀:推動(dòng)跨學(xué)科融合——生命科學(xué)與物質(zhì)科學(xué)和工程學(xué)等學(xué)科的跨界”。工程學(xué)的介入不僅推動(dòng)研究工作進(jìn)入應(yīng)用領(lǐng)域,而且能夠產(chǎn)生具有工程特色的成果,如美國科學(xué)家夏普等人在評(píng)論文章“實(shí)現(xiàn)會(huì)聚在衛(wèi)生保健中的價(jià)值:整合物質(zhì)科學(xué)、工程學(xué)和生物醫(yī)學(xué)”中指出:工程學(xué)在生物相容性材料和納米技術(shù)領(lǐng)域發(fā)展了全新的策略,這種策略在促進(jìn)衛(wèi)生保健方面具有前所未有的潛力[5]。

會(huì)聚研究的另外一個(gè)重要特點(diǎn)是對(duì)技術(shù)的強(qiáng)調(diào),一方面是高度重視技術(shù)在應(yīng)用層面的價(jià)值,如“NBIC”會(huì)聚技術(shù)的提出,體現(xiàn)出圍繞著會(huì)聚研究目標(biāo)的科學(xué)與技術(shù)外在的一體化;另一方面還強(qiáng)調(diào)了不同學(xué)科的技術(shù)在推進(jìn)交叉研究本身的價(jià)值——包括實(shí)驗(yàn)儀器和材料、分析方法和技術(shù)等,即注重研究過程中科學(xué)與技術(shù)內(nèi)在的一體化,從實(shí)驗(yàn)對(duì)象到實(shí)驗(yàn)操作再到實(shí)驗(yàn)結(jié)果。由此可以看到,新興的交叉學(xué)科如“化學(xué)生物學(xué)”(Chemical Biology)和“物理生物學(xué)”(Physical Biology)等與傳統(tǒng)的交叉學(xué)科如“生物化學(xué)”(Biochemistry)和“生物物理學(xué)”(Biophysics)有著巨大的差別;前者強(qiáng)調(diào)研究者應(yīng)用化學(xué)和物理的有關(guān)技術(shù)來開展生物學(xué)研究,如化學(xué)生物學(xué)的一位創(chuàng)始人曾這樣說過:我們的目標(biāo)是為每一個(gè)基因找到相應(yīng)的小分子化合物,用它們來分析細(xì)胞和有機(jī)體的功能;Nature Chemical Biology(《自然·化學(xué)生物學(xué)》)創(chuàng)刊時(shí)發(fā)表的社論是這樣說的:“化學(xué)生物學(xué)作為一個(gè)新領(lǐng)域,是植根于化學(xué)家和生物學(xué)家緊密合作帶來的技術(shù)進(jìn)步之上”[6]。

會(huì)聚科學(xué)研究的這些特點(diǎn)提示我們,這顯然是不同于交叉學(xué)科研究形態(tài)的另一種多學(xué)科研究形態(tài)。前者往往通過不同學(xué)科之間的高度整合而形成全新的交叉學(xué)科,如生物化學(xué)或分子生物學(xué);而后者則表現(xiàn)為不同學(xué)科之間的相互協(xié)作,如化學(xué)生物學(xué)或物理生物學(xué)。會(huì)聚科學(xué)研究強(qiáng)調(diào)的不是學(xué)科間的“交叉”,而是不同學(xué)科的“會(huì)聚”(比較圖1A和1B)。換句話說,各門學(xué)科代表了不同的專業(yè)化分工,而會(huì)聚研究則是把這些專業(yè)中相關(guān)的技術(shù)和理論進(jìn)行集成,以便針對(duì)維護(hù)健康或開發(fā)新能源等國家/社會(huì)的重大需求去建立或發(fā)展新的技術(shù)方法。正如美國科學(xué)院關(guān)于會(huì)聚研究的戰(zhàn)略報(bào)告所指出的那樣:“會(huì)聚觀體現(xiàn)了一種交叉學(xué)科研究的擴(kuò)展形式,專業(yè)知識(shí)構(gòu)成了研究活動(dòng)的'宏觀’模塊,而各個(gè)'宏觀’模塊又組合形成一個(gè)更大的整體”[7]。

3 跨越邊界的數(shù)據(jù)驅(qū)動(dòng)型研究
21世紀(jì)之初人類基因組計(jì)劃的實(shí)施推動(dòng)生命科學(xué)進(jìn)入了大數(shù)據(jù)時(shí)代。人的基因組擁有30億個(gè)堿基對(duì),即相當(dāng)于3 GB的數(shù)據(jù);目前國際上儲(chǔ)存的個(gè)體基因組序列的數(shù)據(jù)量已超過百萬人級(jí);數(shù)據(jù)科學(xué)家估計(jì)到2030年時(shí),每年世界范圍內(nèi)產(chǎn)生的基因組數(shù)據(jù)將為25 PB(1 PB=1015 Byte)[8]。大數(shù)據(jù)在醫(yī)療健康領(lǐng)域則有更明顯的增長,如美國國立腫瘤研究所的基因組數(shù)據(jù)平臺(tái)在2016年成立之后的第一年內(nèi),就收到了研究者提交的4.5 PB的數(shù)據(jù)[8]。據(jù)統(tǒng)計(jì),世界范圍內(nèi)產(chǎn)生的醫(yī)療健康數(shù)據(jù)在2013年大約為153 EB(1 EB=1018 Byte),而在2020年估計(jì)將增長到2 314 EB[8]。如果說有什么是21世紀(jì)的生命科學(xué)乃至整個(gè)科學(xué)比20世紀(jì)進(jìn)步的標(biāo)志,那就是數(shù)據(jù)的獲取和數(shù)據(jù)的利用。

生物醫(yī)學(xué)大數(shù)據(jù)不僅為人類認(rèn)識(shí)和改造世界提供了巨大的資源,而且改變了生命科學(xué)和醫(yī)學(xué)的多學(xué)科研究范式,其典型代表正是人類基因組計(jì)劃。該項(xiàng)計(jì)劃也屬于多學(xué)科交叉研究,其實(shí)施過程需要依靠新型測(cè)序儀器和試劑的研發(fā),以及海量數(shù)據(jù)的處理與分析等,涉及到物理學(xué)、化學(xué)、生物學(xué)、信息科學(xué)和數(shù)學(xué)等多個(gè)學(xué)科。但與假設(shè)驅(qū)動(dòng)的學(xué)科交叉研究不一樣的是,該項(xiàng)計(jì)劃屬于“發(fā)現(xiàn)的科學(xué)”(Discovery Science),是要獲得有關(guān)人體細(xì)胞基因組的全部核苷酸序列的數(shù)據(jù)。也就是說,這項(xiàng)研究表現(xiàn)出了一種新的研究范式——數(shù)據(jù)驅(qū)動(dòng)的研究范式,開展研究的出發(fā)點(diǎn)不是科學(xué)假設(shè),而是高通量的數(shù)據(jù)采集能力;而研究的目標(biāo)也不是去解決某個(gè)具體的科學(xué)問題,而是要去獲取海量的數(shù)據(jù)。

數(shù)據(jù)驅(qū)動(dòng)的研究范式有一個(gè)重要的特征:“迭代”(Iterate),即每一次研究工作可以是一種不完備的階段性工作,然后在前期研究結(jié)果的基礎(chǔ)上反復(fù)地進(jìn)行完善,通過多次研究逐漸逼近預(yù)定的總體目標(biāo)。人類基因組計(jì)劃明顯具有這種“迭代”特征,盡管其終極目標(biāo)是揭示人類基因組的所有核酸序列,但在2001年2月發(fā)表的人類基因組測(cè)序成果只不過是一個(gè)覆蓋了基因組90%核酸序列的“草圖”;2004年10月在Nature雜志上發(fā)表了人類基因組全圖的論文,也只給出了常染色質(zhì)區(qū)域內(nèi)大約99%核酸序列的測(cè)定結(jié)果。事實(shí)上,人類基因組的核酸序列中至今仍然存在許多高度重復(fù)序列區(qū)域(如中心粒)沒有被測(cè)定;2020年9月,研究者終于在《自然》周刊上發(fā)表了人類第一條完整的、沒有測(cè)序“缺口”的染色體的核酸序列,但仍然還有22條人類染色體上的序列“缺口”待研究者去補(bǔ)測(cè)。不久前,一個(gè)比“人類基因組計(jì)劃”更為宏大的“人類細(xì)胞圖譜”(Human Cell Atlas,HCA)研究計(jì)劃正式啟動(dòng),其基本目標(biāo)是,通過各種單細(xì)胞分析技術(shù)來鑒定人體擁有的40到60萬億個(gè)體細(xì)胞中的所有細(xì)胞類型;其采用的主要研究策略也明顯具有“迭代”特征[9]。

數(shù)據(jù)驅(qū)動(dòng)的研究范式的另一個(gè)重要特征是研究的“開放性”,即不受已有理論框架的限制。20世紀(jì)生命科學(xué)的主流是假設(shè)驅(qū)動(dòng)的研究范式,以解決具體的科學(xué)問題為主要目標(biāo);其研究工作的開展是依賴于既有的理論框架,從而使得研究者在事實(shí)的選擇和理解方面容易受限于指導(dǎo)研究的理論框架。而數(shù)據(jù)驅(qū)動(dòng)的研究范式則不僅能夠讓研究者避免理論框架帶來的主觀偏見,而且可以幫助其發(fā)現(xiàn)在假設(shè)或者現(xiàn)有理論范圍之外的全新知識(shí)。正如美國生物學(xué)家戈盧伯(Golub T)在一篇題為“數(shù)據(jù)優(yōu)先”的文章中所指出的:“如果沒有獲得全面的腫瘤基因組數(shù)據(jù),將難以區(qū)分信號(hào)和噪音。盡管假設(shè)驅(qū)動(dòng)的實(shí)驗(yàn)科學(xué)依然處于研究領(lǐng)域的中心位置,但不帶偏好的腫瘤全基因組測(cè)序?qū)⑻峁┣八从械臋C(jī)會(huì)去催生新的想法”[10]。

數(shù)據(jù)驅(qū)動(dòng)的研究范式的“開放性”特征,使得研究工作從追求事物之間的因果關(guān)系轉(zhuǎn)變?yōu)閷ふ沂挛镏g的相關(guān)性。這就導(dǎo)致了過去看上去彼此沒有關(guān)系的學(xué)科產(chǎn)生了全新的聯(lián)系,如谷歌的工程師開發(fā)了一種算法,可以根據(jù)每天匯總的谷歌搜索數(shù)據(jù)近乎實(shí)時(shí)地對(duì)流感疫情進(jìn)行預(yù)測(cè);其預(yù)報(bào)流感爆發(fā)的地域性和時(shí)效性比美國疾控中心報(bào)的更好[11]。即使是復(fù)雜的人類行為,也可以通過大數(shù)據(jù)的分析和計(jì)算來進(jìn)行研究;為此10年前已經(jīng)出現(xiàn)了一門相應(yīng)的交叉學(xué)科——“計(jì)算社會(huì)科學(xué)”(Computational Social Science)[12]。這種基于大數(shù)據(jù)的跨學(xué)科研究形成了多學(xué)科交叉研究的第三種形態(tài),利用數(shù)據(jù)科學(xué)來打通或者跨越各門學(xué)科的邊界(圖1C)。國際著名的生命科學(xué)期刊Cell在2020年創(chuàng)立了一個(gè)以數(shù)據(jù)科學(xué)為紐帶的多學(xué)科研究的子刊Patterns,其主編在發(fā)刊詞里這樣寫到:“Patterns將通過數(shù)據(jù)科學(xué)技術(shù)的共享來打破各門學(xué)科的邊界,這些數(shù)據(jù)科學(xué)技術(shù)可以用來解決跨領(lǐng)域的問題”[13]。

更重要的是,數(shù)據(jù)驅(qū)動(dòng)的研究范式作為一種超越理論框架的“開放式科學(xué)”,其研究產(chǎn)生的資源和數(shù)據(jù)可以被廣泛地用于研究各種各樣的科學(xué)問題;如收集了50萬英國人的生物樣本和健康醫(yī)學(xué)數(shù)據(jù)的“英國生物資源庫”(UK Biobank),自2012年建成至今,已經(jīng)用于支持過世界各國數(shù)萬名研究人員的研究工作,僅2018年度利用該庫開展研究的科學(xué)家就有4 000多人,發(fā)表了涉及到健康醫(yī)學(xué)各個(gè)方面近300篇研究論文。換句話說,這種“開放性”使得數(shù)據(jù)驅(qū)動(dòng)的研究范式之組織模式明顯不同于假設(shè)驅(qū)動(dòng)的研究范式,前者強(qiáng)調(diào)眾多研究者之間的合作、交流和共享;而后者則更注重以項(xiàng)目負(fù)責(zé)人(Principle Investigator,PI)為主導(dǎo)的“個(gè)人英雄主義”式的研究;正如最近的一篇評(píng)論文章所指出的:傳統(tǒng)的卓越觀是崇拜天才而與社會(huì)環(huán)境無關(guān);這種對(duì)卓越的狹隘看法導(dǎo)致了資源集中到已獲認(rèn)可的科學(xué)家手中,進(jìn)而限制了科學(xué)的進(jìn)步和新思想的產(chǎn)生以及多學(xué)科研究領(lǐng)域的發(fā)展[14]。2020年12月,美國科學(xué)院發(fā)表了一份戰(zhàn)略報(bào)告《無止境的前沿——科學(xué)的未來75年》,在其結(jié)論中特別指出:科學(xué)激勵(lì)制度應(yīng)該是一種“共贏游戲”(Positive-Sum Game)而非“零合游戲”(Zero-Sum Game)[15]。顯然,數(shù)據(jù)驅(qū)動(dòng)的研究范式正在推動(dòng)科學(xué)研究的生態(tài)環(huán)境發(fā)生革命性的改變。

參考文獻(xiàn)

[1] Edsall JT. The Journal of Biological Chemistry after seventy-five years. Journal Biological Chemistry, 1980, 255(19): 8939—8951.

[2] 埃爾溫·薛定諤. 生命是什么. 羅來鷗, 羅遼復(fù), 譯. 長沙: 湖南科學(xué)技術(shù)出版社, 2003: 8.

[3] Weinberg R. Point: Hypotheses first. Nature, 2010, 464(7289): 678.

[4] Sharp PA, Langer R. Promoting convergence in biomedical science. Science, 2011, 333(6042): 527.

[5] Sharp P, Jacks T, Hockfield S. Capitalizing on convergence for health care:Integrate physical sciences, engineering, and biomedicine. Science, 2016, 352(6209): 1522—1523.

[6] Editorials. A community of chemists and biologists. Nature Chemical Biology, 2005, 1(1): 3.

[7] 美國科學(xué)院研究理事會(huì). 會(huì)聚觀: 推動(dòng)跨學(xué)科融合——生命科學(xué)與物質(zhì)科學(xué)和工程學(xué)等學(xué)科的跨界. 王小理, 熊燕, 于建榮, 譯. 北京: 科學(xué)出版社, 2015: 13.

[8] Banks MA. Sizing up big data. Nature Medicine, 2020, 26(1): 5—6.

[9] Regev A, Teichmann SA, Lander ES, et al. The human cell atlas. eLife, 2017, 6: e27041.

[10] Golub T. Counterpoint: data first. Nature, 2010, 464(7289): 679.

[11] Ginsberg J, Mohebbi MH, Patel RS, et al. Detecting influenza epidemics using search engine query data. Nature, 2009, 457(7232): 1012—1014.

[12] Lazer DMJ, Pentland A, Watts DJ, et al. Computational social science: Obstacles and opportunities. Science, 2020, 369(6507): 1060—1062.

[13] Editorial. The first piece of the pattern. Patterns, 2020, 1: 100020.

[14] Urbina-Blanco CA, Jilani SZ, Speight IR, et al. A diverse view of science to catalyse change. Nature Chemistry, 2020, 12(9): 773—776.

[15] Olson S. The endless frontier: The next 75 years in science. Washington, DC: The National Academies Press, 2020. 

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多