|
作為地球的主人,我們不能把認(rèn)知權(quán)力讓渡給任何工具。我們需要的不是知識(shí)積累的速度,而是質(zhì)量。我們應(yīng)該,也可以把控知識(shí)發(fā)現(xiàn)的節(jié)奏。同時(shí),我們需要加強(qiáng)科研后備軍的基本素養(yǎng)和技能的培養(yǎng),我們須恪守科技倫理,堅(jiān)持以人為本、科技向善。
如果要票選當(dāng)前社會(huì)經(jīng)濟(jì)發(fā)展中的熱詞,“人工智能”(Artificial Intelligence, AI)一詞一定可以入選;如果要盤點(diǎn)當(dāng)前科技界的重大進(jìn)展,AI技術(shù)的進(jìn)展也一定會(huì)入圍,并會(huì)名列前茅,雖然其進(jìn)展主要集中在深度學(xué)習(xí)這個(gè)子領(lǐng)域。用“如日中天”“眾星捧月”描述當(dāng)下AI的地位毫不為過!造成這種少見現(xiàn)象的原因不僅僅是AI技術(shù)本身10余年來令人驚艷的突破性進(jìn)展,還包括AI技術(shù)對(duì)社會(huì)經(jīng)濟(jì)各行各業(yè),對(duì)科學(xué)技術(shù)各個(gè)學(xué)科的發(fā)展帶來的深遠(yuǎn)甚至顛覆性的影響。在我國(guó),AI的熱潮較國(guó)際更盛。 我不是AI具體技術(shù)的研究者,但作為AI領(lǐng)域的大同行,作為AI技術(shù)發(fā)揮作用的基礎(chǔ)——計(jì)算系統(tǒng)中軟件技術(shù)的研究者,從當(dāng)前的熱潮中,我看到了太多“炒作”和“非理性”導(dǎo)致的 AI“過熱”現(xiàn)象,也對(duì)當(dāng)前AI發(fā)展技術(shù)路徑多樣性的欠缺萌生了一些擔(dān)憂。我認(rèn)為,有必要認(rèn)真審視和反思當(dāng)前AI的本質(zhì)及其可能帶來的影響,以及人類發(fā)展AI的目標(biāo)和路徑等問題。為此,在今年7月于長(zhǎng)沙舉行的2024ACM中國(guó)圖靈大會(huì)上,我作了一個(gè)演講,題為“對(duì)當(dāng)前人工智能熱潮的幾點(diǎn)冷思考”。本文根據(jù)該演講整理而成。 AI發(fā)展的簡(jiǎn)短回顧 人類對(duì)“用機(jī)器模擬人類智能”的追求遠(yuǎn)早于現(xiàn)代電子計(jì)算機(jī)的發(fā)明。如果將算術(shù)計(jì)算的能力也視為智能(實(shí)際上,在教育還不那么普及的時(shí)代,算數(shù)能力確是智者的能力),那么歷史上的各類計(jì)算裝置,例如帕斯卡的加法器、萊布尼茨的機(jī)械計(jì)算器和巴貝奇的差分機(jī),無疑都是對(duì)用機(jī)器模擬算數(shù)能力這一目標(biāo)的追求。就其第一目標(biāo)而言,圖靈機(jī)模型以及第一臺(tái)電子計(jì)算機(jī)ENIAC均是針對(duì)“計(jì)算”這類智能的,不過,隨著電子計(jì)算機(jī)在計(jì)算能力上超越人類,人們開始不把計(jì)算等同于智能了。1950年,艾倫·圖靈(Alan Turing)在其論文的開篇首句即提出:“機(jī)器能思考嗎?”該問題后來演變?yōu)椤皺C(jī)器能表現(xiàn)得像人一樣嗎?”。此即是圖靈測(cè)試提出的問題基礎(chǔ),也成為后續(xù)幾十年AI研究追求的重大目標(biāo),甚至是終極目標(biāo)。 對(duì)機(jī)器智能的擔(dān)憂幾乎伴隨了追求模擬人類智能的全過程。1942年,科幻作家艾薩克·阿西莫夫(Isaac Asimov)就在其小說《環(huán)舞》(Runaround)中就提出了機(jī)器人三定律1,其目的就是為了警示機(jī)器智能可能給人類帶來的威脅。 1956年,“人工智能”一詞被提出,在經(jīng)歷兩個(gè)“春天”和兩個(gè)“冬天”后,AI迎來了第三個(gè)“春天”。而這個(gè)“春天”顯得尤為生機(jī)勃勃,呈現(xiàn)一片“繁榮”景象。從2012年底,在ImageNet圖像分類任務(wù)上,AlexNet展現(xiàn)出了深度學(xué)習(xí)的強(qiáng)大感知能力,2015年初,ResNet超過人類的平均水平;到2016年初,AlphaGo以絕對(duì)優(yōu)勢(shì)戰(zhàn)勝李世石;再到2022年底,OpenAI2推出新的智能聊天大語言模型ChatGPT3,因其表現(xiàn)優(yōu)異,被人們稱為“現(xiàn)象級(jí)”的AI應(yīng)用。這些事件均代表了AI的一次次重要突破,堪稱AI發(fā)展史上的重要里程碑。 貫穿AI的發(fā)展,有一個(gè)始終被討論的問題:“什么是AI,如何理解AI?”時(shí)至今日,仍未達(dá)成普遍共識(shí)。通常人們談的智能,多指人腦的智能,從基本的計(jì)算、記憶能力,到感知能力,再到高層次的認(rèn)知能力,進(jìn)而到發(fā)現(xiàn)、創(chuàng)造能力,最終歸為人的智慧。還有一類是從人的動(dòng)作能力考察的智能,被稱為行為智能。到目前,AI在不少任務(wù)上的感知能力可以說已經(jīng)超越人類,但是,認(rèn)知和行為能力與人類相比還差距甚大。當(dāng)前炙熱的大語言模型能力常常被關(guān)聯(lián)到認(rèn)知智能,但從人類視角看,大語言模型有認(rèn)知能力嗎?我認(rèn)為,還沒有。 “智能”這一概念本就是人類用以區(qū)別自身和動(dòng)物的專屬詞,并刻意創(chuàng)造了“人工智能”一詞指代機(jī)器模擬的“智能”。“智能化”是當(dāng)前的熱詞,本意是指由AI驅(qū)動(dòng)或賦能,即AI-powered 或AI化,通過AI技術(shù)提升人類或機(jī)器完成各類任務(wù)的能力,但人們?yōu)榱宋淖值暮?jiǎn)潔,省略了“人工”這個(gè)詞。隨著時(shí)間的推移,隨著“智能化”一詞被用于各種事物(everything),很多人忘了現(xiàn)在的“智能化”本質(zhì)上是“人工智能化”,進(jìn)而導(dǎo)致很多人忽視了“人”才是地球上真正的智能體,冀圖用AI去“智能化”人類。一個(gè)例子是所謂“智能設(shè)計(jì)”這個(gè)提法,很多設(shè)計(jì)均屬于人類的智力性創(chuàng)造性活動(dòng),用計(jì)算機(jī)輔助設(shè)計(jì)無疑會(huì)大大提升效率,用AI甚至可以自動(dòng)完成不少設(shè)計(jì)任務(wù),但無論如何,我們不應(yīng)將機(jī)器完成或輔助完成的設(shè)計(jì)視為“智能”的產(chǎn)物,它只是“AI設(shè)計(jì)”的產(chǎn)物。本質(zhì)上,人的設(shè)計(jì)才是“智能”的,AI是人類創(chuàng)造出來的工具,不能反“仆”為“主”。 當(dāng)前主流的AI工作機(jī)制,與人類大腦的工作方式仍相去甚遠(yuǎn)。如果我們過度使用類人的術(shù)語描述機(jī)器,比如“意識(shí)”“心智”,甚至“硅基生命”等,很容易給公眾造成誤導(dǎo)。我個(gè)人特別不喜歡“硅基生命”之類的提法,說重一點(diǎn),這是對(duì)生命的不尊重。我們不要忘記,真正的生命是地球上的生物,包括動(dòng)物和植物,而人類是其中的主導(dǎo)者。 現(xiàn)階段AI的成功源于深度學(xué)習(xí),這只是AI研究的一個(gè)子領(lǐng)域,其本質(zhì)是數(shù)據(jù)驅(qū)動(dòng)的智能、計(jì)算實(shí)現(xiàn)的智能,即“數(shù)據(jù)為體、智能為用”,猶如燃料與火焰的關(guān)系,燃料越多,火焰越大,燃料越純,火焰越漂亮。對(duì)當(dāng)前基于深度學(xué)習(xí)的AI所取得的突破性進(jìn)展,我是高度認(rèn)可的。大語言模型給我?guī)淼淖畲笳鸷吃谟冢核梢灾v“人話”了,而且語法能力超越了人類平均水平,甚至超越人類的中上水平。我看大語言模型,樂觀的判斷,也許會(huì)成為繼計(jì)算機(jī)、互聯(lián)網(wǎng)之后,計(jì)算科學(xué)發(fā)展史上的第三大里程碑。 同時(shí),我們需要清醒地認(rèn)識(shí)到:當(dāng)前以“算法、數(shù)據(jù)、算力”為核心要素的AI技術(shù)路徑,其持續(xù)發(fā)展?jié)摿γ媾R重大障礙,原理尚未出現(xiàn)變革性苗頭,對(duì)數(shù)據(jù)的依賴越來越嚴(yán)重,對(duì)算力的消耗也越來越巨大。理想的AI應(yīng)當(dāng)是低熵的,不以計(jì)算資源的消耗換取智能,也不以復(fù)雜性的提高換取智能;也應(yīng)當(dāng)是高安全的,模型的輸出符合真實(shí)情況,生成結(jié)果確保對(duì)人類無害;還應(yīng)當(dāng)是不斷進(jìn)化的,具有環(huán)境自適應(yīng)和終生“學(xué)習(xí)”能力,能不斷完善并具有“遺忘”能力。離實(shí)現(xiàn)這樣的目標(biāo),我們還有很長(zhǎng)的路要走。 熱潮中的冷思考 AI應(yīng)用的繁榮期正在開啟? 當(dāng)前,人們對(duì)“AI+”或“AI for everything”抱有很高的期望,然而,現(xiàn)實(shí)情況卻不盡如人意——雷聲隆隆,雨點(diǎn)并不大。我認(rèn)為,AI的應(yīng)用還需要經(jīng)歷一段時(shí)期的探索、磨合和積累,才可能迎來繁榮。 所謂探索,是指搞清楚行業(yè)的真需求。日常聊天或者生成文本報(bào)告、視頻,這通常只是行業(yè)需求的一小部分,行業(yè)需要真正落地的應(yīng)用是解決生產(chǎn)問題、業(yè)務(wù)問題的有效方案。目前,我國(guó)很多行業(yè)的數(shù)字化轉(zhuǎn)型尚未完成,甚至許多設(shè)備還未實(shí)現(xiàn)數(shù)字化,更未聯(lián)網(wǎng),沒有數(shù)字化和網(wǎng)絡(luò)化,當(dāng)然也就不可能有智能化。 所謂磨合,是指提升可信性。當(dāng)前基于深度學(xué)習(xí)的AI存在不可解釋性,被視為“黑盒”,缺乏可信性。因此,在現(xiàn)有的技術(shù)路徑下,至少在安全攸關(guān)的領(lǐng)域,AI的應(yīng)用會(huì)受到限制。 所謂積累,是指獲取跨足夠時(shí)間和空間尺度的全數(shù)據(jù)。大語言模型的成功依賴于人類長(zhǎng)時(shí)間積累的龐大語料庫(kù),文生視頻的成功也依賴于互聯(lián)網(wǎng)上存在的海量視頻。然而,其他行業(yè)的數(shù)據(jù)積累尚未達(dá)到這個(gè)量級(jí)。即使近幾年進(jìn)行了較大范圍的數(shù)據(jù)收集,但從時(shí)間縱深角度來看,數(shù)據(jù)的積累仍遠(yuǎn)遠(yuǎn)不足。沒有時(shí)間上的積累,數(shù)據(jù)的價(jià)值將大打折扣。 在我看來,當(dāng)前AI存在的問題是:泡沫太大,仍處于技術(shù)成熟度曲線(hype cycle)的高峰階段,喧囂埋沒理性,需要一個(gè)冷靜期;以偏概全,對(duì)成功個(gè)案不顧前提地放大、泛化,過度承諾;期望過高,用戶神化AI的預(yù)期效果,提出難以實(shí)現(xiàn)的需求。 面對(duì)AI技術(shù)發(fā)展及其應(yīng)用的現(xiàn)狀,如果對(duì)AI的落地應(yīng)用有所彷徨,那么,還能夠做些什么呢?我的建議是:積累數(shù)據(jù)——可采盡采、能存盡存。 大模型浪潮下,學(xué)術(shù)界能干什么?該干什么? ChatGPT和Sora的問世,開啟了世界范圍的“百模”競(jìng)發(fā)。不過,在基本原理相似的技術(shù)路徑上,人們發(fā)現(xiàn),各方擁有的算力資源相差不多,數(shù)據(jù)規(guī)模和質(zhì)量就成為競(jìng)爭(zhēng)的關(guān)鍵因素。本質(zhì)上,當(dāng)前大模型的競(jìng)爭(zhēng)已成為“數(shù)據(jù)工程”的競(jìng)爭(zhēng)。學(xué)術(shù)界在這場(chǎng)競(jìng)爭(zhēng)中面臨雙重挑戰(zhàn):首先,學(xué)術(shù)界缺乏足夠的算力資源和數(shù)據(jù)資源進(jìn)行大規(guī)模的模型訓(xùn)練;其次,即使擁有這些資源,“數(shù)據(jù)工程”的定位也與學(xué)術(shù)界探索基本原理的使命不符。一些圍繞大模型應(yīng)用的研究是否值得學(xué)術(shù)界投入,還存在諸多爭(zhēng)議,例如,基于提示工程的大模型應(yīng)用是否會(huì)成為新的學(xué)術(shù)研究領(lǐng)域?抑或只是技術(shù)培訓(xùn)領(lǐng)域的話題?對(duì)于這個(gè)問題,我更傾向于是后者。 從基本原理來看,目前的大模型沒有跳出概率統(tǒng)計(jì)這個(gè)框架?,F(xiàn)實(shí)世界中的任務(wù)(如圖像分類或文本生成)可以被建模為概率模型,將數(shù)據(jù)的分布或生成過程表示為概率分布函數(shù)。而Universal Approximation Theorem在理論上闡明了神經(jīng)網(wǎng)絡(luò)能夠以任意精度逼近這些概率分布函數(shù),從而構(gòu)建這些概率模型。就這個(gè)意義而言,大模型可被視為是由已有語料壓縮而成的知識(shí)庫(kù),生成結(jié)果的語義正確性高度依賴于數(shù)據(jù)的空間廣度、時(shí)間深度以及分布密度,更高度依賴于數(shù)據(jù)的質(zhì)量??梢源_定的是,作為一個(gè)高度復(fù)雜的系統(tǒng),大模型是一個(gè)合適的研究對(duì)象,包括理解其內(nèi)在機(jī)理,以及如何提升其訓(xùn)練和推斷效率等。但是,作為一個(gè)人造系統(tǒng),我們更應(yīng)關(guān)心其構(gòu)建過程的可重復(fù)性和可追溯性,進(jìn)而保證結(jié)果的可解釋和可信任。此外,研究大模型的應(yīng)用技術(shù)無疑是一個(gè)重要領(lǐng)域,但就大模型技術(shù)的現(xiàn)狀而言,基礎(chǔ)不可信必然會(huì)導(dǎo)致應(yīng)用技術(shù)不可信。這也意味著當(dāng)前的大模型應(yīng)用技術(shù)研究的實(shí)際價(jià)值具有與生俱來的不確定性。 當(dāng)前對(duì)大語言模型的發(fā)展存在諸多爭(zhēng)議,有技術(shù)路徑之爭(zhēng)、應(yīng)用和商業(yè)模式之爭(zhēng),還有開源、閉源之爭(zhēng)。在這里,我也大膽預(yù)測(cè)大語言模型的未來(至少是表達(dá)個(gè)人的一種期望):作為壓縮了人類已有的可公開訪問的絕大多數(shù)知識(shí)的基礎(chǔ)模型,大語言模型在未來需要像互聯(lián)網(wǎng)一樣,走向開源,由全世界共同維護(hù)一個(gè)開放共享的基礎(chǔ)模型,盡力保證其與人類知識(shí)的同步。否則,任何一個(gè)機(jī)構(gòu)所掌控的基礎(chǔ)模型都難以讓其他機(jī)構(gòu)用戶放心地上傳應(yīng)用數(shù)據(jù),也就很難產(chǎn)生足以滿足各行各業(yè)業(yè)務(wù)需求的大量應(yīng)用。既然基礎(chǔ)模型的訓(xùn)練語料本就是人類幾千年來共同積累的知識(shí)財(cái)富,理應(yīng)走向開源,讓全世界共同受益,共同維護(hù),避免無謂的浪費(fèi)。在這個(gè)開放共享的基礎(chǔ)模型上,全球范圍內(nèi)的研究者和開發(fā)者可以面向各行各業(yè)的需求探討各種應(yīng)用,構(gòu)建相應(yīng)的領(lǐng)域模型。以誕生于美國(guó)軍方的互聯(lián)網(wǎng)為對(duì)照,如果它僅僅停留在美國(guó)軍方使用,沒有走向民用,沒有完全交給一個(gè)民間機(jī)構(gòu),互聯(lián)網(wǎng)則難有今天的繁榮。 人工智能生成內(nèi)容(AIGC),如何權(quán)衡利弊? 大模型在內(nèi)容生成的模態(tài)和范圍等方面實(shí)現(xiàn)了前所未有的突破,就文本生成能力而言,相比過去的AI系統(tǒng),大語言模型具有內(nèi)容生成速度快、涉及知識(shí)面寬的特征,短時(shí)間內(nèi)就能生成具有高質(zhì)量語法的文本。本質(zhì)上,大語言模型呈現(xiàn)了以人類現(xiàn)有文本資料為基礎(chǔ)的數(shù)據(jù)智能,將對(duì)傳統(tǒng)的信息知識(shí)獲取和學(xué)習(xí)方式帶來重大影響,其生成內(nèi)容能夠覆蓋大部分人類知識(shí)領(lǐng)域,將在社會(huì)經(jīng)濟(jì)生活的眾多場(chǎng)景具有廣闊的應(yīng)用前景。然而,當(dāng)前大模型的技術(shù)路線使人類知識(shí)體系面臨嚴(yán)峻挑戰(zhàn),黑盒導(dǎo)致的不可解釋性是其最大“罩門”;訓(xùn)練語料的質(zhì)量缺陷、概率統(tǒng)計(jì)的內(nèi)生誤差等因素會(huì)導(dǎo)致大模型產(chǎn)生幻覺,生成錯(cuò)誤內(nèi)容;再加上人為干預(yù)誘導(dǎo),極易生成虛假內(nèi)容。 人類社會(huì)歷經(jīng)漫長(zhǎng)發(fā)展歷史,構(gòu)建起知識(shí)“發(fā)現(xiàn)-驗(yàn)證-傳播”的一套規(guī)范的知識(shí)體系和制度。人類知識(shí)主要依靠各領(lǐng)域科學(xué)家、專家學(xué)者的創(chuàng)新發(fā)現(xiàn)獲得,并以語言文字的形式記錄并呈現(xiàn),通過各類有效的制度,包括學(xué)術(shù)界、出版界的共同把關(guān),保障知識(shí)的準(zhǔn)確性和可信度,并經(jīng)過長(zhǎng)期的實(shí)踐檢驗(yàn),逐步形成人類知識(shí)體系。但是,依賴當(dāng)前技術(shù)途徑的大模型技術(shù)如果被廣泛應(yīng)用,將會(huì)打破人類主導(dǎo)的知識(shí)發(fā)現(xiàn)、驗(yàn)證和傳播秩序。在大模型生成內(nèi)容語法正確的表象下,許多錯(cuò)誤虛假內(nèi)容與真正的知識(shí)混雜在一起,讓人更加難以辨別而采信。相較于互聯(lián)網(wǎng)自媒體發(fā)布的信息,大模型生成內(nèi)容在敘述結(jié)構(gòu)、語法、邏輯等方面都更為完備,人們依靠基本的邏輯思維和知識(shí)基礎(chǔ)很難判斷其真假。更嚴(yán)重的是,由于生成速度極快,涉及的知識(shí)面廣、數(shù)量龐大,大模型生成內(nèi)容不可能全部都得到人類專家的鑒別和驗(yàn)證。這些不辨真假的內(nèi)容如果被人們采信,日積月累,將會(huì)污染人類經(jīng)過長(zhǎng)期歷史積淀和演化而形成的知識(shí)體系。 關(guān)于認(rèn)知智能,不該做什么? 認(rèn)知能力是人類成為地球主人的根本。相比其他生物,人類既不是體力最強(qiáng)的,也不是跑得最快的,更不是感知能力最強(qiáng)的……但是,由于人類具備基于歸納和演繹的獨(dú)特認(rèn)知能力,加上對(duì)語言工具的使用,可以相互交流、匯聚群智,使得人類能夠成為地球的主宰。就這個(gè)意義而言,人類區(qū)別于地球上其他動(dòng)物的主要特征就在于認(rèn)知能力。 就個(gè)人的認(rèn)知,我可以接受機(jī)器在感知智能方面超越人類,畢竟自然界中感知能力超過人類的例子比比皆是,如狗的嗅覺和鷹的視覺。我們可以借助機(jī)器的感知能力增強(qiáng)對(duì)外界環(huán)境的了解與把握。但對(duì)機(jī)器認(rèn)知智能的研發(fā),我持比較保守的態(tài)度。 我支持生命科學(xué)界去探索大腦的奧秘,探究認(rèn)知的成因和機(jī)理,這被視為生命科學(xué)的皇冠。不過,在追求大腦奧秘的同時(shí),我們也需要思考如何保持人類的主體地位,維護(hù)人的基本尊嚴(yán)和“神經(jīng)”權(quán)。我認(rèn)為,在技術(shù)領(lǐng)域,我們需要嚴(yán)格限制以替代人的認(rèn)知能力為目標(biāo)的技術(shù)研發(fā),尤其要嚴(yán)格規(guī)范植入式腦機(jī)接口類的技術(shù)研發(fā)。我這樣說,并不是我認(rèn)為現(xiàn)有的機(jī)器認(rèn)知智能研究已經(jīng)步入有可能替代人類的路徑上,相反,我認(rèn)為當(dāng)前的AI還遠(yuǎn)不具備認(rèn)知能力,而且當(dāng)前以深度學(xué)習(xí)為基礎(chǔ)的AI技術(shù)路徑也難以實(shí)現(xiàn)類人的認(rèn)知智能。我只是從人類的主體地位的視角,認(rèn)為開發(fā)一種可以替代人類自身認(rèn)知能力的AI,是對(duì)人的權(quán)利的一種侵犯。我們需要確保AI的發(fā)展不會(huì)超出人類的控制,從而維護(hù)人類的主導(dǎo)地位和尊嚴(yán)。 AI for Science(AI4S)的邊界在哪里? AI4S很火,因?yàn)橐呀?jīng)出現(xiàn)了諸多成功的甚至是具有突破性意義的案例,例如,DeepMind4 開發(fā)的用于預(yù)測(cè)蛋白質(zhì)三維結(jié)構(gòu)的AlphaFold,基于擴(kuò)散模型預(yù)測(cè)分子三維結(jié)構(gòu)的GeoDiff,以及模擬燃燒反應(yīng)和流體過程的DeepFlame。在這些成功故事的影響下,不少研究者將打造AI科學(xué)家或共同科學(xué)家(co-scientist)作為追求的目標(biāo)。在我看來,已有的AI4S的成功案例證明了AI用于科學(xué)研究的巨大潛力,然而,我們不能忘記,科學(xué)家是人類的角色,科研是人類的專屬責(zé)任,人類可以利用助手和工具輔助科研,但是不能允許這些助手和工具越俎代庖掌控科研。AI可以成為科學(xué)家的有力助手,但不能是AI科學(xué)家或共同科學(xué)家。即使我們可以研發(fā)出大幅度提升科研效率的工具助手,但如果無法完全掌控它們,我認(rèn)為我們寧愿放緩科技發(fā)展的步伐。 要理解這一點(diǎn),我們需要回顧科學(xué)研究的源起和發(fā)展??茖W(xué)發(fā)展的第一驅(qū)動(dòng)力是好奇心,即人們希望去了解其所生存的世界。古希臘的先哲們創(chuàng)造了燦爛的文明,也在科學(xué)領(lǐng)域進(jìn)行了積極的探索。現(xiàn)代意義上的科學(xué)則源于17世紀(jì)的科學(xué)革命,而這場(chǎng)革命卻是經(jīng)歷了兩個(gè)世紀(jì)的準(zhǔn)備,才開啟了人類社會(huì)的新時(shí)代。15世紀(jì)是文藝復(fù)興,人們剛從黑暗的中世紀(jì)走出來,緣于古希臘文化的價(jià)值和美麗,對(duì)古希臘經(jīng)典崇尚備至,認(rèn)為“古典的東西是無與倫比的”。16世紀(jì)的宗教改革是思想的第一次解放,強(qiáng)調(diào)“基督教并不是羅馬人的”,具有普世性。17世紀(jì)的科學(xué)革命則是緣于一系列的科學(xué)發(fā)現(xiàn)挑戰(zhàn)了古希臘時(shí)代形成的“科學(xué)”觀念,人們發(fā)現(xiàn)“希臘人錯(cuò)了”,進(jìn)而催生了新的科學(xué)方法和理論。18世紀(jì)的啟蒙運(yùn)動(dòng)則進(jìn)一步強(qiáng)化了“宗教是迷信”的觀念,人們認(rèn)識(shí)到,需用理性取代迷信,只要理性跟隨科學(xué),未來就有進(jìn)步。這也是人類歷史上首次出現(xiàn)“進(jìn)步”一詞。 科學(xué)革命以后,人類社會(huì)進(jìn)入了快速的不斷進(jìn)步的階段,通過科學(xué)研究認(rèn)識(shí)世界,豐富了人類知識(shí),進(jìn)而基于科學(xué)發(fā)明技術(shù)改造人類生存的世界。后續(xù)的工業(yè)革命開啟了人類文明新形態(tài),極大地豐富了物質(zhì)文明,人類擺脫了靠天吃飯的宿命,出現(xiàn)了“經(jīng)濟(jì)增長(zhǎng)”的概念。據(jù)《世界經(jīng)濟(jì)千年史》所述,公元第一個(gè)千年,西歐以及全球其他地區(qū)的經(jīng)濟(jì)幾乎沒有增長(zhǎng),是西歐率先打破了這種千年停滯的狀態(tài)。14世紀(jì)西歐的人均GDP超過中國(guó),1820年后世界經(jīng)濟(jì)開始出現(xiàn)陡坡式的拉升,從1820年到1999年,西歐人均GDP年均復(fù)合增長(zhǎng)率達(dá)到1.51%,世界人均收入增長(zhǎng)了8.5倍左右,世界人口增長(zhǎng)了5.6倍左右。西歐人口增長(zhǎng)和經(jīng)濟(jì)增長(zhǎng)幾乎同步,在第一個(gè)千年里,整個(gè)西歐的人口增長(zhǎng)只有幾十萬,1820年后人口快速增加,到 1998年人口年均復(fù)合增長(zhǎng)率達(dá)到0.6%。這些成就無疑都要?dú)w功于科學(xué)革命和工業(yè)革命,即科技的發(fā)展。當(dāng)然,人類在通過科技改變世界的過程中,也造成了一系列負(fù)面影響,諸如環(huán)境污染、隱私侵犯,乃至毀滅性武器的出現(xiàn),等等。 我們需要理解并準(zhǔn)確把握科學(xué)研究的本質(zhì)??蒲惺鞘裁矗靠蒲械慕Y(jié)果并非一定正確,知識(shí)也并非絕對(duì)無誤,但人類通過不斷的探索和驗(yàn)證,去偽存真,人類的知識(shí)寶庫(kù)也一直不斷地?cái)U(kuò)大、完善。在這個(gè)歷史進(jìn)程中,無論如何,人類始終掌握著主導(dǎo)權(quán)。技術(shù)進(jìn)步雖然極大地提高了科研的效率和質(zhì)量,但其作為工具的角色始終沒有改變。然而,這一輪的AI浪潮,正在給人類的科學(xué)研究,進(jìn)而給人類的知識(shí)積累帶來嚴(yán)峻挑戰(zhàn)。大語言模型對(duì)人類知識(shí)的“掌握”超越了任何個(gè)體和任何學(xué)科群體;當(dāng)前技術(shù)路徑的生成式AI的廣泛應(yīng)用,將有可能污染人類現(xiàn)存的知識(shí)體系;高效率的大規(guī)?!俺晒碑a(chǎn)出,也給其驗(yàn)證帶來了巨大挑戰(zhàn),人類的知識(shí)入庫(kù)審核權(quán)如何保證?如何擺脫因過分依賴AI而對(duì)科研人員的能力培養(yǎng)和提升造成的負(fù)面影響? 不忘初心,我們需要回歸科學(xué)研究的本因,即通過不斷的科學(xué)發(fā)現(xiàn)了解我們生存的世界,進(jìn)而通過技術(shù)發(fā)明不斷改善我們的生活。作為地球的主人,我們不能把認(rèn)知權(quán)力讓渡給任何工具。我們需要的不是知識(shí)積累的速度,而是質(zhì)量。我們應(yīng)該,也可以把控知識(shí)發(fā)現(xiàn)的節(jié)奏。同時(shí),我們需要加強(qiáng)科研后備軍的基本素養(yǎng)和技能的培養(yǎng),我們須恪守科技倫理,堅(jiān)持以人為本、科技向善。 AI的第三個(gè)“春天”能持續(xù)多久?會(huì)走向新的“冬天”嗎? 我回答不了這個(gè)問題。但是,至少我不希望在當(dāng)前的技術(shù)路徑上持續(xù)這個(gè)“春天”。一方面,不可解釋性不符合人類發(fā)現(xiàn)知識(shí)、發(fā)明技術(shù)的基本邏輯,希望“知其然并知其所以然”是人的天性,更應(yīng)該是科學(xué)家遵循的基本原則。另一方面,以Scaling Law為“信仰”的大模型訓(xùn)練,以過度的資源消耗為代價(jià),難以永續(xù),必有盡頭。我們知道,Universal Approximation Theorem只是證明了能夠構(gòu)建概率模型的神經(jīng)網(wǎng)絡(luò)的存在,并未給出如何構(gòu)造該網(wǎng)絡(luò)的具體方法,也未說明需要多少神經(jīng)元或?qū)訑?shù)才能達(dá)到所需的逼近精度。而Scaling Law為我們提供了一個(gè)“經(jīng)驗(yàn)參考”,即一個(gè)通過觀察實(shí)驗(yàn)結(jié)果而得到的“統(tǒng)計(jì)意義上的規(guī)律”,說明了“可能”用包含多少參數(shù)的模型、多少訓(xùn)練數(shù)據(jù)、多少算力,可以獲得怎樣的模型表現(xiàn),換言之,提供了一個(gè)解釋“通過擴(kuò)大模型參數(shù)或數(shù)據(jù)和計(jì)算資源提升模型逼近能力”的參考規(guī)律。于是乎,不少人將之奉為圭臬,走上了“拼”數(shù)據(jù)和計(jì)算資源的“蠻力”訓(xùn)練路徑。 此外,雖然基于當(dāng)前的技術(shù)路徑,大模型尚不能“無中生有”,做出超越人類預(yù)期的事情,但一味信奉“蠻力”、追求規(guī)模,也極易發(fā)展出在覆蓋面和復(fù)雜度上人們難以掌控的“巨獸”。 科學(xué)家在探索自然的過程中,一直在追求為世界建模,遵循的基本準(zhǔn)則是簡(jiǎn)而美。我國(guó)古代智者曾說:“妙言至徑,大道至簡(jiǎn)”,愛因斯坦也有一句名言:“結(jié)果應(yīng)該至簡(jiǎn),而不僅僅是相對(duì)簡(jiǎn)化(Everything should be made as simple as possible, but not simpler)。”我們?cè)诤芏囝I(lǐng)域的科學(xué)研究中都在追尋第一性原理(First Principles),這些無不是在闡釋相同的道理。然而,按照Scaling Law產(chǎn)出的結(jié)果,并不符合這個(gè)原則,而且,僅利用大模型通過“黑盒”的方式直接獲得結(jié)果,而不去探索其背后的原理和規(guī)律,不是也不應(yīng)該是科研錨定的目標(biāo)。 我想,我們都不希望AI的“冬天”再一次到來,但是,沿襲當(dāng)前技術(shù)路徑,AI的能力“天花板”似已隱隱可見。 AI是一個(gè)獨(dú)立學(xué)科嗎? 這無疑是一個(gè)得罪人的問題,似乎也不太符合當(dāng)前的一些“主流”傾向。不過,就學(xué)科本身展開討論,我認(rèn)為是有必要的。這個(gè)問題實(shí)際上可展開為若干個(gè)子問題:如果沒有現(xiàn)代計(jì)算機(jī),會(huì)有AI這個(gè)詞的出現(xiàn)嗎?當(dāng)前主流的AI,能離開計(jì)算機(jī)嗎?不懂計(jì)算機(jī)運(yùn)行的基本原理,能做好AI的科研和應(yīng)用嗎?如果AI作為一個(gè)學(xué)科,它的知識(shí)體系是什么?與計(jì)算機(jī)學(xué)科的區(qū)別又是什么?就我個(gè)人而言,自然不認(rèn)同AI是一個(gè)獨(dú)立學(xué)科的說法。我也理解,我們要推動(dòng)相關(guān)產(chǎn)業(yè)的發(fā)展,迫切需要大量相關(guān)的人才。然而,人才培養(yǎng)未必一定要和學(xué)科設(shè)立掛鉤,學(xué)科的形成和發(fā)展有其自身內(nèi)在規(guī)律。對(duì)IT領(lǐng)域而言,其本質(zhì)都是基于計(jì)算,我們真的需要那么多的細(xì)分專業(yè)和學(xué)科嗎? 2020年8月,我曾在一個(gè)IT類學(xué)院院長(zhǎng)的會(huì)議上作過一個(gè)題為“亟須構(gòu)建合理的符合規(guī)律的IT人才培養(yǎng)體系”的報(bào)告。在報(bào)告中,我回顧了這些年我們?cè)倘钡娜瞬牛很浖瞬?、物?lián)網(wǎng)人才、網(wǎng)絡(luò)安全人才、大數(shù)據(jù)人才、人工智能人才、集成電路人才、區(qū)塊鏈人才等,“短缺”的人才,無一不是和當(dāng)時(shí)IT領(lǐng)域的熱點(diǎn)話題緊密關(guān)聯(lián),而解決的方法,基本都是在高校設(shè)立相關(guān)的專業(yè)甚至學(xué)院,于是出現(xiàn)了軟件學(xué)院、物聯(lián)網(wǎng)學(xué)院、網(wǎng)絡(luò)安全學(xué)院、集成電路學(xué)院、人工智能學(xué)院等,進(jìn)而再新建一級(jí)學(xué)科,如軟件工程、網(wǎng)絡(luò)空間安全,同一戲碼,反復(fù)上演。人才短缺是事實(shí),但具體缺什么,可能還需要更深入的思考。我在報(bào)告中表達(dá)的觀點(diǎn)是:在科研領(lǐng)域,我們不缺人才數(shù)量,缺的是人才質(zhì)量;而在應(yīng)用領(lǐng)域,缺的是大量能直接上手的應(yīng)用型人才。研究型大學(xué)的定位是知識(shí)創(chuàng)新的主體,培養(yǎng)的是面向未來的人才,而不是直接在市場(chǎng)上可使用的技能型人才;而應(yīng)用型大學(xué)的定位就是面向市場(chǎng)需求,培養(yǎng)企業(yè)直接可用的人才。解決產(chǎn)業(yè)人才短缺問題,主力應(yīng)該是應(yīng)用型大學(xué)。在研究型大學(xué)內(nèi)通過設(shè)立專業(yè)、學(xué)院,甚至學(xué)科應(yīng)對(duì)產(chǎn)業(yè)人才短缺問題,在一定程度上會(huì)對(duì)大學(xué)的專業(yè)學(xué)科體系帶來負(fù)面影響。 合理的、符合規(guī)律的IT人才培養(yǎng)體系需要長(zhǎng)遠(yuǎn)的系統(tǒng)規(guī)劃,避免跟著熱點(diǎn)走,頭痛醫(yī)頭腳痛醫(yī)腳;避免“歸一化”的人才需求,創(chuàng)新型人才和應(yīng)用型人才都重要,應(yīng)保持平衡,不能偏廢任一方;避免行政力量影響、干預(yù)大學(xué)的學(xué)科設(shè)置,特別是研究型大學(xué)的學(xué)科設(shè)置;大學(xué)應(yīng)該保持定力,在發(fā)揮自身優(yōu)勢(shì)特色的前提下進(jìn)行戰(zhàn)略布局,不宜為了一時(shí)的熱點(diǎn)和資源而調(diào)整專業(yè)學(xué)科設(shè)置,特別要避免那些有損于內(nèi)部一致性的調(diào)整;企業(yè)的要求不宜太急切,不應(yīng)指望研究型大學(xué)培養(yǎng)的人才能夠立即為其所用,參與大學(xué)教育也不應(yīng)太功利,不能指望公司的平臺(tái)產(chǎn)品能直接用于學(xué)生實(shí)訓(xùn)。我們需要深刻理解,對(duì)研究型大學(xué)而言,本科的通識(shí)教育是大趨勢(shì),是人才未來能夠持續(xù)成長(zhǎng)、行穩(wěn)致遠(yuǎn)的基礎(chǔ)。當(dāng)前急需的人才很重要,未來需要的人才更重要,而能夠創(chuàng)造未來的人才更加重要。 總結(jié) 以上不成體系的陳述,可能源于我較為保守的思想,也可以視為一個(gè)思想保守者的杞人憂天,而且主觀立場(chǎng)偏強(qiáng)。實(shí)際上,我也有過心路歷程的轉(zhuǎn)變。我也曾經(jīng)是科學(xué)探索無禁區(qū)、技術(shù)研發(fā)無疆界、技術(shù)應(yīng)用須謹(jǐn)慎的支持者,我也一直認(rèn)可技術(shù)本身就是一把雙刃劍?,F(xiàn)在我談?wù)撨@些問題的主要憂慮在于,當(dāng)前的技術(shù)發(fā)展已經(jīng)可能會(huì)侵襲到人類的認(rèn)知領(lǐng)域,進(jìn)而可能會(huì)威脅到人類的主體地位,故而萌生“恐懼”之心。 當(dāng)然,這些思考未必正確,所憂慮的風(fēng)險(xiǎn)也未必會(huì)發(fā)生。但是,從科技倫理的視角,我們需要對(duì)可能的風(fēng)險(xiǎn)進(jìn)行研判,并提醒科技工作者時(shí)刻牢記科技向善、以人為本。其中,一些關(guān)于科研工作和計(jì)算機(jī)學(xué)科未來發(fā)展的觀點(diǎn),帶有較強(qiáng)的“疆域”意識(shí),但作為一個(gè)計(jì)算機(jī)學(xué)科的科技工作者,并且曾經(jīng)擔(dān)任過中國(guó)計(jì)算機(jī)學(xué)會(huì)的理事長(zhǎng),發(fā)出這樣的聲音,也算是“守土有責(zé)”。 實(shí)際上,今天的AI熱潮,包括對(duì)AI發(fā)展?fàn)顟B(tài)和速度的過度高估,以及對(duì)AI發(fā)展可能給人類帶來巨大負(fù)面影響的種種擔(dān)憂,在歷史上也曾經(jīng)出現(xiàn)過。有興趣的讀者可以去看看計(jì)算機(jī)、AI發(fā)展早期的主流媒體報(bào)道。電子計(jì)算機(jī)出現(xiàn)之后,此類報(bào)道就未曾停止,只不過早期報(bào)道的主角是計(jì)算機(jī)。當(dāng)初媒體對(duì)計(jì)算機(jī)的報(bào)道也是兩個(gè)方面,盲目、過度的高估和脫離實(shí)際的擔(dān)憂。這些報(bào)道放到今天,主角換成AI,似乎仍然可以適用。只不過,紙質(zhì)媒體的傳播影響畢竟有限,遠(yuǎn)不及今天互聯(lián)網(wǎng)、自媒體的喧囂。 前事不忘,后事之師。馬克·吐溫曾說過:“歷史不會(huì)重復(fù),但會(huì)押韻?!痹贏I技術(shù)如火如荼的今天,我提出這幾點(diǎn)冷思考,也是希望歷史不要重演,即使重復(fù)無法避免,也希望是螺旋式的上升。 ![]() 梅宏 CCF會(huì)士、前理事長(zhǎng)。中國(guó)科學(xué)院院士。北京大學(xué)教授。主要研究方向?yàn)橄到y(tǒng)軟件、軟件工程。meih@pku.edu.cn
|
|
|