第 1 章 人工智能之夢(mèng)張江 制造出能夠像人類一樣思考的機(jī)器是科學(xué)家們最偉大的夢(mèng)想之一。用智慧的大腦解讀智慧必將成為科學(xué)發(fā)展的終極。而驗(yàn)證這種解讀的最有效手段,莫過(guò)于再造一個(gè)智慧大腦——人工智能(Artificial Intelligence,AI)。 人們對(duì)人工智能的了解恐怕主要來(lái)自于好萊塢的科幻片。這些熒幕上的機(jī)器(見圖1-1)要么殺人如麻,如《終結(jié)者》《黑客帝國(guó)》;要么小巧可愛,如《機(jī)器人瓦利》;要么多愁善感,如《人工智能》;還有一些則大音希聲、大象無(wú)形,如《黑客帝國(guó)》中的Matrix網(wǎng)絡(luò),以及《超驗(yàn)駭客》《超體》。所有這些熒幕上的人工智能都具備一些共同特征:異常強(qiáng)大、能力非凡。
圖 1-1 電影中的人工智能 然而,現(xiàn)實(shí)中的人工智能卻與這些熒幕上的機(jī)器人相差甚遠(yuǎn),但它們的確已經(jīng)在我們身邊。搜索引擎、郵件過(guò)濾器、智能語(yǔ)音助手Siri、二維碼掃描器、游戲中的NPC(非玩家扮演角色)都是近60年來(lái)人工智能技術(shù)實(shí)用化的產(chǎn)物。這些人工智能都是一個(gè)個(gè)單一功能的“裸”程序,沒有堅(jiān)硬的、靈活的軀殼,更沒有想象中那么善解人意,甚至不是一個(gè)完整的個(gè)體。為什么想象與現(xiàn)實(shí)存在那么大的差距?這是因?yàn)椋嬲娜斯ぶ悄艿奶剿髦烦錆M了波折與不確定。 歷史上,研究人工智能就像是在坐過(guò)山車,忽上忽下。夢(mèng)想的肥皂泡一次次被冰冷的科學(xué)事實(shí)戳破,科學(xué)家們不得不一次次重新回到夢(mèng)的起點(diǎn)。作為一個(gè)獨(dú)立的學(xué)科,人工智能的發(fā)展非常奇葩。它不像其他學(xué)科那樣從分散走向統(tǒng)一,而是從1956年創(chuàng)立以來(lái)就不斷地分裂,形成了一系列大大小小的子領(lǐng)域。也許人工智能注定就是大雜燴,也許統(tǒng)一的時(shí)刻還未到來(lái)。然而,人們對(duì)人工智能的夢(mèng)想?yún)s是永遠(yuǎn)不會(huì)磨滅的。 本章將按歷史的順序介紹人工智能的發(fā)展。從早期的哥德爾、圖靈等人的研究到“人工智能”一詞的提出,再到后期的人工智能三大學(xué)派:符號(hào)學(xué)派、連接學(xué)派和行為學(xué)派,以及近年來(lái)的新進(jìn)展:貝葉斯網(wǎng)絡(luò)、深度學(xué)習(xí)、通用人工智能;最后我們將對(duì)未來(lái)的人工智能進(jìn)行展望。 夢(mèng)的開始(1900—1956)大衛(wèi)·希爾伯特
David Hilbert 說(shuō)來(lái)奇怪,人工智能之夢(mèng)開始于一小撮20世紀(jì)初期的數(shù)學(xué)家。這些人真正做到了用方程推動(dòng)整個(gè)世界。 歷史的車輪倒回到1900年,世紀(jì)之交的數(shù)學(xué)家大會(huì)在巴黎如期召開,德高望重的老數(shù)學(xué)家大衛(wèi)·希爾伯特(David Hilbert)莊嚴(yán)地向全世界數(shù)學(xué)家們宣布了23個(gè)未解決的難題。這23道難題道道經(jīng)典,而其中的第二問題和第十問題則與人工智能密切相關(guān),并最終促成了計(jì)算機(jī)的發(fā)明。 希爾伯特的第二問題來(lái)源于一個(gè)大膽的想法——運(yùn)用公理化的方法統(tǒng)一整個(gè)數(shù)學(xué),并運(yùn)用嚴(yán)格的數(shù)學(xué)推理證明數(shù)學(xué)自身的正確性。這個(gè)野心被后人稱為希爾伯特綱領(lǐng),雖然他自己沒能證明,但卻把這個(gè)任務(wù)交給了后來(lái)的年輕人,這就是希爾伯特第二問題:證明數(shù)學(xué)系統(tǒng)中應(yīng)同時(shí)具備一致性(數(shù)學(xué)真理不存在矛盾)和完備性(任意真理都可以被描述為數(shù)學(xué)定理)。 庫(kù)爾特·哥德爾
Kurt Godel 希爾伯特的勃勃野心無(wú)疑激勵(lì)著每一位年輕的數(shù)學(xué)家,其中就包括一個(gè)來(lái)自捷克的年輕人:庫(kù)爾特·哥德爾(Kurt Godel)。他起初是希爾伯特的忠實(shí)粉絲,并致力于攻克第二問題。然而,他很快發(fā)現(xiàn),自己之前的努力都是徒勞的,因?yàn)橄柌氐诙栴}的斷言根本就是錯(cuò)的:任何足夠強(qiáng)大的數(shù)學(xué)公理系統(tǒng)都存在著瑕疵:一致性和完備性不能同時(shí)具備。很快,哥德爾倒戈了,他背叛了希爾伯特,但卻推動(dòng)了整個(gè)數(shù)學(xué)的發(fā)展,于1931年提出了被美國(guó)《時(shí)代周刊》評(píng)選為20世紀(jì)最有影響力的數(shù)學(xué)定理:哥德爾不完備性定理。 盡管早在1931年,人工智能學(xué)科還沒有建立,計(jì)算機(jī)也沒有發(fā)明,但是哥德爾定理似乎已經(jīng)為人工智能提出了警告。這是因?yàn)槿绻覀儼讶斯ぶ悄芤部醋饕粋€(gè)機(jī)械化運(yùn)作的數(shù)學(xué)公理系統(tǒng),那么根據(jù)哥德爾定理,必然存在著某種人類可以構(gòu)造、但是機(jī)器無(wú)法求解的人工智能的“軟肋”。這就好像我們無(wú)法揪著自己的腦袋脫離地球,數(shù)學(xué)無(wú)法證明數(shù)學(xué)本身的正確性,人工智能也無(wú)法僅憑自身解決所有問題。所以,存在著人類可以求解但是機(jī)器卻不能解的問題,人工智能不可能超過(guò)人類。 但問題并沒有這么簡(jiǎn)單,上述命題成立的一個(gè)前提是人與機(jī)器不同,不是一個(gè)機(jī)械的公理化系統(tǒng)。然而,這個(gè)前提是否成立迄今為止我們并不知道,所以這一問題仍在爭(zhēng)論之中。關(guān)于此觀點(diǎn)的延伸討論請(qǐng)參見本書第4章。 艾倫·圖靈
Alan Turing 另外一個(gè)與哥德爾年齡相仿的年輕人被希爾伯特的第十問題深深地吸引了,并決定為此奉獻(xiàn)一生。這個(gè)人就是艾倫·圖靈(Alan Turing)。 希爾伯特第十問題的表述是:“是否存在著判定任意一個(gè)丟番圖方程有解的機(jī)械化運(yùn)算過(guò)程。”這句話的前半句比較晦澀,我們可以先忽略,因?yàn)楹蟀刖涫侵攸c(diǎn),“機(jī)械化運(yùn)算過(guò)程”用今天的話說(shuō)就是算法。然而,當(dāng)年,算法這個(gè)概念還是相當(dāng)模糊的。于是,圖靈設(shè)想出了一個(gè)機(jī)器——圖靈機(jī),它是計(jì)算機(jī)的理論原型,圓滿地刻畫出了機(jī)械化運(yùn)算過(guò)程的含義,并最終為計(jì)算機(jī)的發(fā)明鋪平了道路。 圖靈機(jī)模型(見圖1-2)形象地模擬了人類進(jìn)行計(jì)算的過(guò)程。假如我們希望計(jì)算任意兩個(gè)3位數(shù)的加法:139 + 919。我們需要一張足夠大的草稿紙以及一支可以在紙上不停地涂涂寫寫的筆。之后,我們需要從個(gè)位到百位一位一位地按照10以內(nèi)的加法規(guī)則完成加法。我們還需要考慮進(jìn)位,例如9 + 9 = 18,這個(gè)1就要加在十位上。我們是通過(guò)在草稿紙上記下適當(dāng)?shù)臉?biāo)記來(lái)完成這種進(jìn)位記憶的。最后,我們把計(jì)算的結(jié)果輸出到了紙上。
圖 1-2 圖靈機(jī)模型 圖靈機(jī)把所有這些過(guò)程都模型化了:草稿紙被模型化為一條無(wú)限長(zhǎng)的紙帶,筆被模型化為一個(gè)讀寫頭,固定的10以內(nèi)的運(yùn)算法則模型化為輸入給讀寫頭的程序,對(duì)于進(jìn)位的記憶則被模型化為讀寫頭的內(nèi)部狀態(tài)。于是,設(shè)定好紙帶上的初始信息,以及讀寫頭的當(dāng)前內(nèi)部狀態(tài)和程序規(guī)則,圖靈機(jī)就可以運(yùn)行起來(lái)了。它在每一時(shí)刻讀入一格紙帶的信息,并根據(jù)當(dāng)前的內(nèi)部狀態(tài),查找相應(yīng)的程序,從而給出下一時(shí)刻的內(nèi)部狀態(tài)并輸出信息到紙帶上。關(guān)于圖靈機(jī)的詳細(xì)描述,請(qǐng)參見本書第2章。 圖靈機(jī)模型一經(jīng)提出就得到了科學(xué)家們的認(rèn)可,這無(wú)疑給了圖靈莫大的鼓勵(lì)。他開始鼓起勇氣,展開想象的翅膀,進(jìn)一步思考圖靈機(jī)運(yùn)算能力的極限。1940年,圖靈開始認(rèn)真地思考機(jī)器是否能夠具備類人的智能。他馬上意識(shí)到這個(gè)問題的要點(diǎn)其實(shí)并不在于如何打造強(qiáng)大的機(jī)器,而在于我們?nèi)祟惾绾慰创悄?,即依?jù)什么標(biāo)準(zhǔn)評(píng)價(jià)一臺(tái)機(jī)器是否具備智能。于是,圖靈在1950年發(fā)表了《機(jī)器能思考嗎?》一文,提出了這樣一個(gè)標(biāo)準(zhǔn):如果一臺(tái)機(jī)器通過(guò)了“圖靈測(cè)試”,則我們必須接受這臺(tái)機(jī)器具有智能。那么,圖靈測(cè)試究竟是怎樣一種測(cè)試呢? 如圖1-3所示,假設(shè)有兩間密閉的屋子,其中一間屋子里面關(guān)了一個(gè)人,另一間屋子里面關(guān)了一臺(tái)計(jì)算機(jī):進(jìn)行圖靈測(cè)試的人工智能程序。然后,屋子外面有一個(gè)人作為測(cè)試者,測(cè)試者只能通過(guò)一根導(dǎo)線與屋子里面的人或計(jì)算機(jī)交流——與它們進(jìn)行聯(lián)網(wǎng)聊天。假如測(cè)試者在有限的時(shí)間內(nèi)無(wú)法判斷出這兩間屋子里面哪一個(gè)關(guān)的是人,哪一個(gè)是計(jì)算機(jī),那么我們就稱屋子里面的人工智能程序通過(guò)了圖靈測(cè)試,并具備了智能。事實(shí)上,圖靈當(dāng)年在《機(jī)器能思考嗎?》一文中設(shè)立的標(biāo)準(zhǔn)相當(dāng)寬泛:只要有30%的人類測(cè)試者在5分鐘內(nèi)無(wú)法分辨出被測(cè)試對(duì)象,就可以認(rèn)為程序通過(guò)了圖靈測(cè)試。
圖 1-3 圖靈測(cè)試示意圖 2014年6月12日,一個(gè)名為“尤金”(Eugene Goostman)的聊天程序(見圖1-4)成功地在5分鐘內(nèi)蒙騙了30%的人類測(cè)試者,從而達(dá)到了圖靈當(dāng)年提出來(lái)的標(biāo)準(zhǔn)。很多人認(rèn)為,這款程序具有劃時(shí)代的意義,它是自圖靈測(cè)試提出64年后第一個(gè)通過(guò)圖靈測(cè)試的程序。但是,很快就有人提出這只不過(guò)是一個(gè)噱頭,該程序并沒有宣傳的那么厲害。例如,谷歌公司的工程總監(jiān)、未來(lái)學(xué)家雷·庫(kù)茲韋爾(Ray Kurzweil)就表示,這個(gè)聊天機(jī)器人號(hào)稱只有13歲,并使用第二語(yǔ)言來(lái)回答問題,這成為了該程序重大缺陷的借口。另外,測(cè)試者只有5分鐘與之展開互動(dòng),這大大增加了他們?cè)诙唐趦?nèi)被“欺騙”的概率。
圖 1-4 “尤金”聊天程序 由此可見,圖靈將智能等同于符號(hào)運(yùn)算的智能表現(xiàn),而忽略了實(shí)現(xiàn)這種符號(hào)智能表現(xiàn)的機(jī)器內(nèi)涵。這樣做的好處是可以將所謂的智能本質(zhì)這一問題繞過(guò)去,它的代價(jià)是人工智能研制者們會(huì)把注意力集中在如何讓程序欺騙人類測(cè)試者上,甚至可以不擇手段。所以,對(duì)于將圖靈測(cè)試作為評(píng)判機(jī)器具備智能的唯一標(biāo)準(zhǔn),很多人開始質(zhì)疑。因?yàn)槿祟愔悄苓€包括諸如對(duì)復(fù)雜形式的判斷、創(chuàng)造性地解決問題的方法等,而這些特質(zhì)都無(wú)法在圖靈測(cè)試中體現(xiàn)出來(lái)。 總而言之,圖靈的研究無(wú)疑大大推動(dòng)了人工智能的進(jìn)展。然而,圖靈本人卻于1954年死于一個(gè)被劇毒氰化物注射過(guò)的蘋果,享年僅僅42歲。傳聞他是一名同性戀,這在當(dāng)時(shí)的英國(guó)是非法的。于是英國(guó)政府強(qiáng)行給他注射一種藥物抑制他的同性戀傾向,這導(dǎo)致他最終在治療期間痛苦萬(wàn)分地自殺了。據(jù)說(shuō),蘋果公司為了紀(jì)念這位計(jì)算機(jī)科學(xué)之父,特意用那個(gè)被圖靈咬掉一口的蘋果作為公司的logo。1966年,美國(guó)計(jì)算機(jī)協(xié)會(huì)設(shè)立了以圖靈命名的圖靈獎(jiǎng),以專門獎(jiǎng)勵(lì)那些對(duì)計(jì)算機(jī)事業(yè)作出重要貢獻(xiàn)的人,這相當(dāng)于計(jì)算機(jī)領(lǐng)域的諾貝爾獎(jiǎng)。 約翰·馮·諾依曼
John von Neumann 就在哥德爾絞盡腦汁捉摸希爾伯特第二問題的時(shí)候,另外一個(gè)來(lái)自匈牙利布達(dá)佩斯的天才少年也在思考同樣的問題,他就是大名鼎鼎的約翰·馮·諾依曼(John von Neumann)。 然而,馮·諾依曼遠(yuǎn)沒有哥德爾走運(yùn)。到了1931年,馮·諾依曼即將在希爾伯特第二問題上獲得突破,卻突然得知哥德爾已經(jīng)發(fā)表了哥德爾定理,先他一步。于是,馮·諾依曼一氣之下開始轉(zhuǎn)行研究起了量子力學(xué)。就在他的量子力學(xué)研究即將結(jié)出碩果之際,另外一位天才物理學(xué)家保羅·狄拉克(Paul Dirac)又一次搶了他的風(fēng)頭,出版了《量子力學(xué)原理》,并一舉成名。這比馮·諾依曼的《量子力學(xué)的數(shù)學(xué)基礎(chǔ)》整整早了兩年。 受到兩次打擊之后,馮·諾依曼開始把部分注意力從基礎(chǔ)數(shù)學(xué)轉(zhuǎn)向了工程應(yīng)用領(lǐng)域,終于大獲成功。1945年,憑借出眾的才華,馮·諾依曼在火車上完成了早期的計(jì)算機(jī)EDVAC的設(shè)計(jì),并提出了我們現(xiàn)在熟知的“馮·諾依曼體系結(jié)構(gòu)”。 馮·諾依曼的計(jì)算機(jī)與圖靈機(jī)是一脈相承的,但最大的不同就在于,馮·諾依曼的讀寫頭不再需要一格一格地讀寫紙帶,而是根據(jù)指定的地址,隨機(jī)地跳到相應(yīng)的位置完成讀寫。這也就是我們今天所說(shuō)的隨機(jī)訪問存儲(chǔ)器(Random Access Memory,RAM)的前身。關(guān)于馮·諾依曼體系結(jié)構(gòu)和現(xiàn)代計(jì)算機(jī)的工作原理,請(qǐng)參見本書第3章。 馮·諾依曼的計(jì)算機(jī)終于使得數(shù)學(xué)家們的研究結(jié)出了碩果,也最終推動(dòng)著人類歷史進(jìn)入了信息時(shí)代,使得人工智能之夢(mèng)成為了可能。 諾伯特·維納
Norbert Wiener 我們要介紹的最后一位數(shù)學(xué)家是美國(guó)的天才神童諾伯特·維納(Norbert Wiener)。據(jù)說(shuō)維納三歲的時(shí)候就開始在父親的影響下讀天文學(xué)和生物學(xué)的圖書。七歲的時(shí)候他所讀的物理學(xué)和生物學(xué)的知識(shí)范圍已經(jīng)超出了他父親。他年紀(jì)輕輕就掌握了拉丁語(yǔ)、希臘語(yǔ)、德語(yǔ)和英語(yǔ),并且涉獵人類科學(xué)的各個(gè)領(lǐng)域。后來(lái),他留學(xué)歐洲,曾先后拜師于羅素、希爾伯特、哈代等哲學(xué)、數(shù)學(xué)大師。維納在他70年的科學(xué)生涯中,先后涉足數(shù)學(xué)、物理學(xué)、工程學(xué)和生物學(xué),共發(fā)表240多篇論文,著作14本。 然而,與我們的主題最相關(guān)的,則要數(shù)維納于1948年提出來(lái)的新興學(xué)科“控制論”(Cybernetics)了。“Cybernetics”一詞源于希臘語(yǔ)的“掌舵人”。在控制論中,維納深入探討了機(jī)器與人的統(tǒng)一性——人或機(jī)器都是通過(guò)反饋完成某種目的的實(shí)現(xiàn),因此他揭示了用機(jī)器模擬人的可能性,這為人工智能的提出奠定了重要基礎(chǔ)。維納也是最早注意到心理學(xué)、腦科學(xué)和工程學(xué)應(yīng)相互交叉的人之一,這促使了后來(lái)認(rèn)知科學(xué)的發(fā)展。 這幾位數(shù)學(xué)大師不滿足于“躲進(jìn)小樓成一統(tǒng)”,埋頭解決一兩個(gè)超級(jí)數(shù)學(xué)難題。他們的思想大膽地?fù)肀Я税唏g復(fù)雜的世界,最終用他們的方程推動(dòng)了社會(huì)的進(jìn)步,開啟了人工智能之夢(mèng)。 夢(mèng)的延續(xù)(1956—1980)在數(shù)學(xué)大師們鋪平了理論道路,工程師們踏平了技術(shù)坎坷,計(jì)算機(jī)已呱呱落地的時(shí)候,人工智能終于橫空出世了。而這一歷史時(shí)刻的到來(lái)卻是從一個(gè)不起眼的會(huì)議開始的。 達(dá)特茅斯會(huì)議1956年8月,在美國(guó)漢諾斯小鎮(zhèn)寧?kù)o的達(dá)特茅斯學(xué)院中,約翰·麥卡錫(John McCarthy)、馬文·閔斯基(Marvin Minsky,人工智能與認(rèn)知學(xué)專家)、克勞德·香農(nóng)(Claude Shannon,信息論的創(chuàng)始人)、艾倫·紐厄爾(Allen Newell,計(jì)算機(jī)科學(xué)家)、赫伯特·西蒙(Herbert Simon,諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主)等科學(xué)家正聚在一起,討論著一個(gè)完全不食人間煙火的主題:用機(jī)器來(lái)模仿人類學(xué)習(xí)以及其他方面的智能。 會(huì)議足足開了兩個(gè)月的時(shí)間,雖然大家沒有達(dá)成普遍的共識(shí),但是卻為會(huì)議討論的內(nèi)容起了一個(gè)名字:人工智能。因此,1956年也就成為了人工智能元年。 黃金時(shí)期達(dá)特茅斯會(huì)議之后,人工智能獲得了井噴式的發(fā)展,好消息接踵而至。機(jī)器定理證明——用計(jì)算機(jī)程序代替人類進(jìn)行自動(dòng)推理來(lái)證明數(shù)學(xué)定理——是最先取得重大突破的領(lǐng)域之一。在達(dá)特茅斯會(huì)議上,紐厄爾和西蒙展示了他們的程序:“邏輯理論家”可以獨(dú)立證明出《數(shù)學(xué)原理》第二章的38條定理;而到了1963年,該程序已能證明該章的全部52條定理。1958年,美籍華人王浩在IBM704計(jì)算機(jī)上以3~5分鐘的時(shí)間證明了《數(shù)學(xué)原理》中有關(guān)命題演算部分的全部220條定理。而就在這一年,IBM公司還研制出了平面幾何的定理證明程序。 1976年,凱尼斯·阿佩爾(Kenneth Appel)和沃夫?qū)す希╓olfgang Haken)等人利用人工和計(jì)算機(jī)混合的方式證明了一個(gè)著名的數(shù)學(xué)猜想:四色猜想(現(xiàn)在稱為四色定理)。這個(gè)猜想表述起來(lái)非常簡(jiǎn)單易懂:對(duì)于任意的地圖,我們最少僅用四種顏色就可以染色該地圖,并使得任意兩個(gè)相鄰的國(guó)家不會(huì)重色;然而證明起來(lái)卻異常煩瑣。配合著計(jì)算機(jī)超強(qiáng)的窮舉和計(jì)算能力,阿佩爾等人把這個(gè)猜想證明了。 另一方面,機(jī)器學(xué)習(xí)領(lǐng)域也獲得了實(shí)質(zhì)的突破,在1956年的達(dá)特茅斯會(huì)議上,阿瑟·薩繆爾(Arthur Samuel)研制了一個(gè)跳棋程序,該程序具有自學(xué)習(xí)功能,可以從比賽中不斷總結(jié)經(jīng)驗(yàn)提高棋藝。1959年,該跳棋程序打敗了它的設(shè)計(jì)者薩繆爾本人,過(guò)了3年后,該程序已經(jīng)可以擊敗美國(guó)一個(gè)州的跳棋冠軍。 1956年,奧利弗·薩爾夫瑞德(Oliver Selfridge)研制出第一個(gè)字符識(shí)別程序,開辟了模式識(shí)別這一新的領(lǐng)域。1957年,紐厄爾和西蒙等開始研究一種不依賴于具體領(lǐng)域的通用問題求解器,他們稱之為GPS(General Problem Solver)。1963年,詹姆斯·斯拉格(James Slagle)發(fā)表了一個(gè)符號(hào)積分程序SAINT,輸入一個(gè)函數(shù)的表達(dá)式,該程序就能自動(dòng)輸出這個(gè)函數(shù)的積分表達(dá)式。過(guò)了4年后,他們研制出了符號(hào)積分運(yùn)算的升級(jí)版SIN,SIN的運(yùn)算已經(jīng)可以達(dá)到專家級(jí)水準(zhǔn)。 遇到瓶頸所有這一切來(lái)得太快了,勝利沖昏了人工智能科學(xué)家們的頭腦,他們開始盲目樂觀起來(lái)。例如,1958年,紐厄爾和西蒙就自信滿滿地說(shuō),不出10年,計(jì)算機(jī)將會(huì)成為世界象棋冠軍,證明重要的數(shù)學(xué)定理,譜出優(yōu)美的音樂。照這樣的速度發(fā)展下去,2000年人工智能就真的可以超過(guò)人類了。 然而,歷史似乎故意要作弄輕狂無(wú)知的人工智能科學(xué)家們。1965年,機(jī)器定理證明領(lǐng)域遇到了瓶頸,計(jì)算機(jī)推了數(shù)十萬(wàn)步也無(wú)法證明兩個(gè)連續(xù)函數(shù)之和仍是連續(xù)函數(shù)。薩繆爾的跳棋程序也沒那么神氣了,它停留在了州冠軍的層次,無(wú)法進(jìn)一步戰(zhàn)勝世界冠軍。 最糟糕的事情發(fā)生在機(jī)器翻譯領(lǐng)域,對(duì)于人類自然語(yǔ)言的理解是人工智能中的硬骨頭。計(jì)算機(jī)在自然語(yǔ)言理解與翻譯過(guò)程中表現(xiàn)得極其差勁,一個(gè)最典型的例子就是下面這個(gè)著名的英語(yǔ)句子:
當(dāng)時(shí),人們讓機(jī)器翻譯程序把這句話翻譯成俄語(yǔ),然后再翻譯回英語(yǔ)以檢驗(yàn)效果,得到的句子竟然是:
這簡(jiǎn)直是驢唇不對(duì)馬嘴嘛。怪不得有人挖苦道,美國(guó)政府花了2000萬(wàn)美元為機(jī)器翻譯挖掘了一座墳?zāi)?。有關(guān)自然語(yǔ)言理解的更多內(nèi)容,請(qǐng)參見本書第10章。 總而言之,越來(lái)越多的不利證據(jù)迫使政府和大學(xué)削減了人工智能的項(xiàng)目經(jīng)費(fèi),這使得人工智能進(jìn)入了寒冷的冬天。來(lái)自各方的事實(shí)證明,人工智能的發(fā)展不可能像人們?cè)缙谠O(shè)想的那樣一帆風(fēng)順,人們必須靜下心來(lái)冷靜思考。 知識(shí)就是力量經(jīng)歷了短暫的挫折之后,AI研究者們開始痛定思痛。愛德華·費(fèi)根鮑姆(Edward A. Feigenbaum)就是新生力量的佼佼者,他舉著“知識(shí)就是力量”的大旗,很快開辟了新的道路。
Edward A. Feigenbaum 費(fèi)根鮑姆分析到,傳統(tǒng)的人工智能之所以會(huì)陷入僵局,就是因?yàn)樗麄冞^(guò)于強(qiáng)調(diào)通用求解方法的作用,而忽略了具體的知識(shí)。仔細(xì)思考我們?nèi)祟惖那蠼膺^(guò)程就會(huì)發(fā)現(xiàn),知識(shí)無(wú)時(shí)無(wú)刻不在起著重要作用。因此,人工智能必須引入知識(shí)。 于是,在費(fèi)根鮑姆的帶領(lǐng)下,一個(gè)新的領(lǐng)域?qū)<蚁到y(tǒng)誕生了。所謂的專家系統(tǒng)就是利用計(jì)算機(jī)化的知識(shí)進(jìn)行自動(dòng)推理,從而模仿領(lǐng)域?qū)<医鉀Q問題。第一個(gè)成功的專家系統(tǒng)DENDRAL于1968年問世,它可以根據(jù)質(zhì)譜儀的數(shù)據(jù)推知物質(zhì)的分子結(jié)構(gòu)。在這個(gè)系統(tǒng)的影響下,各式各樣的專家系統(tǒng)很快陸續(xù)涌現(xiàn),形成了一種軟件產(chǎn)業(yè)的全新分支:知識(shí)產(chǎn)業(yè)。1977年,在第五屆國(guó)際人工智能大會(huì)上,費(fèi)根鮑姆用知識(shí)工程概括了這個(gè)全新的領(lǐng)域。 在知識(shí)工程的刺激下,日本的第五代計(jì)算機(jī)計(jì)劃、英國(guó)的阿爾維計(jì)劃、西歐的尤里卡計(jì)劃、美國(guó)的星計(jì)劃和中國(guó)的863計(jì)劃陸續(xù)推出,雖然這些大的科研計(jì)劃并不都是針對(duì)人工智能的,但是AI都作為這些計(jì)劃的重要組成部分。 然而,好景不長(zhǎng),在專家系統(tǒng)、知識(shí)工程獲得大量的實(shí)踐經(jīng)驗(yàn)之后,弊端開始逐漸顯現(xiàn)了出來(lái),這就是知識(shí)獲取。面對(duì)這個(gè)全新的棘手問題,新的“費(fèi)根鮑姆”沒有再次出現(xiàn),人工智能這個(gè)學(xué)科卻發(fā)生了重大轉(zhuǎn)變:它逐漸分化成了幾大不同的學(xué)派。 群龍問鼎(1980—2010)專家系統(tǒng)、知識(shí)工程的運(yùn)作需要從外界獲得大量知識(shí)的輸入,而這樣的輸入工作是極其費(fèi)時(shí)費(fèi)力的,這就是知識(shí)獲取的瓶頸。于是,在20世紀(jì)80年代,機(jī)器學(xué)習(xí)這個(gè)原本處于人工智能邊緣地區(qū)的分支一下子成為了人們關(guān)注的焦點(diǎn)。 盡管傳統(tǒng)的人工智能研究者也在奮力掙扎,但是人們很快發(fā)現(xiàn),如果采用完全不同的世界觀,即讓知識(shí)通過(guò)自下而上的方式涌現(xiàn),而不是讓專家們自上而下地設(shè)計(jì)出來(lái),那么機(jī)器學(xué)習(xí)的問題其實(shí)可以得到很好地解決。這就好比我們教育小孩子,傳統(tǒng)人工智能好像填鴨式教學(xué),而新的方法則是啟發(fā)式教學(xué):讓孩子自己來(lái)學(xué)。 事實(shí)上,在人工智能界,很早就有人提出過(guò)自下而上的涌現(xiàn)智能的方案,只不過(guò)它們從來(lái)沒有引起大家的注意。一批人認(rèn)為可以通過(guò)模擬大腦的結(jié)構(gòu)(神經(jīng)網(wǎng)絡(luò))來(lái)實(shí)現(xiàn),而另一批人則認(rèn)為可以從那些簡(jiǎn)單生物體與環(huán)境互動(dòng)的模式中尋找答案。他們分別被稱為連接學(xué)派和行為學(xué)派。與此相對(duì),傳統(tǒng)的人工智能則被統(tǒng)稱為符號(hào)學(xué)派。自20世紀(jì)80年代開始,到20世紀(jì)90年代,這三大學(xué)派形成了三足鼎立的局面。 符號(hào)學(xué)派
John McCarthy 作為符號(hào)學(xué)派的代表,人工智能的創(chuàng)始人之一約翰·麥卡錫在自己的網(wǎng)站上掛了一篇文章《什么是人工智能》,為大家闡明什么是人工智能(按照符號(hào)學(xué)派的理解)。
在這里,麥卡錫特意強(qiáng)調(diào)人工智能研究并不一定局限于模擬真實(shí)的生物智能行為,而是更強(qiáng)調(diào)它的智能行為和表現(xiàn)的方面,這一點(diǎn)和圖靈測(cè)試的想法是一脈相承的。另外,麥卡錫還突出了利用計(jì)算機(jī)程序來(lái)模擬智能的方法。他認(rèn)為,智能是一種特殊的軟件,與實(shí)現(xiàn)它的硬件并沒有太大的關(guān)系。 紐厄爾和西蒙則把這種觀點(diǎn)概括為“物理符號(hào)系統(tǒng)假說(shuō)”(physical symbolic system hypothesis)。該假說(shuō)認(rèn)為,任何能夠?qū)⑽锢淼哪承┠J剑╬attern)或符號(hào)進(jìn)行操作并轉(zhuǎn)化成另外一些模式或符號(hào)的系統(tǒng),就有可能產(chǎn)生智能的行為。這種物理符號(hào)可以是通過(guò)高低電位的組成或者是燈泡的亮滅所形成的霓虹燈圖案,當(dāng)然也可以是人腦神經(jīng)網(wǎng)絡(luò)上的電脈沖信號(hào)。這也恰恰是“符號(hào)學(xué)派”得名的依據(jù)。 在“物理符號(hào)系統(tǒng)假說(shuō)”的支持下,符號(hào)學(xué)派把焦點(diǎn)集中在人類智能的高級(jí)行為,如推理、規(guī)劃、知識(shí)表示等方面。這些工作在一些領(lǐng)域獲得了空前的成功。 人機(jī)大戰(zhàn)計(jì)算機(jī)博弈(下棋)方面的成功就是符號(hào)學(xué)派名揚(yáng)天下的資本。早在1958年,人工智能的創(chuàng)始人之一西蒙就曾預(yù)言,計(jì)算機(jī)會(huì)在10年內(nèi)成為國(guó)際象棋世界冠軍。然而,正如我們前面討論過(guò)的,這種預(yù)測(cè)過(guò)于樂觀了。事實(shí)比西蒙的預(yù)言足足晚了40年的時(shí)間。 1988年,IBM開始研發(fā)可以與人下國(guó)際象棋的智能程序“深思”——一個(gè)可以以每秒70萬(wàn)步棋的速度進(jìn)行思考的超級(jí)程序。到了1991年,“深思II”已經(jīng)可以戰(zhàn)平澳大利亞國(guó)際象棋冠軍達(dá)瑞爾·約翰森(Darryl Johansen)。1996年,“深思”的升級(jí)版“深藍(lán)”開始挑戰(zhàn)著名的人類國(guó)際象棋世界冠軍加里·卡斯帕羅夫(Garry Kasparov),卻以2:4敗下陣來(lái)。但是,一年后的5月11日,“深藍(lán)”最終以3.5:2.5的成績(jī)戰(zhàn)勝了卡斯帕羅夫(見圖1-5),成為了人工智能的一個(gè)里程碑。
圖 1-5 “深藍(lán)”戰(zhàn)勝卡斯帕羅夫1 1圖片來(lái)源:http://cdn./static/mt/assets/science/kasparov615.jpg。 人機(jī)大戰(zhàn)終于以計(jì)算機(jī)的勝利劃上了句號(hào)。那是不是說(shuō)計(jì)算機(jī)已經(jīng)超越了人類了呢?要知道,計(jì)算機(jī)通過(guò)超級(jí)強(qiáng)大的搜索能力險(xiǎn)勝了人類——當(dāng)時(shí)的“深藍(lán)”已經(jīng)可以在1秒鐘內(nèi)算兩億步棋。而且,“深藍(lán)”存儲(chǔ)了100年來(lái)幾乎所有的國(guó)際特級(jí)大師的開局和殘局下法。另外還有四位國(guó)際象棋特級(jí)大師親自“訓(xùn)練”“深藍(lán)”,真可謂是超豪華陣容。所以,最終的結(jié)果很難說(shuō)是計(jì)算機(jī)戰(zhàn)勝了人,更像是一批人戰(zhàn)勝了另一批人。最重要的是,國(guó)際象棋上的博弈是在一個(gè)封閉的棋盤世界中進(jìn)行的,而人類智能面對(duì)的則是一個(gè)復(fù)雜得多的開放世界。 然而,時(shí)隔14年后,另外一場(chǎng)在IBM超級(jí)計(jì)算機(jī)和人類之間的人機(jī)大戰(zhàn)刷新了記錄,也使得我們必須重新思考機(jī)器是否能戰(zhàn)勝人類這個(gè)問題。因?yàn)檫@次的比賽不再是下棋,而是自由的“知識(shí)問答”,這種競(jìng)賽環(huán)境比國(guó)際象棋開放得多,因?yàn)樘釂柕闹R(shí)可以涵蓋時(shí)事、歷史、文學(xué)、藝術(shù)、流行文化、科學(xué)、體育、地理、文字游戲等多個(gè)方面。因此,這次的機(jī)器勝利至少證明了計(jì)算機(jī)同樣可以在開放的世界中表現(xiàn)得不遜于人類。 這場(chǎng)人機(jī)大戰(zhàn)的游戲叫作《危險(xiǎn)》(Jeopardy),是美國(guó)一款著名的電視節(jié)目。在節(jié)目中,主持人通過(guò)自然語(yǔ)言給出一系列線索,然后,參賽隊(duì)員要根據(jù)這些線索用最短的時(shí)間把主持人描述的人或者事物猜出來(lái),并且以提問的方式回答。例如當(dāng)節(jié)目主持人給出線索“這是一種冷血的無(wú)足的冬眠動(dòng)物”的時(shí)候,選手應(yīng)該回答“什么是蛇?”而不是簡(jiǎn)單地回答“蛇”。由于問題會(huì)涉及各個(gè)領(lǐng)域,所以一般知識(shí)淵博的人類選手都很難獲勝。 然而,在2011年2月14日到2月16日期間的《危險(xiǎn)》比賽中,IBM公司的超級(jí)計(jì)算機(jī)沃森(Watson)卻戰(zhàn)勝了人類選手(見圖1-6)。
圖 1-6 沃森正在與人類選手一起玩《危險(xiǎn)》游戲2 2圖片來(lái)源:http://cdn./wp-content/uploads/IBM-Watson.jpg。 這一次,IBM打造的沃森是一款完全不同于以往的機(jī)器。首先,它必須是一個(gè)自然語(yǔ)言處理的高手,因?yàn)樗仨氃诙虝r(shí)間內(nèi)理解主持人的提問,甚至有的時(shí)候還必須理解語(yǔ)言中的隱含意思。而正如我們前文所說(shuō),自然語(yǔ)言理解始終是人工智能的最大難題。其次,沃森必須充分了解字謎,要領(lǐng)會(huì)雙關(guān)語(yǔ),并且腦中還要裝滿諸如莎士比亞戲劇的獨(dú)白、全球主要的河流和各國(guó)首都等知識(shí),所有這些知識(shí)并不限定在某個(gè)具體的領(lǐng)域。所以,沃森的勝利的確是人工智能界的一個(gè)標(biāo)志性事件。 可以說(shuō),人機(jī)大戰(zhàn)是人工智能符號(hào)學(xué)派1980年以來(lái)最出風(fēng)頭的應(yīng)用。然而,這種無(wú)休止的人機(jī)大戰(zhàn)也難逃成為噱頭的嫌疑。事實(shí)上,歷史上每次吸引眼球的人機(jī)大戰(zhàn)似乎都必然伴隨著IBM公司的股票大漲,這也就不難理解為什么IBM會(huì)花重金開發(fā)出一款又一款大型計(jì)算機(jī)去參加這么多無(wú)聊的競(jìng)賽,而不是去做一些更實(shí)用的東西了。 實(shí)際上,20世紀(jì)80年代以后,符號(hào)學(xué)派的發(fā)展勢(shì)頭已經(jīng)遠(yuǎn)不如當(dāng)年了,因?yàn)槿斯ぶ悄芪淞职灾鞯牡匚缓芸炀蛯儆谄渌麑W(xué)派了。 連接學(xué)派我們知道,人類的智慧主要來(lái)源于大腦的活動(dòng),而大腦則是由一萬(wàn)億個(gè)神經(jīng)元細(xì)胞通過(guò)錯(cuò)綜復(fù)雜的相互連接形成的。于是,人們很自然地想到,我們是否可以通過(guò)模擬大量神經(jīng)元的集體活動(dòng)來(lái)模擬大腦的智力呢? 對(duì)比物理符號(hào)系統(tǒng)假說(shuō),我們不難發(fā)現(xiàn),如果將智力活動(dòng)比喻成一款軟件,那么支撐這些活動(dòng)的大腦神經(jīng)網(wǎng)絡(luò)就是相應(yīng)的硬件。于是,主張神經(jīng)網(wǎng)絡(luò)研究的科學(xué)家實(shí)際上在強(qiáng)調(diào)硬件的作用,認(rèn)為高級(jí)的智能行為是從大量神經(jīng)網(wǎng)絡(luò)的連接中自發(fā)出現(xiàn)的,因此,他們又被稱為連接學(xué)派。 神經(jīng)網(wǎng)絡(luò)連接學(xué)派的發(fā)展也是一波三折。事實(shí)上,最早的神經(jīng)網(wǎng)絡(luò)研究可以追溯到1943年計(jì)算機(jī)發(fā)明之前。當(dāng)時(shí),沃倫·麥卡洛克(Warren McCulloch)和沃爾特·匹茲(Walter Pitts)二人提出了一個(gè)單個(gè)神經(jīng)元的計(jì)算模型,如圖1-7所示。 在這個(gè)模型中,左邊的 I1, I2, … ,IN 為輸入單元,可以從其他神經(jīng)元接受輸出,然后將這些信號(hào)經(jīng)過(guò)加權(quán)(W1, W2, … ,WN)傳遞給當(dāng)前的神經(jīng)元并完成匯總。如果匯總的輸入信息強(qiáng)度超過(guò)了一定的閾值(T),則該神經(jīng)元就會(huì)發(fā)放一個(gè)信號(hào) y 給其他神經(jīng)元或者直接輸出到外界。該模型后來(lái)被稱為麥卡洛克-匹茲模型,可以說(shuō)它是第一個(gè)真實(shí)神經(jīng)元細(xì)胞的模型。
圖 1-7 麥卡洛克和匹茲的神經(jīng)元模型 1957年,弗蘭克·羅森布拉特(Frank Rosenblatt)對(duì)麥卡洛克-匹茲模型進(jìn)行了擴(kuò)充,即在麥卡洛克-匹茲神經(jīng)元上加入了學(xué)習(xí)算法,擴(kuò)充的模型有一個(gè)響亮的名字:感知機(jī)。感知機(jī)可以根據(jù)模型的輸出 y 與我們希望模型的輸出 y * 之間的誤差,調(diào)整權(quán)重 W1, W2, … ,WN 來(lái)完成學(xué)習(xí)。 我們可以形象地把感知機(jī)模型理解為一個(gè)裝滿了大大小小水龍頭(W1, W2, … ,WN)的水管網(wǎng)絡(luò),學(xué)習(xí)算法可以調(diào)節(jié)這些水龍頭來(lái)控制最終輸出的水流,并讓它達(dá)到我們想要的流量,這就是學(xué)習(xí)的過(guò)程。這樣,感知機(jī)就好像一個(gè)可以學(xué)習(xí)的小孩,無(wú)論什么問題,只要明確了我們想要的輸入和輸出之間的關(guān)系,都可能通過(guò)學(xué)習(xí)得以解決,至少它的擁護(hù)者是這樣認(rèn)為的。 然而,好景不長(zhǎng),1969年,人工智能界的權(quán)威人士馬文·閔斯基給連接學(xué)派帶來(lái)了致命一擊。他通過(guò)理論分析指出,感知機(jī)并不像它的創(chuàng)立者羅森布拉特宣稱的那樣可以學(xué)習(xí)任何問題。連一個(gè)最簡(jiǎn)單的問題:判斷一個(gè)兩位的二進(jìn)制數(shù)是否僅包含0或者1(即所謂的XOR問題)都無(wú)法完成。這一打擊是致命的,本來(lái)就不是很熱的神經(jīng)網(wǎng)絡(luò)研究差點(diǎn)就被閔斯基這一棒子打死了。 多則不同
Geoffrey Hinton 1974年,人工智能連接學(xué)派的救世主杰夫·辛頓(Geoffrey Hinton)終于出現(xiàn)了。他曾至少兩次挽回連接學(xué)派的敗局,1974年是第一次,第二次會(huì)在下文提到。辛頓的出發(fā)點(diǎn)很簡(jiǎn)單——“多則不同”:只要把多個(gè)感知機(jī)連接成一個(gè)分層的網(wǎng)絡(luò),那么,它就可以圓滿地解決閔斯基的問題。如圖1-8所示,多個(gè)感知機(jī)連接成為一個(gè)四層的網(wǎng)絡(luò),最左面為輸入層,最右面為輸出層,中間的那些神經(jīng)元位于隱含層,右側(cè)的神經(jīng)元接受左側(cè)神經(jīng)元的輸出。
圖 1-8 多層感知機(jī) 但接下來(lái)的問題是,“人多吃得多”,那么多個(gè)神經(jīng)元,可能有幾百甚至上千個(gè)參數(shù)需要調(diào)節(jié),我們?nèi)绾螌?duì)這樣復(fù)雜的網(wǎng)絡(luò)進(jìn)行訓(xùn)練呢?辛頓等人發(fā)現(xiàn),采用幾年前阿瑟·布賴森(Arthur Bryson)等人提出來(lái)的反向傳播算法(Back propagation algorithm,簡(jiǎn)稱BP算法)就可以有效解決多層網(wǎng)絡(luò)的訓(xùn)練問題。 還是以水流管道為例來(lái)說(shuō)明。當(dāng)網(wǎng)絡(luò)執(zhí)行決策的時(shí)候,水從左側(cè)的輸入節(jié)點(diǎn)往右流,直到輸出節(jié)點(diǎn)將水吐出。而在訓(xùn)練階段,我們則需要從右往左來(lái)一層層地調(diào)節(jié)各個(gè)水龍頭,要使水流量達(dá)到要求,我們只要讓每一層的調(diào)節(jié)只對(duì)它右面一層的節(jié)點(diǎn)負(fù)責(zé)就可以了,這就是反向傳播算法。事實(shí)證明,多層神經(jīng)網(wǎng)絡(luò)裝備上反向傳播算法之后,可以解決很多復(fù)雜的識(shí)別和預(yù)測(cè)等問題。 幾乎是在同一時(shí)間,又有幾個(gè)不同的神經(jīng)網(wǎng)絡(luò)模型先后被提出,這些模型有的可以完成模式聚類,有的可以模擬聯(lián)想思維,有的具有深厚的數(shù)學(xué)物理基礎(chǔ),有的則模仿生物的構(gòu)造。所有這些大的突破都令連接學(xué)派名聲大噪,異軍突起。 統(tǒng)計(jì)學(xué)習(xí)理論 然而,連接學(xué)派的科學(xué)家們很快又陷入了困境。雖然各種神經(jīng)網(wǎng)絡(luò)可以解決問題,但是,它們究竟為什么會(huì)成功以及為什么在有些問題上會(huì)屢遭失敗,卻沒有人能說(shuō)得清楚。對(duì)網(wǎng)絡(luò)運(yùn)行原理的無(wú)知,也使得人們對(duì)如何提高神經(jīng)網(wǎng)絡(luò)運(yùn)行效率的問題無(wú)從下手。因此,連接學(xué)派需要理論的支持。
Vladimir Naumovich Vapnik 2000年左右,弗拉基米爾·萬(wàn)普尼克(Vladimir Naumovich Vapnik)和亞歷克塞·澤范蘭杰斯(Alexey Yakovlevich Chervonenkis)這兩位俄羅斯科學(xué)家提出了一整套新的理論:統(tǒng)計(jì)學(xué)習(xí)理論,受到連接學(xué)派的頂禮膜拜。 該理論大意可概括為“殺雞焉用宰牛刀”。我們的模型一定要與待解決的問題相匹配,如果模型過(guò)于簡(jiǎn)單,而問題本身的復(fù)雜度很高,就無(wú)法得到預(yù)期的精度。反過(guò)來(lái),若問題本身簡(jiǎn)單,而模型過(guò)于復(fù)雜,那么模型就會(huì)比較僵死,無(wú)法舉一反三,即出現(xiàn)所謂的“過(guò)擬合”(overfitting)現(xiàn)象。 實(shí)際上,統(tǒng)計(jì)學(xué)習(xí)理論的精神與奧卡姆剃刀原理有著深刻的聯(lián)系。威廉·奧卡姆(William Occum,1287—1347)是中世紀(jì)時(shí)期的著名哲學(xué)家,他留下的最重要的遺產(chǎn)就是奧卡姆剃刀原理。該原理說(shuō),如果對(duì)于同一個(gè)問題有不同的解決方案,那么我們應(yīng)該挑選其中最簡(jiǎn)單的一個(gè)。神經(jīng)網(wǎng)絡(luò)或者其他機(jī)器學(xué)習(xí)模型也應(yīng)該遵循類似的原理,只有當(dāng)模型的復(fù)雜度與所解決的問題相匹配的時(shí)候,才能讓模型更好地發(fā)揮作用。 然而,統(tǒng)計(jì)學(xué)習(xí)理論也有很大的局限性,因?yàn)槔碚摰膰?yán)格分析僅僅限于一類特殊的神經(jīng)網(wǎng)絡(luò)模型:支持向量機(jī)(Supporting Vector Machine)。而對(duì)于更一般的神經(jīng)網(wǎng)絡(luò),人們還未找到統(tǒng)一的分析方法。所以說(shuō),連接學(xué)派的科學(xué)家們雖然會(huì)向大腦學(xué)習(xí)如何構(gòu)造神經(jīng)網(wǎng)絡(luò)模型,但實(shí)際上他們自己也不清楚這些神經(jīng)網(wǎng)絡(luò)究竟是如何工作的。不過(guò),他們這種尷尬局面也是無(wú)獨(dú)有偶,另外一派后起之秀雖然來(lái)勢(shì)洶洶,卻也沒有解決理論基礎(chǔ)問題,這就是行為學(xué)派。 行為學(xué)派行為學(xué)派的出發(fā)點(diǎn)與符號(hào)學(xué)派和連接學(xué)派完全不同,他們并沒有把目光聚焦在具有高級(jí)智能的人類身上,而是關(guān)注比人類低級(jí)得多的昆蟲。即使這樣簡(jiǎn)單的動(dòng)物也體現(xiàn)出了非凡的智能,昆蟲可以靈活地?cái)[動(dòng)自己的身體行走,還能夠快速地反應(yīng),躲避捕食者的攻擊。而另一方面,盡管螞蟻個(gè)體非常簡(jiǎn)單,但是,當(dāng)很多小螞蟻聚集在一起形成龐大的蟻群的時(shí)候,卻能表現(xiàn)出非凡的智能,還能形成嚴(yán)密的社會(huì)分工組織。 正是受到了自然界中這些相對(duì)低等生物的啟發(fā),行為學(xué)派的科學(xué)家們決定從簡(jiǎn)單的昆蟲入手來(lái)理解智能的產(chǎn)生。的確,他們?nèi)〉昧瞬诲e(cuò)的成果。 機(jī)器昆蟲 Rodney Brooks 羅德尼·布魯克斯(Rodney Brooks)是一名來(lái)自美國(guó)麻省理工學(xué)院的機(jī)器人專家。在他的實(shí)驗(yàn)室中有大量的機(jī)器昆蟲(如圖1-9所示)。相對(duì)于那些笨拙的機(jī)器人鐵家伙來(lái)說(shuō),這些小昆蟲要靈活得多。
圖 1-9 機(jī)器昆蟲Walkman3 3圖片來(lái)源:http://grant./walkman.htm。 這些機(jī)器昆蟲沒有復(fù)雜的大腦,也不會(huì)按照傳統(tǒng)的方式進(jìn)行復(fù)雜的知識(shí)表示和推理。它們甚至不需要大腦的干預(yù),僅憑四肢和關(guān)節(jié)的協(xié)調(diào),就能很好地適應(yīng)環(huán)境。當(dāng)我們把這些機(jī)器昆蟲放到復(fù)雜的地形中的時(shí)候,它們可以痛快地爬行,還能聰明地避開障礙物。它們看起來(lái)的智能事實(shí)上并不來(lái)源于自上而下的復(fù)雜設(shè)計(jì),而是來(lái)源于自下而上的與環(huán)境的互動(dòng)。這就是布魯克斯所倡導(dǎo)的理念。 如果說(shuō)符號(hào)學(xué)派模擬智能軟件,連接學(xué)派模擬大腦硬件,那么行為學(xué)派就算是模擬身體了,而且是簡(jiǎn)單的、看起來(lái)沒有什么智能的身體。例如,行為學(xué)派的一個(gè)非常成功的應(yīng)用就是美國(guó)波士頓動(dòng)力公司(Boston Dynamics)研制開發(fā)的機(jī)器人“大狗”4。如圖1-10所示,“大狗”是一個(gè)四足機(jī)器人,它能夠在各種復(fù)雜的地形中行走、攀爬、奔跑,甚至還可以背負(fù)重物。“大狗”模擬了四足動(dòng)物的行走行為,能夠自適應(yīng)地根據(jù)不同的地形調(diào)整行走的模式。推薦感興趣的讀者掃描下方二維碼觀看視頻介紹。 4BigDog,參見http://www./robot_bigdog.html。
圖 1-10 行走在雪地上的“大狗”5 5圖片來(lái)源:http://www./armor/detail.asp?armor_id=184。 當(dāng)這只大狗伴隨著“沙沙”的機(jī)器運(yùn)作聲朝你走來(lái)時(shí),你一定會(huì)被它的氣勢(shì)所嚇到,因?yàn)樗臉幼雍芟袷且活^公牛呢! 進(jìn)化計(jì)算 我們從生物身上學(xué)到的東西還不僅僅是這些。從更長(zhǎng)的時(shí)間尺度看,生物體對(duì)環(huán)境的適應(yīng)還會(huì)迫使生物進(jìn)化,從而實(shí)現(xiàn)從簡(jiǎn)單到復(fù)雜、從低等到高等的躍遷。
John Holland 約翰·霍蘭(John Holland)是美國(guó)密西根大學(xué)的心理學(xué)、電器工程以及計(jì)算機(jī)的三科教授。他本科畢業(yè)于麻省理工學(xué)院,后來(lái)到了密西根大學(xué)師從阿瑟·伯克斯(Arthur Burks,曾是馮·諾依曼的助手)攻讀博士學(xué)位。1959年,他拿到了全世界首個(gè)計(jì)算機(jī)科學(xué)的博士頭銜。別看霍蘭個(gè)頭不高,他的骨子里卻有一種離經(jīng)叛道的氣魄。他在讀博期間就對(duì)如何用計(jì)算機(jī)模擬生物進(jìn)化異常著迷,并最終發(fā)表了他的遺傳算法。 遺傳算法對(duì)大自然中的生物進(jìn)化進(jìn)行了大膽的抽象,最終提取出兩個(gè)主要環(huán)節(jié):變異(包括基因重組和突變)和選擇。在計(jì)算機(jī)中,我們可以用一堆二進(jìn)制串來(lái)模擬自然界中的生物體。而大自然的選擇作用——生存競(jìng)爭(zhēng)、優(yōu)勝劣汰——?jiǎng)t被抽象為一個(gè)簡(jiǎn)單的適應(yīng)度函數(shù)。這樣,一個(gè)超級(jí)濃縮版的大自然進(jìn)化過(guò)程就可以搬到計(jì)算機(jī)中了,這就是遺傳算法。 遺傳算法在剛發(fā)表的時(shí)候并沒有引起多少人的重視。然而,隨著時(shí)間的推移,當(dāng)人工智能的焦點(diǎn)轉(zhuǎn)向機(jī)器學(xué)習(xí)時(shí),遺傳算法就一下子家喻戶曉了,因?yàn)樗拇_是一個(gè)非常簡(jiǎn)單而有效的機(jī)器學(xué)習(xí)算法。與神經(jīng)網(wǎng)絡(luò)不同,遺傳算法不需要把學(xué)習(xí)區(qū)分成訓(xùn)練和執(zhí)行兩個(gè)階段,它完全可以指導(dǎo)機(jī)器在執(zhí)行中學(xué)習(xí),即所謂的做中學(xué)(learning by doing)。同時(shí),遺傳算法比神經(jīng)網(wǎng)絡(luò)具有更方便的表達(dá)性和簡(jiǎn)單性。 無(wú)獨(dú)有偶,美國(guó)的勞倫斯·福格爾(Lawrence Fogel)、德國(guó)的因戈·雷伯格(Ingo Rechenberg)以及漢斯·保羅·施韋費(fèi)爾(Hans-Paul Schwefel)、霍蘭的學(xué)生約翰·科扎 (John Koza)等人也先后提出了演化策略、演化編程和遺傳編程。這使得進(jìn)化計(jì)算大家庭的成員更加多樣化了。 人工生命 無(wú)論是機(jī)器昆蟲還是進(jìn)化計(jì)算,科學(xué)家們關(guān)注的焦點(diǎn)都是如何模仿生物來(lái)創(chuàng)造智能的機(jī)器或者算法??死锼雇懈ァぬm頓(Chirstopher Langton)進(jìn)行了進(jìn)一步提煉,提出了“人工生命”這一新興學(xué)科。人工生命與人工智能非常接近,但是它的關(guān)注點(diǎn)在于如何用計(jì)算的手段來(lái)模擬生命這種更加“低等”的現(xiàn)象。 人工生命認(rèn)為,所謂的生命或者智能實(shí)際上是從底層單元(可以是大分子化合物,也可以是數(shù)字代碼)通過(guò)相互作用而產(chǎn)生的涌現(xiàn)屬性(emergent property)?!坝楷F(xiàn)”(emergence)這個(gè)詞是人工生命研究中使用頻率最高的詞之一,它強(qiáng)調(diào)了一種只有在宏觀具備但不能分解還原到微觀層次的屬性、特征或行為。單個(gè)的蛋白質(zhì)分子不具備生命特征,但是大量的蛋白質(zhì)分子組合在一起形成細(xì)胞的時(shí)候,整個(gè)系統(tǒng)就具備了“活”性,這就是典型的涌現(xiàn)。同樣地,智能則是比生命更高一級(jí)(假如我們能夠?qū)⒅悄芎蜕殖刹煌燃?jí)的話)的涌現(xiàn)——在生命系統(tǒng)中又涌現(xiàn)出了一整套神經(jīng)網(wǎng)絡(luò)系統(tǒng),從而使得整個(gè)生命體具備了智能屬性?,F(xiàn)實(shí)世界中的生命是由碳水化合物編織成的一個(gè)復(fù)雜網(wǎng)絡(luò),而人工生命則是寄生于01世界中的復(fù)雜有機(jī)體。 人工生命的研究思路是通過(guò)模擬的形式在計(jì)算機(jī)數(shù)碼世界中產(chǎn)生類似現(xiàn)實(shí)世界的涌現(xiàn)。因此,從本質(zhì)上講,人工生命模擬的就是涌現(xiàn)過(guò)程,而不太關(guān)心實(shí)現(xiàn)這個(gè)過(guò)程的具體單元。我們用01數(shù)字代表蛋白質(zhì)分子,并為其設(shè)置詳細(xì)的規(guī)則,接下來(lái)的事情就是運(yùn)行這個(gè)程序,然后盯著屏幕,喝上一杯咖啡,等待著令人吃驚的“生命現(xiàn)象”在電腦中出現(xiàn)。 模擬群體行為是人工生命的典型應(yīng)用之一。1983年,計(jì)算機(jī)圖形學(xué)家克雷格·雷諾茲(Craig Reynolds)曾開發(fā)了一個(gè)名為Boid的計(jì)算機(jī)模擬程序(見圖1-11),它可以逼真地模擬鳥群的運(yùn)動(dòng),還能夠聰明地躲避障礙物。后來(lái),肯尼迪(Kennedy)等人于1995年擴(kuò)展了Boid模型,提出了PSO(粒子群優(yōu)化)算法,成功地通過(guò)模擬鳥群的運(yùn)動(dòng)來(lái)解決函數(shù)優(yōu)化等問題。
圖 1-11 三維的人工生命Boid模型6 6圖片來(lái)源:http://www./cwr/boids/。 類似地,利用模擬群體行為來(lái)實(shí)現(xiàn)智能設(shè)計(jì)的例子還有很多,例如蟻群算法、免疫算法等,共同特征都是讓智能從規(guī)則中自下而上地涌現(xiàn)出來(lái),并能解決實(shí)際問題。關(guān)于人工生命的詳細(xì)討論,可以參考本書11~13章。 然而,行為學(xué)派帶來(lái)的問題似乎比提供的解決方法還多。究竟在什么情況下能夠發(fā)生涌現(xiàn)?如何設(shè)計(jì)底層規(guī)則使得系統(tǒng)能夠以我們希望的方式涌現(xiàn)?行為學(xué)派、人工生命的研究者們無(wú)法回答。更糟糕的是,幾十年過(guò)去了,人工生命研究似乎仍然只擅長(zhǎng)于模擬小蟲子、螞蟻之類的低等生物,高級(jí)的智能完全沒有像他們預(yù)期的那樣自然涌現(xiàn),而且沒有絲毫跡象。 三大學(xué)派間的關(guān)系正如我們前面提到的,這三個(gè)學(xué)派大致是從軟件、硬件和身體這三個(gè)角度來(lái)模擬和理解智能的。但是,這僅僅是一個(gè)粗糙的比喻。事實(shí)上,三大學(xué)派之間還存在著很多微妙的差異和聯(lián)系。 首先,符號(hào)學(xué)派的思想和觀點(diǎn)直接繼承自圖靈,他們是直接從功能的角度來(lái)理解智能的。他們把智能理解為一個(gè)黑箱,只關(guān)心這個(gè)黑箱的輸入和輸出,而不關(guān)心黑箱的內(nèi)部構(gòu)造。因此,符號(hào)學(xué)派利用知識(shí)表示和搜索來(lái)替代真實(shí)人腦的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。符號(hào)學(xué)派假設(shè)知識(shí)是先驗(yàn)地存儲(chǔ)于黑箱之中的,因此,它很擅長(zhǎng)解決利用現(xiàn)有的知識(shí)做比較復(fù)雜的推理、規(guī)劃、邏輯運(yùn)算和判斷等問題。 連接學(xué)派則顯然要把智能系統(tǒng)的黑箱打開,從結(jié)構(gòu)的角度來(lái)模擬智能系統(tǒng)的運(yùn)作,而不單單重現(xiàn)功能。這樣,連接學(xué)派看待智能會(huì)比符號(hào)學(xué)派更加底層。這樣做的好處是可以很好地解決機(jī)器學(xué)習(xí)的問題,并自動(dòng)獲取知識(shí);但是弱點(diǎn)是對(duì)于知識(shí)的表述是隱含而晦澀的,因?yàn)樗袑W(xué)習(xí)到的知識(shí)都變成了連接權(quán)重的數(shù)值。我們?nèi)粢x出神經(jīng)網(wǎng)絡(luò)中存儲(chǔ)的知識(shí),就必須要讓這個(gè)網(wǎng)絡(luò)運(yùn)作起來(lái),而無(wú)法直接從模型中讀出。連接學(xué)派擅長(zhǎng)解決模式識(shí)別、聚類、聯(lián)想等非結(jié)構(gòu)化的問題,但卻很難解決高層次的智能問題(如機(jī)器定理證明)。 行為學(xué)派則研究更低級(jí)的智能行為,它更擅長(zhǎng)模擬身體的運(yùn)作機(jī)制,而不是腦。同時(shí),行為學(xué)派非常強(qiáng)調(diào)進(jìn)化的作用,他們認(rèn)為,人類的智慧也理應(yīng)是從漫長(zhǎng)的進(jìn)化過(guò)程中逐漸演變而來(lái)的。行為學(xué)派擅長(zhǎng)解決適應(yīng)性、學(xué)習(xí)、快速行為反應(yīng)等問題,也可以解決一定的識(shí)別、聚類、聯(lián)想等問題,但在高級(jí)智能行為(如問題求解、邏輯演算)上則相形見絀。 有意思的是,連接學(xué)派和行為學(xué)派似乎更加接近,因?yàn)樗麄兌枷嘈胖悄苁亲韵露嫌楷F(xiàn)出來(lái)的,而非自上而下的設(shè)計(jì)。但麻煩在于,怎么涌現(xiàn)?涌現(xiàn)的機(jī)制是什么?這些深層次問題無(wú)法在兩大學(xué)派內(nèi)部解決,而必須求助于復(fù)雜系統(tǒng)科學(xué)。 三大學(xué)派分別從高、中、低三個(gè)層次來(lái)模擬智能,但現(xiàn)實(shí)中的智能系統(tǒng)顯然是一個(gè)完整的整體。我們應(yīng)如何調(diào)解、綜合這三大學(xué)派的觀點(diǎn)呢?這是一個(gè)未解決的開放問題,而且似乎很難在短時(shí)間內(nèi)解決。主要的原因在于,無(wú)論是在理論指導(dǎo)思想還是計(jì)算機(jī)模型等方面,三大學(xué)派都存在著太大的差異。 分裂與統(tǒng)一于是,就這樣磕磕碰碰地,人工智能走入了新的世紀(jì)。到了2000年前后,人工智能的發(fā)展非但沒有解決問題,反而引入了一個(gè)又一個(gè)新的問題,這些問題似乎變得越來(lái)越難以回答,而且所牽扯的理論也越來(lái)越深。于是,很多人工智能研究者干脆當(dāng)起了“鴕鳥”,對(duì)理論問題不聞不問,而是一心向“應(yīng)用”看齊。爭(zhēng)什么爭(zhēng)呀,實(shí)踐是檢驗(yàn)真理的唯一標(biāo)準(zhǔn),無(wú)論是符號(hào)、連接、行為,能夠解決實(shí)際問題的鳥就是好鳥。 群龍無(wú)首在這樣一種大背景下,人工智能開始進(jìn)一步分化,很多原本隸屬于人工智能的領(lǐng)域逐漸獨(dú)立成為面向具體應(yīng)用的新興學(xué)科,我們簡(jiǎn)單羅列如下:
每一個(gè)領(lǐng)域都包含大量具體的技術(shù)和專業(yè)知識(shí)以及特殊的應(yīng)用背景,不同分支之間也幾乎是老死不相往來(lái),大一統(tǒng)的人工智能之夢(mèng)仿佛破滅了。于是,計(jì)算機(jī)視覺專家甚至不愿意承認(rèn)自己搞的叫人工智能,因?yàn)樗麄冋J(rèn)為,人工智能已經(jīng)成為了一個(gè)僅僅代表傳統(tǒng)的符號(hào)學(xué)派觀點(diǎn)的專有名詞,大一統(tǒng)的人工智能概念沒有任何意義,也沒有存在的必要。這就是人工智能進(jìn)入2000年之后的狀況。 貝葉斯統(tǒng)計(jì)但是,世界總是那么奇妙,少數(shù)派總是存在的。當(dāng)人工智能正面臨著土崩瓦解的窘境時(shí),仍然有少數(shù)科學(xué)家正在逆流而動(dòng),試圖重新構(gòu)建統(tǒng)一的模式。 麻省理工學(xué)院的喬?!ぬ啬硝U姆(Josh Tenenbaum)以及斯坦福大學(xué)的達(dá)芙妮·科勒(Daphne Koller)就是這樣的少數(shù)派。他們的特立獨(dú)行起源于對(duì)概率這個(gè)有著幾百年歷史的數(shù)學(xué)概念的重新認(rèn)識(shí),并利用這種認(rèn)識(shí)來(lái)統(tǒng)一人工智能的各個(gè)方面,包括學(xué)習(xí)、知識(shí)表示、推理以及決策。 這樣的認(rèn)識(shí)其實(shí)可以追溯到一位18世紀(jì)的古人,這就是著名的牧師、業(yè)余數(shù)學(xué)家:托馬斯·貝葉斯(Thomas Bayes)。與傳統(tǒng)的方法不同,貝葉斯將事件的概率視為一種主觀的信念,而不是傳統(tǒng)意義上的事件發(fā)生的頻率。因此,概率是一種主觀的測(cè)度,而非客觀的度量。故而,人們也將貝葉斯對(duì)概率的看法稱為主觀概率學(xué)派——這一觀點(diǎn)更加明確地凸顯出貝葉斯概率與傳統(tǒng)概率統(tǒng)計(jì)的區(qū)別。 貝葉斯學(xué)派的核心就是著名的貝葉斯公式,它表達(dá)了智能主體如何根據(jù)搜集到的信息改變對(duì)外在事物的看法。因此,貝葉斯公式概括了人們的學(xué)習(xí)過(guò)程。以貝葉斯公式為基礎(chǔ),人們發(fā)展出了一整套稱為貝葉斯網(wǎng)絡(luò)(示例見圖1-12)的方法。在這個(gè)網(wǎng)絡(luò)上,研究者可以展開對(duì)學(xué)習(xí)、知識(shí)表示和推理的各種人工智能的研究。隨著大數(shù)據(jù)時(shí)代的來(lái)臨,貝葉斯方法所需要的數(shù)據(jù)也是唾手可得,這使得貝葉斯網(wǎng)絡(luò)成為了人們關(guān)注的焦點(diǎn)。
圖 1-12 貝葉斯網(wǎng)絡(luò)示例7 7圖片來(lái)源:Wikipedia。 通用人工智能另外一個(gè)嘗試統(tǒng)一人工智能的學(xué)者是澳大利亞國(guó)立大學(xué)的馬庫(kù)斯·胡特(Marcus Hutter),他在2000年的時(shí)候就開始嘗試建立一個(gè)新的學(xué)科,并為這個(gè)新學(xué)科取了一個(gè)響當(dāng)當(dāng)?shù)拿郑?strong>通用人工智能(Universal Artificial Intelligence)。
Marcus Hutter 胡特認(rèn)為,現(xiàn)在主流的人工智能研究已經(jīng)嚴(yán)重偏離人工智能這個(gè)名稱的本意。我們不應(yīng)該將智能化分成學(xué)習(xí)、認(rèn)知、決策、推理等分立的不同側(cè)面。事實(shí)上,對(duì)于人類來(lái)說(shuō),所有這些功能都是智能作為一個(gè)整體的不同表現(xiàn)。因此,在人工智能中,我們應(yīng)該始終保持清醒的頭腦,將智能看作一個(gè)整體,而不是若干分離的子系統(tǒng)。 如果非要堅(jiān)持統(tǒng)一性和廣泛性,那么我們就不得不放棄理論上的實(shí)用性,這恰恰正是胡特的策略。與通常的人工智能研究非常不同,胡特采用的是規(guī)范研究方法,即給出所謂的智能程序一個(gè)數(shù)學(xué)上的定義,然后運(yùn)用嚴(yán)格的數(shù)理邏輯討論它的性質(zhì)。但是,理論上已證明,胡特定義的智能程序是數(shù)學(xué)上可構(gòu)造的,但卻是計(jì)算機(jī)不可計(jì)算的——任何計(jì)算機(jī)都無(wú)法模擬這樣的智能程序——只有上帝能計(jì)算出來(lái)。 不可計(jì)算的智能程序有什么用?相信讀者會(huì)有這樣的疑問。實(shí)際上,如果在20世紀(jì)30年代,我們也會(huì)對(duì)圖靈的研究發(fā)出同樣的疑問。因?yàn)槟莻€(gè)時(shí)候計(jì)算機(jī)還沒有發(fā)明呢,那么圖靈機(jī)模型有什么用呢?這也仿佛是傳說(shuō)中英國(guó)女王對(duì)法拉第的詰難:“你研究的這些電磁理論有什么用呢?”法拉第則反問道:“那么,我尊敬的女王陛下,您認(rèn)為,您懷中抱著的嬰兒有什么用呢?” 胡特的理論雖然還不能與圖靈的研究相比,但是,它至少為統(tǒng)一人工智能開辟了新方向,讓我們看到了統(tǒng)一的曙光。我們只有等待歷史來(lái)揭曉最終的答案。更多關(guān)于通用人工智能的內(nèi)容,請(qǐng)參見本書第5章。 夢(mèng)醒何方(2010至今)就這樣,在爭(zhēng)論聲中,人工智能走進(jìn)了21世紀(jì)的第二個(gè)十年,似乎一切都沒有改變。但是,幾件事情悄悄地發(fā)生了,它們重新燃起了人們對(duì)于人工智能之夢(mèng)的渴望。 深度學(xué)習(xí)21世紀(jì)的第二個(gè)十年,如果要評(píng)選出最惹人注目的人工智能研究,那么一定要數(shù)深度學(xué)習(xí)(Deep Learning)了。 2011年,谷歌X實(shí)驗(yàn)室的研究人員從YouTube視頻中抽取出1000萬(wàn)張靜態(tài)圖片,把它喂給“谷歌大腦”——一個(gè)采用了所謂深度學(xué)習(xí)技術(shù)的大型神經(jīng)網(wǎng)絡(luò)模型,在這些圖片中尋找重復(fù)出現(xiàn)的模式。三天后,這臺(tái)超級(jí)“大腦”在沒有人類的幫助下,居然自己從這些圖片中發(fā)現(xiàn)了“貓”。 2012年11月,微軟在中國(guó)的一次活動(dòng)中,展示了他們新研制的一個(gè)全自動(dòng)的同聲翻譯系統(tǒng)——采用了深度學(xué)習(xí)技術(shù)的計(jì)算系統(tǒng)。演講者用英文演講,這臺(tái)機(jī)器能實(shí)時(shí)地完成語(yǔ)音識(shí)別、機(jī)器翻譯和中文的語(yǔ)音合成,也就是利用深度學(xué)習(xí)完成了同聲傳譯。 2013年1月,百度公司成立了百度研究院,其中,深度學(xué)習(xí)研究所是該研究院旗下的第一個(gè)研究所。 …… 這些全球頂尖的計(jì)算機(jī)、互聯(lián)網(wǎng)公司都不約而同地對(duì)深度學(xué)習(xí)表現(xiàn)出了極大的興趣。那么究竟什么是深度學(xué)習(xí)呢? 事實(shí)上,深度學(xué)習(xí)仍然是一種神經(jīng)網(wǎng)絡(luò)模型,只不過(guò)這種神經(jīng)網(wǎng)絡(luò)具備了更多層次的隱含層節(jié)點(diǎn),同時(shí)配備了更先進(jìn)的學(xué)習(xí)技術(shù),如圖1-13所示。
圖 1-13 一個(gè)深度神經(jīng)網(wǎng)絡(luò)模型 然而,當(dāng)我們將超大規(guī)模的訓(xùn)練數(shù)據(jù)喂給深度學(xué)習(xí)模型的時(shí)候,這些具備深層次結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)仿佛搖身一變,成為了擁有感知和學(xué)習(xí)能力的大腦,表現(xiàn)出了遠(yuǎn)遠(yuǎn)好于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)和泛化的能力。 當(dāng)我們追溯歷史,深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)其實(shí)早在20世紀(jì)80年代就出現(xiàn)了。然而,當(dāng)時(shí)的深度網(wǎng)絡(luò)并沒有表現(xiàn)出任何超凡能力。這是因?yàn)?,?dāng)時(shí)的數(shù)據(jù)資源遠(yuǎn)沒有現(xiàn)在豐富,而深度學(xué)習(xí)網(wǎng)絡(luò)恰恰需要大量的數(shù)據(jù)以提高它的訓(xùn)練實(shí)例數(shù)量。 到了2000年,當(dāng)大多數(shù)科學(xué)家已經(jīng)對(duì)深度學(xué)習(xí)失去興趣的時(shí)候,又是那個(gè)杰夫·辛頓帶領(lǐng)他的學(xué)生繼續(xù)在這個(gè)冷門的領(lǐng)域里堅(jiān)持耕耘。起初他們的研究并不順利,但他們堅(jiān)信他們的算法必將給世界帶來(lái)驚奇。 驚奇終于出現(xiàn)了,到了2009年,辛頓小組獲得了意外的成功。他們的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)在語(yǔ)音識(shí)別應(yīng)用中取得了重大的突破,轉(zhuǎn)換精度已經(jīng)突破了世界紀(jì)錄,錯(cuò)誤率比以前減少了25%。可以說(shuō),辛頓小組的研究讓語(yǔ)音識(shí)別領(lǐng)域縮短了至少10年的時(shí)間。就這樣,他們的突破吸引了各大公司的注意。蘋果公司甚至把他們的研究成果應(yīng)用到了Siri語(yǔ)音識(shí)別系統(tǒng)上,使得iPhone 5全球熱賣。從此,深度學(xué)習(xí)的流行便一發(fā)不可收拾。 那么,為什么把網(wǎng)絡(luò)的深度提高,配合上大數(shù)據(jù)的訓(xùn)練就能使得網(wǎng)絡(luò)性能有如此大的改善呢?答案是,因?yàn)槿四X恰恰就是這樣一種多層次的深度神經(jīng)網(wǎng)絡(luò)。例如,已有的證據(jù)表明,人腦處理視覺信息就是經(jīng)過(guò)多層加工完成的。所以,深度學(xué)習(xí)實(shí)際上只不過(guò)是對(duì)大腦的一種模擬。 模式識(shí)別問題長(zhǎng)久以來(lái)是人工智能發(fā)展的一個(gè)主要瓶頸。然而,深度學(xué)習(xí)技術(shù)似乎已經(jīng)突破了這個(gè)瓶頸。有人甚至認(rèn)為,深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)已經(jīng)可以達(dá)到2歲小孩的識(shí)別能力。有理由相信,深度學(xué)習(xí)會(huì)將人工智能引入全新的發(fā)展局面。本書第6章將詳細(xì)介紹深度學(xué)習(xí)這一全新技術(shù),第14章將介紹集智俱樂部下的一個(gè)研究小組對(duì)深度學(xué)習(xí)技術(shù)的應(yīng)用——彩云天氣,用人工智能提供精準(zhǔn)的短時(shí)間天氣預(yù)報(bào)。 模擬大腦我們已經(jīng)看到,深度學(xué)習(xí)模型成功的秘訣之一就在于它模仿了人類大腦的深層體系結(jié)構(gòu)。那么,我們?yōu)槭裁床恢苯幽M人類的大腦呢?事實(shí)上,科學(xué)家們已經(jīng)行動(dòng)起來(lái)了。 例如,德國(guó)海德爾堡大學(xué)的FACETS(Fast Analog Computing with Emergent Transient States)計(jì)劃就是一個(gè)利用硬件來(lái)模擬大腦部分功能的項(xiàng)目。他們采用數(shù)以千計(jì)的芯片,創(chuàng)造出一個(gè)包含10億神經(jīng)元和1013突觸的回路的人工腦(其復(fù)雜程度相當(dāng)于人類大腦的十分之一)。與此對(duì)應(yīng),由瑞士洛桑理工學(xué)院和IBM公司聯(lián)合發(fā)起的藍(lán)色大腦計(jì)劃則是通過(guò)軟件來(lái)模擬人腦的實(shí)踐。他們采用逆向工程方法,計(jì)劃2015年開發(fā)出一個(gè)虛擬的大腦。 然而,這類研究計(jì)劃也有很大的局限性。其中最大的問題就在于:迄今為止,我們對(duì)大腦的結(jié)構(gòu)以及動(dòng)力學(xué)的認(rèn)識(shí)還相當(dāng)初級(jí),尤其是神經(jīng)元活動(dòng)與生物體行為之間的關(guān)系還遠(yuǎn)遠(yuǎn)沒有建立。例如,盡管科學(xué)家早在30年前就已經(jīng)弄清楚了秀麗隱桿線蟲(Caenorhabditis elegans)302個(gè)神經(jīng)元之間的連接方式,但到現(xiàn)在仍然不清楚這種低等生物的生存行為(例如進(jìn)食和交配)是如何產(chǎn)生的。盡管科學(xué)家已經(jīng)做過(guò)諸多嘗試,比如連接組學(xué)(Connectomics),也就是全面監(jiān)測(cè)神經(jīng)元之間的聯(lián)系(即突觸)的學(xué)問,但是,正如線蟲研究一樣,這幅圖譜僅僅是個(gè)開始,它還不足以解釋不斷變化的電信號(hào)是如何產(chǎn)生特定認(rèn)知過(guò)程的。 于是,為了進(jìn)一步深入了解大腦的運(yùn)行機(jī)制,一些“大科學(xué)”項(xiàng)目先后啟動(dòng)。2013年,美國(guó)奧巴馬政府宣布了“腦計(jì)劃”(Brain Research through Advancing Innovative Neurotechnologies,簡(jiǎn)稱BRAIN)的啟動(dòng)。該計(jì)劃在2014年的啟動(dòng)資金為1億多美元,致力于開發(fā)能記錄大群神經(jīng)元甚至是整片腦區(qū)電活動(dòng)的新技術(shù)。 無(wú)獨(dú)有偶,歐盟也發(fā)起了“人類大腦計(jì)劃”(The Human Brain Project),這一計(jì)劃為期10年,將耗資16億美元,致力于構(gòu)建能真正模擬人腦的超級(jí)計(jì)算機(jī)。除此之外,中國(guó)、日本、以色列也都有雄心勃勃的腦科學(xué)研究計(jì)劃出爐。這似乎讓人們想到了第二次世界大戰(zhàn)后的情景,各國(guó)爭(zhēng)相發(fā)展“大科學(xué)項(xiàng)目”:核武器、太空探索、計(jì)算機(jī)等。腦科學(xué)的時(shí)代已經(jīng)來(lái)臨。關(guān)于人腦與電腦的比較,請(qǐng)參見本書第7章。 “人工”人工智能
Luis von Ahn 2007年,一位谷歌的實(shí)習(xí)生路易斯·馮·安(Luis von Ahn)開發(fā)了一款有趣的程序“ReCapture”,卻無(wú)意間開創(chuàng)了一個(gè)新的人工智能研究方向:人類計(jì)算。 ReCapture的初衷很簡(jiǎn)單,它希望利用人類高超的模式識(shí)別能力,自動(dòng)幫助谷歌公司完成大量掃描圖書的文字識(shí)別任務(wù)。但是,如果要雇用人力來(lái)完成這個(gè)任務(wù)則需要花費(fèi)一大筆開銷。于是,馮·安想到,每天都有大量的用戶在輸入驗(yàn)證碼來(lái)向機(jī)器證明自己是人而不是機(jī)器,而輸入驗(yàn)證碼事實(shí)上就是在完成文本識(shí)別問題。于是,一方面是有大量的掃描的圖書中難以識(shí)別的文字需要人來(lái)識(shí)別;另一方面是由計(jì)算機(jī)生成一些扭曲的圖片讓大量的用戶做識(shí)別以表明自己的身份。那么,為什么不把兩個(gè)方面結(jié)合在一起呢?這就是ReCapture的創(chuàng)意(如圖1-14所示),馮·安聰明地讓用戶在輸入識(shí)別碼的時(shí)候悄悄幫助谷歌完成了文字識(shí)別工作!
圖 1-14 人類計(jì)算系統(tǒng)ReCapture 這一成功的應(yīng)用實(shí)際上是借助人力完成了傳統(tǒng)的人工智能問題,馮·安把它叫作人類計(jì)算(Human Computation),我們則把它形象地稱為“人工”人工智能。除了ReCapture以外,馮·安還開發(fā)了很多類似的程序或系統(tǒng),例如ESP游戲是讓用戶通過(guò)競(jìng)爭(zhēng)的方式為圖片貼標(biāo)簽,從而完成“人工”人工分類圖片;Duolingo系統(tǒng)則是讓用戶在學(xué)習(xí)外語(yǔ)的同時(shí),順便翻譯一下互聯(lián)網(wǎng),這是“人工”機(jī)器翻譯。 也許,這樣巧妙的人機(jī)結(jié)合才是人工智能發(fā)展的新方向之一。因?yàn)橐粋€(gè)完全脫離人類的人工智能程序?qū)τ谖覀儧]有任何獨(dú)立存在的意義,所以人工智能必然會(huì)面臨人機(jī)交互的問題。而隨著互聯(lián)網(wǎng)的興起,人和計(jì)算機(jī)交互的方式會(huì)更加便捷而多樣化。因此,這為傳統(tǒng)的人工智能問題提供了全新的解決途徑。 然而,讀者也許會(huì)質(zhì)疑,這種摻合了人類智能的系統(tǒng)還能叫作純粹的人工智能嗎?這種質(zhì)疑事實(shí)上有一個(gè)隱含的前提,就是人工智能是一個(gè)獨(dú)立運(yùn)作的系統(tǒng),它與人類環(huán)境應(yīng)相互隔離。但當(dāng)我們考慮人類智能的時(shí)候就會(huì)發(fā)現(xiàn),任何智能系統(tǒng)都不能與環(huán)境絕對(duì)隔離,它只有在開放的環(huán)境下才能表現(xiàn)出智能。同樣的道理,人工智能也必須向人類開放,于是引入人的作用也變成了一種很自然的事情。關(guān)于這個(gè)主題,我們將在本書第8章和第9章中進(jìn)一步討論。 結(jié)語(yǔ)本章介紹了人工智能近60年所走過(guò)的曲折道路。也許,讀者所期待的內(nèi)容,諸如奇點(diǎn)臨近、超級(jí)智能機(jī)器人、人與機(jī)器的共生演化等激動(dòng)人心的內(nèi)容并沒有出現(xiàn),但是,我能保證的,是一段真實(shí)的歷史,并力圖做到準(zhǔn)確無(wú)誤。 盡管人工智能這條道路蜿蜒曲折,荊棘密布,但至少它在發(fā)展并不斷壯大。最重要的是,人們對(duì)于人工智能的夢(mèng)想永遠(yuǎn)沒有破滅過(guò)。也許人工智能之夢(mèng)將無(wú)法在你我的有生之年實(shí)現(xiàn),也許人工智能之夢(mèng)始終無(wú)法逾越哥德爾定理那個(gè)碩大無(wú)朋的“如來(lái)佛手掌”,但是,人工智能之夢(mèng)將永遠(yuǎn)驅(qū)動(dòng)著我們不斷前行,挑戰(zhàn)極限。 推薦閱讀關(guān)于希爾伯特、圖靈、哥德爾的故事和相關(guān)研究可以閱讀《哥德爾、艾舍爾、巴赫:集異璧之大成》一書。關(guān)于馮·諾依曼,可以閱讀他的傳記:《天才的拓荒者:馮·諾依曼傳》。關(guān)于維納,可以參考他的著作《控制論》。若要全面了解人工智能,給大家推薦兩本書:Artificial Intelligence: A Modern Approach 和 Artificial Intelligence: Structures and Strategies for Complex Problem Solving 。了解機(jī)器學(xué)習(xí)以及人工神經(jīng)網(wǎng)絡(luò)可以參考 Pattern Recognition 和 Neural Networks and Learning Machines 。關(guān)于行為學(xué)派和人工生命,可以參考《數(shù)字創(chuàng)世紀(jì):人工生命的新科學(xué)》以及人工生命的論文集。若要深入了解貝葉斯網(wǎng)絡(luò),可以參考 Causality: Models, Reasoning, and Inference 。深入了解胡特的通用人工智能理論可以閱讀 Universal Artificial Intelligence: Sequential Decisions Based on Algorithmic Probability 。關(guān)于深度學(xué)習(xí)方面的知識(shí)可參考網(wǎng)站:http:///reading-list/,其中有不少綜述性的文章。人類計(jì)算方面可以參考馮·安的網(wǎng)站:http://www.cs./~biglou/。 參考文獻(xiàn)[1] 候世達(dá),嚴(yán)勇,劉皓. 哥德爾、艾舍爾、巴赫:集異璧之大成. 莫大偉 譯. 北京:商務(wù)印書館,1997. [2] 諾曼·麥克雷. 天才的拓荒者:馮·諾伊曼傳. 范秀華,朱朝輝 譯. 上海:上??萍冀逃霭嫔?,2008. [3] 維納. 控制論:或關(guān)于在動(dòng)物和機(jī)器中控制和通信的科學(xué). 郝季仁 譯. 北京:北京大學(xué)出版社,2007. [4] Luger G F. Artificial intelligence: structures and strategies for complex problem solving (6th Edition). Addison-Wesley, 2008. [5] Russel S K, Norvig P. Artificial Intelligence: A Modern Approach (2nd Edition). Prentice Hall, 2002. [6] Theodoridis S, Koutroumbas K. Pattern Recognition (2nd edition). Academic Press, 2008. [7] Haykin S O. Neural Networks and Learning Machines (3rd Edition). Prentice Hall, 2000. [8] 李建會(huì),張江. 數(shù)字創(chuàng)世紀(jì):人工生命的新科學(xué). 北京:科學(xué)出版社,2006. [9] Pearl J. Causality: models, reasoning, and inference. Cambridge University Press, 2000. [10] Hutter M. Universal Artificial Intelligence:Sequential Decisions based on Algorithmic Probability. Springer, 2005. 作者簡(jiǎn)介 張江,集智俱樂部主要發(fā)起人和核心成員,2014~2015年度集智輪值主席。現(xiàn)在北京師范大學(xué)系統(tǒng)科學(xué)學(xué)院任教,副教授。主要從事有關(guān)計(jì)算機(jī)模擬和人工智能的教學(xué)工作以及復(fù)雜系統(tǒng)的相關(guān)研究工作。研究興趣包括異速生長(zhǎng)律、開放流網(wǎng)絡(luò)、注意力流與互聯(lián)網(wǎng)等。代表作品有:論文Allometry and dissipation of ecological flow networks(PLoS ONE 2013, 8(9): e72525.)、論文The Metabolism and Growth of Web Forums (PLoS ONE 20149(8): e102646),著有《數(shù)字創(chuàng)世紀(jì):人工生命的新科學(xué)》(科學(xué)出版社,2006)一書。 |
|
|