深度學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)是現(xiàn)代人工智能的 核心技術(shù) 深度學(xué)習(xí)根源于傳統(tǒng)的“神經(jīng)網(wǎng)絡(luò)”,“神經(jīng)網(wǎng)絡(luò)”可以追溯到20世紀(jì)五十年代后期。當(dāng)時(shí),弗蘭克·羅森布拉特試圖建立一種類似機(jī)械大腦的感知器,可以“感知,識(shí)別,記憶,像人的思維做出響應(yīng)的機(jī)器”。在一定范圍內(nèi)這個(gè)系統(tǒng)能夠識(shí)別一些基本的形狀,如三角形和正方形。人們對(duì)它的潛力寄予厚望,甚至“New Yorker”宣稱這種“這個(gè)卓越的機(jī)器能夠思考?!?br>

但是測(cè)驗(yàn)最終以失敗告終,一本寫于1969年由馬文·明斯基和他的合作者西摩帕爾特一本書指出,羅森布拉特設(shè)計(jì)的原系統(tǒng)是非常有限制的,從字面上盲目進(jìn)行一些簡(jiǎn)單的邏輯功能如“異或”(比如說(shuō)你可以擁有蛋糕或餡餅,但不能同時(shí)兼有)。眾所周知,“神經(jīng)網(wǎng)絡(luò)”的魅力很快消失了。 然而,在上世紀(jì)八十年代中期,當(dāng)卡內(nèi)基-梅隆大學(xué)的年輕教授杰夫·欣頓幫助構(gòu)建更復(fù)雜的虛擬神經(jīng)元網(wǎng)絡(luò),可以規(guī)避一些明斯基指出的難點(diǎn),羅森布拉特的又一個(gè)想法再度出現(xiàn)。韓丁引入一個(gè)“隱藏層”的概念,“隱藏層”神經(jīng)元允許新一代網(wǎng)絡(luò)有更復(fù)雜的學(xué)習(xí)功能(原始感知器無(wú)法處理的類似的異或功能)。然而新的模型也有嚴(yán)重的問(wèn)題。訓(xùn)練時(shí)間長(zhǎng),學(xué)習(xí)緩慢,效率低下,就像史蒂文·平克和我指出的,不能像孩子一樣掌握一些基本的東西,比如學(xué)習(xí)規(guī)則動(dòng)詞的過(guò)去式。由19世紀(jì)九十年代晚期,神經(jīng)網(wǎng)絡(luò)又開始失寵。
然而,欣頓堅(jiān)持不懈,在2006年做出了重大改進(jìn),提出深度學(xué)習(xí),這個(gè)概念延續(xù)了我的同事Yann LeCu早期提出的重要概念,這個(gè)技術(shù)仍然谷歌,微軟,和其他地方有所應(yīng)用。實(shí)際上,深度學(xué)習(xí)(Deep Learning)就是現(xiàn)代人工智能的核心技術(shù)。谷歌、微軟與百度是現(xiàn)代人工智能領(lǐng)域的“三巨頭”。它們擁有海量數(shù)據(jù)以及DNN技術(shù),比如:2012年11月,微軟(中國(guó))在天津的一次會(huì)議上公開演示了一個(gè)全自動(dòng)的“同聲傳譯”系統(tǒng),講演者用英文演講,后臺(tái)的計(jì)算機(jī)一氣呵成,完成語(yǔ)音識(shí)別、英中機(jī)器翻譯,以及中文語(yǔ)音合成,效果非常流暢。微軟使用的就是深度神經(jīng)網(wǎng)絡(luò)技術(shù)。 機(jī)器學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò) 在深入深度學(xué)習(xí)的實(shí)現(xiàn)過(guò)程之前,先介紹機(jī)器學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)的概念。 機(jī)器學(xué)習(xí)的一個(gè)非常通常的任務(wù)是這樣的:給出了一個(gè)目標(biāo)的信息,從而能夠知道它屬于哪個(gè)種類。在深度學(xué)習(xí)的過(guò)程中,程序想要決定在目前游戲狀態(tài)下如何進(jìn)行下一步動(dòng)作。機(jī)器學(xué)習(xí)算法從例子中進(jìn)行學(xué)習(xí):給出了許多的目標(biāo)例子和它們的種類,學(xué)習(xí)算法從中找出了那些能夠鑒定某個(gè)種類的目標(biāo)特征。學(xué)習(xí)算法會(huì)產(chǎn)生一個(gè)模型,能夠在訓(xùn)練集中最小化錯(cuò)誤分類率。這個(gè)模型之后會(huì)被用來(lái)預(yù)測(cè)那個(gè)未知目標(biāo)的種類。 人工神經(jīng)網(wǎng)絡(luò)ANN(Artificial Neural Networks)是機(jī)器學(xué)習(xí)的一個(gè)算法。它是由人類的大腦結(jié)構(gòu)產(chǎn)生的靈感。這個(gè)網(wǎng)絡(luò)由許多節(jié)點(diǎn)組成,如同大腦由神經(jīng)元組成,并且互相之間聯(lián)系在一起,如同神經(jīng)元之間通過(guò)神經(jīng)突觸和神經(jīng)樹聯(lián)系在一起。對(duì)于每個(gè)神經(jīng)元,都會(huì)對(duì)其應(yīng)該傳遞的信號(hào)的情況做特殊規(guī)定。通過(guò)改變這些連接的強(qiáng)弱,可以使得這些網(wǎng)絡(luò)計(jì)算更加快速。現(xiàn)在神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)通常由如下部分組成:

神經(jīng)的輸入層(獲得目標(biāo)的描述) 隱藏層(主要部分,在這些層中學(xué)習(xí)) 輸出層(對(duì)于每個(gè)種類都一個(gè)神經(jīng)節(jié)點(diǎn),分?jǐn)?shù)最高的一個(gè)節(jié)點(diǎn)就是預(yù)測(cè)的種類) 在學(xué)習(xí)過(guò)程結(jié)束之后,新的物體就能夠送入這個(gè)網(wǎng)絡(luò),并且能夠在輸出層看到每個(gè)種類的分?jǐn)?shù)。
深度學(xué)習(xí)
在這個(gè)系統(tǒng)中,一個(gè)神經(jīng)網(wǎng)絡(luò)被用來(lái)期望在當(dāng)前游戲狀態(tài)下每種可能的動(dòng)作所得到的反饋。下圖給出了文章中所提到的神經(jīng)網(wǎng)絡(luò)。這個(gè)網(wǎng)絡(luò)能夠回答一個(gè)問(wèn)題,比如“如果這么做會(huì)變得怎么樣?”。網(wǎng)絡(luò)的輸入部分由最新的四幅游戲屏幕圖像組成,這樣這個(gè)網(wǎng)絡(luò)不僅僅能夠看到最后的部分,而且能夠看到一些這個(gè)游戲是如何變化的。輸入被經(jīng)過(guò)三個(gè)后繼的隱藏層,最終到輸出層。 輸出層對(duì)每個(gè)可能的動(dòng)作都有一個(gè)節(jié)點(diǎn),并且這些節(jié)點(diǎn)包含了所有動(dòng)作可能得到的反饋。在其中,會(huì)得到最高期望分?jǐn)?shù)的反饋會(huì)被用來(lái)執(zhí)行下一步動(dòng)作。 學(xué)習(xí)過(guò)程
 系統(tǒng)通過(guò)學(xué)習(xí)過(guò)程來(lái)計(jì)算最高期望分?jǐn)?shù)。確切地說(shuō),在定義了網(wǎng)絡(luò)的結(jié)構(gòu)之后,剩下唯一會(huì)變化的就只有一件事:連接之間的強(qiáng)弱程度。學(xué)習(xí)過(guò)程就是調(diào)整這些方式地權(quán)重,從而使得通過(guò)這個(gè)網(wǎng)絡(luò)的訓(xùn)練樣例獲得好的反饋。 文章將這個(gè)問(wèn)題當(dāng)作一個(gè)優(yōu)化問(wèn)題,目標(biāo)是獲取最好的反饋。可以通過(guò)將梯度下降與激勵(lì)學(xué)習(xí)方法結(jié)合起來(lái)解決。這個(gè)網(wǎng)絡(luò)不僅僅需要最大化當(dāng)前的反饋,還需要考慮到將來(lái)的動(dòng)作。這一點(diǎn)可以通過(guò)預(yù)測(cè)估計(jì)下一步的屏幕并且分析解決。用另一種方式講,可以使用(當(dāng)前反饋減去預(yù)測(cè)反饋)作為梯度下降的誤差,同時(shí)會(huì)考慮下一幅圖像的預(yù)測(cè)反饋。
|