|
人工智能的主流算法Deep Learning深度學(xué)習(xí)的歷史,堪稱Deep History, 也是深度學(xué)習(xí)三劍客Geoff Hinton, Yann LeCun 和Yoshua Bengio共同走過的30年艱難而輝煌的不悔人生。他們?nèi)绾螐漠斈甑牡叵滦F體成為今天引領(lǐng)人工智能的風云人物,來看看其中的精彩故事。 Geoff Hinton,谷歌大腦研究小組的負責人,出生在英國,1977年在愛丁堡大學(xué)獲得博士學(xué)位,開始對模擬神經(jīng)網(wǎng)絡(luò)著迷。之后在加拿大多倫多大學(xué)任教,2013年他的公司DNNresearch被Google收購。他被稱為深度學(xué)習(xí)教父。 Yann LeCun, Facebook人工智能研究小組FAIR的主任,出生在巴黎,在 Université Pierre et Marie Curie獲得博士學(xué)位。曾在AT&T Bell Labs工作多年,2003年起在紐約大學(xué)NYU任教,2013年獲小扎邀請加盟Facebook。 Yoshua Bengio – Université de Montréal大學(xué)教授。出生在法國,在McGill University獲得博士學(xué)位,曾在MIT跟隨Michael Jordan教授做博士后研究,后任職 AT&T Bell Labs,1993年起在Université de Montréal任教。 Geoff Hinton, Godfather of Deep Learning 這個故事要追溯到1956年,美國認知心理學(xué)家弗蘭克·羅森布拉特(Frank Rosenblatt)基于神經(jīng)元的理論發(fā)明了一種模擬神經(jīng)元的方法。紐約時報稱之為與'E-brain teaches itself.' 這個被Rosenblatt稱為感知器Perceptron的發(fā)明,可以學(xué)習(xí)如何將簡單的圖像分類為三角形和正方形。當時是在巨大的機器上實施模擬,纏繞著厚重的電線,但這為神經(jīng)網(wǎng)絡(luò)創(chuàng)立了理論和實驗基礎(chǔ)。 Rosenblatts發(fā)明的電腦有八個模擬神經(jīng)元,由電機和撥號盤連接到400個光檢測器。每個神經(jīng)元都接收到來自光檢測器的信號的一部分,將它們組合起來,并且根據(jù)它們添加到哪里,輸出1或0。這些數(shù)字組成對感知器所看到的事物的描述。當然,最初的結(jié)果完全無效。之后Rosenblatt使用一種稱為監(jiān)督學(xué)習(xí)的方法來訓(xùn)練感知器,以正確區(qū)分不同形狀。他向感知器顯示一個圖像以及正確的答案,然后,機器將調(diào)整每個神經(jīng)元對其輸入信號的關(guān)注度,將這些“權(quán)重”轉(zhuǎn)移到將產(chǎn)生正確答案的設(shè)置。 在試過多次之后,這些調(diào)整使計算機具有足夠的智能,可正確地對之前從未見過的圖像進行分類。今天的深度學(xué)習(xí)網(wǎng)絡(luò)使用復(fù)雜的算法,并擁有數(shù)百萬個模擬神經(jīng)元,它們之間有數(shù)十億個連接,也是以同樣的方式訓(xùn)練的。 Rosenblatt預(yù)測,感知器很快就能夠?qū)W會向人打招呼。他的想法成為人工智能新生領(lǐng)域的基石。當時研究工作的重點是使感知器具有更復(fù)雜的網(wǎng)絡(luò),排列成多個學(xué)習(xí)層的結(jié)構(gòu),在圖層中連續(xù)傳遞圖像或其他數(shù)據(jù),使感知器能夠解決更復(fù)雜的問題。 不幸的是,Rosenblatt的學(xué)習(xí)算法當時對于多層結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)不起作用。在1969年,曾與他一起上過高中的人工智能先驅(qū),MIT的權(quán)威人士Marvin Minsky,和知名專家Seymour Papert一起,寫了一本批評感知器學(xué)派的書Perceptrons,扼殺了當時對神經(jīng)網(wǎng)絡(luò)的研究興趣。 Minsky表示,多層次神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)并不會使感知器強大到有實用價值。人工智能學(xué)者們也因此放棄了學(xué)習(xí)式軟件的想法。他們轉(zhuǎn)而使用邏輯來產(chǎn)生智能 :比如下棋的能力。神經(jīng)網(wǎng)絡(luò)則被推到了計算機科學(xué)的邊緣。 2012年, 基于深度學(xué)習(xí)CNN網(wǎng)絡(luò)的AlexNet在ILSVRC競賽的ImageNet上大放異彩。 深深影響了做圖像目標檢測UC Berkeley的Jitendra Malik, 他鼓勵博士后Ross Girshick采用CNN技術(shù)到圖像目標檢測上。Ross Girshick剛從他的博士導(dǎo)師Pedro Felipe Felzenszwalb那里畢業(yè), 讀博期間導(dǎo)師和他一起發(fā)明了DPM算法, 改進了Navneet Dalal和Bill Triggs 提出的HoG特征方法,成為當時的經(jīng)典。 Ross Girshick不辱使命, 在2014年利用CNN成功取代了HOG、DPM等特征提取, 結(jié)合Selective Search做區(qū)域推薦, 再結(jié)合SVM做分類算法, 成功推出R-CNN,轟動世界。 開啟了深度學(xué)習(xí)上的圖像目標檢測。 隨后,何凱明也基于SPM推出了SPPNet。同時,RCNN在成功結(jié)合RoI技術(shù)、RPN技術(shù)后迅速改進推出了Fast RCNN 和Faster RCNN。 為以后的YOLO、 SSD、AttratioNet、G-CNN、Mask R-CNN等網(wǎng)絡(luò)打下扎實的深度學(xué)習(xí)基礎(chǔ) |
|
|