|
2012年9月,來(lái)自多倫多大學(xué)的兩位AI研究人員Alex Krizhevsky和Ilya Sutskever在ImageNet圖像識(shí)別比賽上創(chuàng)造了歷史。Krizhevsky和Sutskever,以及他們的導(dǎo)師(人工智能先驅(qū)Geoffrey Hinton),他們提交了一種基于深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的算法,這是一種人工智能技術(shù),由于過(guò)去看來(lái)的有很多缺點(diǎn),人工智能社區(qū)對(duì)此持懷疑態(tài)度。 由U of T研究人員開(kāi)發(fā)的深度學(xué)習(xí)算法AlexNet能夠以15.3%的錯(cuò)誤率贏得比賽,比第二名高出10.8%。從某些方面來(lái)說(shuō),這一事件引發(fā)了深度學(xué)習(xí)革命,使許多學(xué)術(shù)和商業(yè)組織對(duì)該領(lǐng)域產(chǎn)生了興趣。 如今,深度學(xué)習(xí)已經(jīng)成為我們每天使用的許多應(yīng)用程序的關(guān)鍵,例如內(nèi)容推薦系統(tǒng),翻譯應(yīng)用程序,數(shù)字助理,聊天機(jī)器人和面部識(shí)別系統(tǒng)。深度學(xué)習(xí)也有助于在醫(yī)療保健,教育和自動(dòng)駕駛汽車(chē)等許多特殊領(lǐng)域取得進(jìn)步。 深度學(xué)習(xí)的名聲也導(dǎo)致了對(duì)它是什么以及它能做什么的混淆和模糊。以下是深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的簡(jiǎn)要分析它們的優(yōu)勢(shì)和局限。 機(jī)器學(xué)習(xí)與經(jīng)典軟件的區(qū)別深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)子集,AI的其中一個(gè)領(lǐng)域,它是改變了開(kāi)發(fā)軟件的方式。開(kāi)發(fā)軟件的經(jīng)典方式是程序員手動(dòng)編碼規(guī)定應(yīng)用程序的行為,這些經(jīng)典軟件現(xiàn)在也被成為“老式AI”。 經(jīng)典軟件在規(guī)則明確的領(lǐng)域中運(yùn)行良好,并且可以轉(zhuǎn)換為程序流命令,例如if ... else命令。但是,基于規(guī)則的系統(tǒng)在諸如計(jì)算機(jī)視覺(jué)等領(lǐng)域中則不太適用,因?yàn)橛?jì)算機(jī)視覺(jué)領(lǐng)域的軟件必須理解從不同角度和不同光照條件下拍攝的照片和視頻的內(nèi)容。 機(jī)器學(xué)習(xí)算法使用不同的數(shù)學(xué)和統(tǒng)計(jì)模型來(lái)分析大量數(shù)據(jù),并找到有用的模式和相關(guān)性。然后,機(jī)器學(xué)習(xí)使用獲得的知識(shí)進(jìn)行預(yù)測(cè)或定義應(yīng)用程序的行為。 機(jī)器學(xué)習(xí)已經(jīng)使用了幾十年,但其功能在某些領(lǐng)域受到限制,仍然涉及大量勞動(dòng)密集型手工設(shè)計(jì)。例如,當(dāng)在計(jì)算機(jī)視覺(jué)中使用時(shí),開(kāi)發(fā)人員必須進(jìn)行大量“特征工程”,來(lái)使得算法能夠從圖像中提取不同的特征,然后再應(yīng)用統(tǒng)計(jì)模型(例如邏輯回歸或支持向量機(jī)SVM)。這個(gè)過(guò)程非常耗時(shí),需要多名AI工程師和領(lǐng)域?qū)<覅⑴c。 經(jīng)典的機(jī)器學(xué)習(xí)方法涉及許多復(fù)雜的步驟,需要數(shù)十名領(lǐng)域?qū)<遥瑪?shù)學(xué)家和程序員的合作 神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)算法的原理深度學(xué)習(xí)與其他機(jī)器學(xué)習(xí)和人工智能技術(shù)的不同之處在于它涉及的手工設(shè)計(jì)非常少。深度學(xué)習(xí)使用神經(jīng)網(wǎng)絡(luò),可以解決大多數(shù)機(jī)器學(xué)習(xí)問(wèn)題,而無(wú)需通過(guò)您之前的特定領(lǐng)域的特征工程。 當(dāng)您為神經(jīng)網(wǎng)絡(luò)提供一組示例(例如人物圖像)時(shí),它可以找到這些圖像之間的共同特征。當(dāng)您將多個(gè)神經(jīng)網(wǎng)絡(luò)堆疊在一起時(shí),它可以從找到簡(jiǎn)單的特征(如邊緣和輪廓)到更復(fù)雜的特征(如眼睛,鼻子,耳朵,面部和身體)。 分層神經(jīng)網(wǎng)絡(luò)可以以分層方式從圖像中提取不同的特征(來(lái)源:www.deeplearningbook.o 在創(chuàng)建深度學(xué)習(xí)算法時(shí),開(kāi)發(fā)人員和工程師會(huì)配置層數(shù)和將每層輸出連接到下一層輸入的函數(shù)類型。接下來(lái),他們通過(guò)提供大量帶注釋的示例來(lái)訓(xùn)練模型。例如,您給深度學(xué)習(xí)算法數(shù)千個(gè)圖像,其中包含與每個(gè)圖像的內(nèi)容相對(duì)應(yīng)的標(biāo)簽(即內(nèi)容標(biāo)注)。 深度學(xué)習(xí)算法將通過(guò)其分層神經(jīng)網(wǎng)絡(luò)運(yùn)行這些示例數(shù)據(jù),并調(diào)整神經(jīng)網(wǎng)絡(luò)的每個(gè)層中的變量(或神經(jīng)元或激活)的權(quán)重以便能夠檢測(cè)到定義具有相似標(biāo)簽的圖像的常見(jiàn)模式。有許多層也是其被稱為“深度”學(xué)習(xí)的原因。通過(guò)足夠的訓(xùn)練,神經(jīng)網(wǎng)絡(luò)可以自己進(jìn)行微調(diào),并且能夠根據(jù)從示例中獲得的知識(shí)對(duì)未標(biāo)記的圖像進(jìn)行分類判斷。 尋找高質(zhì)量的訓(xùn)練數(shù)據(jù)是深度學(xué)習(xí)算法的主要挑戰(zhàn)之一。幸運(yùn)的是,深度學(xué)習(xí)工程師可以選擇許多公開(kāi)可用的數(shù)據(jù)集。其中一個(gè)例子是ImageNet數(shù)據(jù)庫(kù),它包含20萬(wàn)個(gè)標(biāo)注類別,超過(guò)1400萬(wàn)張圖片。ImageNet是培訓(xùn)和測(cè)試計(jì)算機(jī)視覺(jué)算法的事實(shí)標(biāo)準(zhǔn)之一。其他數(shù)據(jù)集包括CIFAR(另一種通用計(jì)算機(jī)視覺(jué)數(shù)據(jù)集)和MNIST(一種由數(shù)萬(wàn)個(gè)手寫(xiě)數(shù)字組成的專用數(shù)據(jù)庫(kù))。 有監(jiān)督,無(wú)監(jiān)督和強(qiáng)化學(xué)習(xí)上述過(guò)程稱為“監(jiān)督學(xué)習(xí)”,它是目前開(kāi)發(fā)深度學(xué)習(xí)算法的主要方式。它被稱為監(jiān)督,因?yàn)锳I模型被給予一整套問(wèn)題(例如圖像)及其解決方案(例如它們的相關(guān)標(biāo)簽或描述),并被指示在輸入和輸出之間找到正確的映射。監(jiān)督學(xué)習(xí)用于諸如計(jì)算機(jī)視覺(jué)和語(yǔ)音識(shí)別之類的領(lǐng)域。 無(wú)監(jiān)督學(xué)習(xí)是另一種深度學(xué)習(xí)模型,用于解決您擁有大量數(shù)據(jù)的問(wèn)題,但是您沒(méi)有相應(yīng)的輸出來(lái)映射它們。在這種情況下,深度學(xué)習(xí)算法必須仔細(xì)閱讀訓(xùn)練數(shù)據(jù)并找到有用的模式,否則這些模式需要大量的人力。 例如,深度學(xué)習(xí)算法可以獲得10年的銷售數(shù)據(jù),并為您提供有關(guān)如何調(diào)整商品價(jià)格以最大化銷售額的銷售預(yù)測(cè)或建議。這些被稱為預(yù)測(cè)性和規(guī)范性分析,在許多領(lǐng)域都很有用,例如天氣預(yù)報(bào)和內(nèi)容推薦。 強(qiáng)化學(xué)習(xí),另一種深度學(xué)習(xí)模式訓(xùn)練,被許多人視為“人工智能的圣杯”。在強(qiáng)化學(xué)習(xí)中,AI模型提供了問(wèn)題域的基本規(guī)則,并且可以在沒(méi)有人類監(jiān)督或數(shù)據(jù)的情況下自行發(fā)展其行為。 強(qiáng)化學(xué)習(xí)是開(kāi)發(fā)人工智能模型的主要方法之一,這些模型已經(jīng)掌握了著名的游戲,如國(guó)際象棋,圍棋,撲克,以及最近的星際爭(zhēng)霸II??茖W(xué)家們還利用強(qiáng)化學(xué)習(xí)來(lái)開(kāi)發(fā)機(jī)器人手,教他們自己處理物體,這是人工智能行業(yè)面臨的嚴(yán)峻挑戰(zhàn)之一。盡管強(qiáng)化學(xué)習(xí)是AI的一個(gè)非常令人興奮的領(lǐng)域,但它也具有非常明顯的限制,并且在計(jì)算資源方面要求很高。強(qiáng)化學(xué)習(xí)在實(shí)驗(yàn)室中表現(xiàn)非常有趣,但它在現(xiàn)實(shí)世界的應(yīng)用中表現(xiàn)還比較有限。 深度學(xué)習(xí)在現(xiàn)在成為可能的原因雖然深度學(xué)習(xí)在近十年早些時(shí)候開(kāi)始流行,但它并不新鮮。神經(jīng)網(wǎng)絡(luò)的概念可以追溯到20世紀(jì)50年代,當(dāng)時(shí)第一個(gè)神經(jīng)網(wǎng)絡(luò)Mark I Perceptron被開(kāi)發(fā)出來(lái)。 神經(jīng)網(wǎng)絡(luò)也在20世紀(jì)80年代和90年代被討論過(guò),但由于它們的性能有限以及它們的數(shù)據(jù)和計(jì)算能力的需求而最終放棄。當(dāng)時(shí),創(chuàng)建深度學(xué)習(xí)模型所需的數(shù)據(jù)和計(jì)算資源不夠用,訓(xùn)練深度學(xué)習(xí)模型需要大量時(shí),使用其他方法在資源需求和結(jié)果方面更為現(xiàn)實(shí)。 Mark I Perceptron是1957年神經(jīng)網(wǎng)絡(luò)的第一個(gè)實(shí)現(xiàn)(來(lái)源:維基百科) 現(xiàn)在,數(shù)據(jù)和計(jì)算都已廣泛可用且價(jià)格低廉。有大量的GPU和專用硬件可以幫助以非??斓乃俣扔?xùn)練深度學(xué)習(xí)模型。PaperSpace和Crestle等云計(jì)算服務(wù)專門(mén)用于深度學(xué)習(xí)。 深度學(xué)習(xí)的應(yīng)用深度學(xué)習(xí)目前已進(jìn)入許多不同領(lǐng)域。以下是深度學(xué)習(xí)的一些熱門(mén)應(yīng)用:
深度學(xué)習(xí)的局限由引腳和線創(chuàng)建的神經(jīng)網(wǎng)絡(luò) 深度學(xué)習(xí)解決了許多以前被認(rèn)為是計(jì)算機(jī)禁區(qū)的問(wèn)題,但深度學(xué)習(xí)的成就也導(dǎo)致了許多錯(cuò)誤的解釋和對(duì)其能力的過(guò)高期望。雖然深度學(xué)習(xí)是一項(xiàng)非常令人興奮的技術(shù),但它也有明顯的限制。 優(yōu)步人工智能的前負(fù)責(zé)人、紐約大學(xué)教授加里·馬庫(kù)斯,在他的深度論文《深度學(xué)習(xí):批判性評(píng)價(jià) 》中,詳細(xì)介紹了深度學(xué)習(xí)的局限性和挑戰(zhàn),總結(jié)為以下幾點(diǎn)。 :
深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)通常與人類智能進(jìn)行比較。但是,雖然深度學(xué)習(xí)可以執(zhí)行一些與人類相同或更好的復(fù)雜任務(wù),但它的工作方式與人類思維有著根本不同。它在常識(shí)和抽象決策中特別受到限制。 深度學(xué)習(xí)的威脅深度學(xué)習(xí)是一個(gè)非常強(qiáng)大的工具。但與其他所有有效技術(shù)一樣,它也有自己的缺陷。 深度學(xué)習(xí)模型容易出現(xiàn)算法偏差,因?yàn)樗鼜挠?xùn)練數(shù)據(jù)中得出其行為。這意味著嵌入在訓(xùn)練樣例中的任何隱藏或明顯的偏差也將進(jìn)入深度學(xué)習(xí)算法所做的決策。 在過(guò)去幾年中,有幾個(gè)案例發(fā)現(xiàn)深度學(xué)習(xí)模式歧視特定人群。例如,去年10月,亞馬遜不得不關(guān)閉AI招聘工具,因?yàn)樗鼘?duì)女性申請(qǐng)人有偏見(jiàn)。 在錯(cuò)誤的人手中,深度學(xué)習(xí)可以服務(wù)于非常邪惡的目的。隨著深度學(xué)習(xí)在創(chuàng)建自然的圖像和聲音方面變得越來(lái)越有效,人們擔(dān)心該技術(shù)可能會(huì)被用于創(chuàng)建一種新的基于AI的偽造犯罪。去年,關(guān)于FakeApp的爭(zhēng)議很多,F(xiàn)akeApp是一個(gè)使用深度學(xué)習(xí)來(lái)交換視頻中人物面孔的視頻應(yīng)用程序。有人用該應(yīng)用程序?qū)⒚撕驼偷拿婵字糜谏橐曨l中。 深度學(xué)習(xí)的另一個(gè)威脅是對(duì)抗性攻擊。由于它們的創(chuàng)建方式,深度學(xué)習(xí)算法可以以意想不到的方式運(yùn)行 - 或者至少以對(duì)我們?nèi)祟悂?lái)說(shuō)似乎不合邏輯的方式運(yùn)行。鑒于神經(jīng)網(wǎng)絡(luò)的不透明性,很難找到它們包含的所有邏輯錯(cuò)誤。 專家和研究人員一再表明,這些失敗可能會(huì)變成對(duì)抗性攻擊--惡意行為者強(qiáng)迫深層學(xué)習(xí)算法表現(xiàn)出危險(xiǎn)的行為。例如,研究人員能夠通過(guò)在停車(chē)標(biāo)志上粘貼幾個(gè)彩色貼紙來(lái)欺騙自動(dòng)駕駛汽車(chē)的視覺(jué)算法。對(duì)于人類來(lái)說(shuō),它仍然看起來(lái)像一個(gè)停止標(biāo)志,但無(wú)人駕駛汽車(chē)會(huì)完全錯(cuò)過(guò)并可能造成危險(xiǎn)的情況。 深度學(xué)習(xí)只是一個(gè)開(kāi)始由于Krizhevsky,Sutskever和Hinton以及其他許多在該領(lǐng)域工作過(guò)的人的努力,深度學(xué)習(xí)已經(jīng)走了很長(zhǎng)一段路。 但深層學(xué)習(xí)仍然不是人工智能的實(shí)現(xiàn),而是創(chuàng)造出能夠像人類一樣思考的合成物。我們甚至不知道是否能創(chuàng)造人工智能,許多專家認(rèn)為這是一個(gè)浪費(fèi)的目標(biāo)。 然而,就科學(xué)家而言,我們?nèi)匀恍枰苿?dòng)創(chuàng)造更好的技術(shù)和技術(shù),以實(shí)現(xiàn)復(fù)雜的決策自動(dòng)化。2017年,作為深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的長(zhǎng)期開(kāi)拓者和倡導(dǎo)者的Hinton,建議為拋棄他創(chuàng)造的所有東西并重新開(kāi)始做好準(zhǔn)備。 Hinton說(shuō):“未來(lái)取決于一些對(duì)我所說(shuō)的一切都深表懷疑的研究生!”。 ---正文完--- 評(píng)論區(qū)互動(dòng):字符畫(huà) -- 猜猜看 【科技生活范:在生活中了解科技,用科技方便生活!】 |
|
|