|
深度學習是機器學習的一個子集,機器學習是人工智能的一個分支,用于配置計算機通過經驗執(zhí)行任務。這是一次深度探索。 由于豐富的數據和增強的計算能力,深度學習是一種先進的人工智能技術,在過去幾年中變得越來越流行。它是我們每天使用的許多應用程序背后的主要技術,包括在線語言翻譯和社交媒體中的自動面部標記。 這項技術在醫(yī)療保健方面也很有用:今年早些時候,麻省理工學院(MIT)的計算機科學家利用深度學習創(chuàng)建了一種新的計算機程序來檢測乳腺癌。 經典模型需要工程師手動定義用于檢測癌癥的規(guī)則和邏輯,但對于這個新模型,科學家們給出了深度學習算法,從60,000名患者中進行了90,000次全分辨率乳房X線照片掃描,并讓它找到患者掃描之間的常見模式最終患有乳腺癌的人和沒有患乳腺癌的人。它能夠提前五年預測乳腺癌,與之前的風險預測模型相比有了相當大的改進。 機器學習究竟是什么? 深度學習是機器學習的一個子集,機器學習是人工智能的一個分支,用于配置計算機通過經驗執(zhí)行任務。與經典的基于規(guī)則的AI系統相反,機器學習算法通過處理帶注釋的示例(稱為“訓練”)來發(fā)展其行為。 例如,要創(chuàng)建欺詐檢測程序,您需要使用一系列銀行交易及其最終結果(合法或欺詐)來訓練機器學習算法。機器學習模型檢查示例并開發(fā)合法和欺詐交易之間共同特征的統計表示。之后,當您向算法提供新銀行交易的數據時,它會根據從培訓示例中收集的模式將其歸類為合法或欺詐。 根據經驗,您提供的數據質量越高,機器學習算法在執(zhí)行任務時就越準確。 機器學習在解決規(guī)則定義不明確且無法編碼為不同命令的問題時特別有用。不同類型的算法在不同任務中表現出色。 深度學習和神經網絡 雖然經典的機器學習算法解決了基于規(guī)則的程序所遇到的許多問題,但它們在處理圖像,視頻,聲音文件和非結構化文本等軟數據方面很差。 例如,根據AI研究人員和數據科學家Jeremy Howard的說法,使用經典的機器學習方法創(chuàng)建乳腺癌預測模型需要數十名領域專家,計算機程序員和數學家的努力。研究人員必須進行大量的特征工程,這是一個艱巨的過程,可以對計算機進行編程,以便在X射線和MRI掃描中找到已知的模式。之后,工程師在提取的功能之上使用機器學習。創(chuàng)建這樣的AI模型需要數年時間。 深度學習算法使用深度神經網絡解決了同樣的問題,深度神經網絡是一種受人類大腦啟發(fā)的軟件架構(盡管神經網絡與生物神經元不同)。神經網絡是變量層上的層,它們根據它們所訓練的數據的屬性進行調整,并且能夠執(zhí)行諸如分類圖像和將語音轉換為文本等任務。 神經網絡尤其擅長在非結構化數據中獨立查找常見模式。例如,當您在不同對象的圖像上訓練深度神經網絡時,它會找到從這些圖像中提取特征的方法。神經網絡的每一層都檢測特定的特征,如邊緣,角落,面部,眼球等。 通過使用神經網絡,深度學習算法消除了對特征工程的需求。對于麻省理工學院的乳腺癌預測模型,由于深入學習,該項目需要的計算機科學家和領域專家的努力要少得多,而且開發(fā)時間也更短。此外,該模型能夠在人體分析師遺漏的乳房X線照片掃描中找到特征和模式。 自20世紀50年代以來,神經網絡已經存在(至少在概念上)。但直到最近,人工智能社區(qū)在很大程度上駁回了他們,因為他們需要大量的數據和計算能力。在過去幾年中,存儲,數據和計算資源的可用性和可承受性已經將神經網絡推向了人工智能創(chuàng)新的最前沿。 深度學習用于什么? 有幾個領域深度學習幫助計算機解決以前無法解決的問題。 計算機視覺:計算機視覺是使用軟件來理解圖像和視頻內容的科學。這是深度學習取得很大進展的領域之一。除了乳腺癌,深度學習圖像處理算法可以檢測其他類型的癌癥,并幫助診斷其他疾病。 但深度學習也是你每天使用的許多應用程序中的根深蒂固。Apple的Face ID使用深度學習,Google Photos也使用深度學習來搜索各種功能,例如搜索對象和場景以及校正圖像。Facebook使用深度學習自動標記您上傳的照片中的人物。 深度學習還可以幫助社交媒體公司自動識別和阻止可疑內容,例如暴力和裸露。最后,深度學習在使自駕車能夠理解周圍環(huán)境方面發(fā)揮著非常重要的作用。 語音和語音識別:當您向Amazon Echo智能揚聲器或Google智能助理發(fā)出命令時,深度學習算法會將您的語音轉換為文本命令。一些在線應用程序使用深度學習來轉錄音頻和視頻文件。谷歌最近發(fā)布了一款設備上實時Gboard語音轉錄智能手機應用程序,該應用程序使用深度學習鍵入。 自然語言處理(NLP)和生成(NLG):自然語言處理,提取非結構化文本含義的科學,一直是經典軟件的歷史痛點。用計算機規(guī)則定義書面語言的所有不同細微差別和隱藏含義幾乎是不可能的。但是在大型文本上訓練的神經網絡可以準確地執(zhí)行許多NLP任務。 當公司轉向深度學習時,谷歌的翻譯服務突然提升了業(yè)績。智能揚聲器使用深度學習NLP來理解命令的各種細微差別,例如您可以詢問天氣或方向的不同方式。 深度學習在生成有意義的文本方面也非常有效,也稱為自然語言生成。Gmail的智能回復和智能撰寫使用深度學習來顯示對您的電子郵件的相關回復和完成句子的建議。OpenAI今年早些時候開發(fā)的文本生成模型創(chuàng)建了長篇連貫文本。 深度學習的局限 盡管它有很多好處,但深度學習也有一些缺點。 數據依賴性:通常,深度學習算法需要大量的訓練數據才能準確地執(zhí)行任務。不幸的是,對于許多問題,沒有足夠的質量培訓數據來創(chuàng)建深度學習模型。 可解釋性:神經網絡以極其復雜的方式發(fā)展他們的行為 - 甚至他們的創(chuàng)造者也很難理解他們的行為。缺乏可解釋性使得解決錯誤和修復深度學習算法中的錯誤非常困難。 算法偏差:深度學習算法與他們訓練的數據一樣好。問題是訓練數據通常包含隱藏或明顯的偏差,算法會繼承這些偏差。例如,主要針對白人的照片訓練的面部識別算法將對非白人執(zhí)行不太準確。 缺乏概括性:深度學習算法擅長執(zhí)行重點任務,但在推廣知識方面表現不佳。與人類不同,受過星際爭霸訓練的深度學習模型將無法玩類似的游戲:比如,魔獸爭霸。此外,深度學習在處理偏離其訓練示例的數據方面也很差,也被稱為“邊緣情況”。在自動駕駛汽車等情況下,這可能會變得很危險,因為錯誤會導致致命的后果。 深度學習的未來? 今年早些時候,深度學習的先驅者被授予圖靈獎,這是計算機科學的諾貝爾獎。但深度學習和神經網絡的工作遠未結束。正在努力改進深度學習。 一些有趣的工作包括可以解釋或開放解釋的深度學習模型,可以用較少的訓練數據開發(fā)行為的神經網絡,以及可以在不依賴大型云計算資源的情況下執(zhí)行任務的深度學習算法的邊緣AI模型。 雖然深度學習是目前最先進的人工智能技術,但它并不是人工智能行業(yè)的最終目的地。深度學習和神經網絡的發(fā)展可能會給我們提供全新的架構。 |
|
|