|
從飛鳥到飛機,從蝙蝠到雷達。人類對自然界的每一次致敬都能把自己帶入一個新時代。而人工智能,恰恰是向自然界的王者——人類——致敬。 自從有計算機那天開始,人們就從未中斷讓機器擁有智慧的夢想。在這條路上,有一位廣受世界學界尊重的大師,他就是來自 360 的首席科學家、國際知名計算機視覺與深度學習專家顏水成。 他不僅在國際上領域數(shù)次引領了計算機視覺的研究方向,還進行了大量前瞻的實踐,讓計算機模仿嬰兒大腦的運作方式,一步步觀察學習這個世界。 在 2016 CCF-GAIR 全球人工智能與機器人峰會上,顏水成接受了雷鋒網(wǎng)的專訪,分享了他對于人工智能和計算機視覺的洞見。 【360 首席科學家,360 人工智能研究院院長 顏水成】 1、端上的智能 目前的人工智能很多都依靠云端的計算,但是有些場景并不適合云端。例如:
【特斯拉自動駕駛示意圖】 以上這些場景,如果將運算任務直接下發(fā)到智能設備終端上,這些瓶頸就會迎刃而解。 但是,把運算載荷放到設備上,顯然要克服諸多問題。其中最大的一個就是:終端設備的運算能力存在天花板。(由于智能設備成本有限,大多不可能配備頂級運算芯片) 解決這個問題,有兩個方向:
顏水成認為,這些策略的優(yōu)化是非常有意義的,因為成本往往是實現(xiàn)商業(yè)化的重要因素。 2、人工智能專用計算芯片 目前最主流的人工智能芯片,全部采用 GPU。但是 GPU 的體量大,耗能高,無法在手機等設備中使用。目前看來,在手機或硬件上智能使用性能稍好的 CPU。 從目前來看,市面上還沒有一款專門為端設備研發(fā)的深度學習芯片。而中國人也在試圖給出在這個領域的專用芯片。 例如中國科學院計算技術研究所的“寒武紀”芯片,和由前百度深度學習研究院院長余凱創(chuàng)建的地平線機器人科技,都在試圖制造這樣的專用芯片。 【寒武紀芯片】 由于芯片生產(chǎn)是一個非常重的產(chǎn)業(yè)。一款芯片從流片到量產(chǎn)往往需要一年到一年半的時間,耗費數(shù)百萬美元。如果無法大規(guī)模銷售,那么將會造成成本無法控制。 在成熟的芯片可用之前,用各種方法降低端芯片的運算量,不失為一個好的方法。 3、類腦計算 當你看到一個人的照片,有關他的很多故事就會自動涌現(xiàn)在你的腦海里,這就是人腦的奇妙之處。 類腦研究一直以來都是人工智能領域很超前的研究方向。簡單來說,就是要準確掌握人腦的工作原理,在此基礎之上用相同的原理設計深度學習網(wǎng)絡。 但是顏水成說,人腦研究領域的發(fā)展并沒有想象中快。但是他非常欣賞以人腦為啟發(fā)研究出來的計算模型。
這就像一個水管網(wǎng)絡,在入口加壓,會層層推導,造成整個網(wǎng)絡的各個節(jié)點的壓力同時改變。 “對于大腦而言,某個圖像對整個系統(tǒng)加電信號,會導致與之相關的所有記憶和知識瞬間涌現(xiàn)。” 這樣的效率會遠遠高于目前人工智能所使用的線性計算。 雖然這種模型聽上去很奇妙,但是在實際的方程求解方面,仍然面臨重重問題。不過顏水成表示,在這個方向上,也許未來能有新的解決方法。 4、無監(jiān)督學習和自學習 目前的深度學習,無一例外需要大量的數(shù)據(jù)。例如要想讓機器可以準確識別出一只狗,需要先讓系統(tǒng)“看”成千上萬只狗。但這顯然和人類的學習方式不同。 一個小孩子,可能只需要看到一兩只狗,就可以認識全世界所有的狗。 【無監(jiān)督學習】 從這一點上看,“小樣本”“無監(jiān)督”“自學習”是人類完勝機器的方面。那么機器有沒有可能實現(xiàn)小樣本無監(jiān)督學習和自學習呢? 這也許就要回到每個人最初認識世界的那一刻。 顏水成說:
顏水成對這種學說非常感興趣,這實際上展現(xiàn)了機器視覺的新入口:視頻。 從視頻切入,發(fā)現(xiàn)人類和機器學習的密碼。這也是顏水成帶領團隊正在進行的工作之一。 5、人腦的兩套識別系統(tǒng)
這個人腦特有的現(xiàn)象,不經(jīng)意間揭示了一個人腦運作的巨大秘密。 【經(jīng)常想不起對方的名字】 顏水成向雷鋒網(wǎng)(搜索“雷鋒網(wǎng)”公眾號關注)分享了他最近了解到的一個新的假說:
這大概就是動畫片《頭腦特工隊》所描述的規(guī)則。 而這個規(guī)則,恰恰可以和人類的學習模型相聯(lián)系。
這種認知模型,對于改進機器學習的架構有著重大的意義。機器的無監(jiān)督學習和自學習似乎露出了一絲曙光。但是顏水成說,人類的學習遠遠不是這么簡單,因為人的學習不僅是依靠圖像,還結合了聲音、語義。而在這些方面,研究空白很大。 6、語義理解 對于 AI 來說,最重要的有四個方向:視覺,語音、語義、大數(shù)據(jù)。 而目前科學家在視覺,語音和大數(shù)據(jù)方面,都實現(xiàn)了可用性比較強的人工智能。唯獨在“語義理解”這個最重要和易感知的方面徘徊不前。 這也是為什么目前的所有人工智能機器人感覺都有些“辭不達意”的原因。 究其原因,仍然是之前提到的:人類現(xiàn)有的語義理解實現(xiàn)技術和人大腦的工作架構完全不同。人對于語義的理解,不僅僅是建立在對方的話語本身之上,還要綜合考慮話語環(huán)境,知識背景、情緒等等因素。這些因素中的任何一個,目前都不能被人類科學家很好地控制。 顏水成坦言,這方面的研究非常困難,已經(jīng)超越了他的能力范圍。但也是正是專注于自己的視覺和大數(shù)據(jù)研究領域,才能專心做出更多的成績。 AI,這兩個字母充滿了神秘和浪漫的氣息。這不僅代表了我們對于未知的渴望,對于創(chuàng)造的期待,也代表了我們對于自身智慧的無上虔誠。 在人工智能領域的每一個洞見,都可以讓我們更加接近那個終極的答案。 這讓我們感到欣喜。
|
|
|
來自: 昵稱71360118 > 《待分類》