|
來源: 半導(dǎo)體行業(yè)觀察 前言: 筆者有幸受邀在六月初北京舉行的首屆亞洲AI硬件峰會(AI Hardware Summit Asia)上發(fā)表了開幕主題演講,與全世界的AI硬件專家分享了我對行業(yè)的一些看法和想法。演講以英文形式進行,原文記錄在LinkedIn之后收到多位業(yè)內(nèi)人士的推薦,例如Codeplay的CEO Andrew Richards就留言說,“This is a great article. Should be read by any AI chip company. Don't write your own AI framework and don't expect the whole AI ecosystem to switch overnight. Very true.” 特此感謝《半導(dǎo)體行業(yè)觀察》協(xié)助合作翻譯成中文,有機會讓此文與更廣大的讀者見面。以下為主題演講的全文記錄。 早上好,女士們先生們, 歡迎來到中國,歡迎來到北京! 感謝Kisaco Research的邀請,非常榮幸能夠在首屆亞洲AI硬件峰會上發(fā)表開幕主題演講。 當(dāng)我在今年早些時候確定了“AI芯片的長征之路”這個題目的時候,我并沒有預(yù)料到“長征”這個詞現(xiàn)在會變得如此熱門。縱觀國際上最近發(fā)生的有關(guān)技術(shù)和非技術(shù)的事件,我認(rèn)為現(xiàn)在有必要反思一下這些變化將如何重塑我們未來的世界。 很多人認(rèn)為AI將從根本上改變每個人的生活,有些人甚至把AI比作“第四次工業(yè)革命”。我認(rèn)為這種說法一點也不夸張,我也相信AI的進步最終會對新的世界秩序和格局產(chǎn)生重大影響。 計算能力是推動AI產(chǎn)業(yè)發(fā)展的關(guān)鍵動力之一,在過去幾年我們已經(jīng)看到了其非常迅猛的發(fā)展勢頭。然而,我認(rèn)為我們還需要很長一段時間才能充分理解我們對此的真實愿景,并開發(fā)出各種能夠真正滿足我們需求的AI芯片。因此,我想在這里和大家討論并分享一些想法,我們該如何應(yīng)對當(dāng)前的局面、克服挑戰(zhàn)并探索新機遇。 在我們談?wù)揂I芯片之前,我認(rèn)為有必要回答這樣一個問題:為什么現(xiàn)在是合適的時機? 想必這里的絕大多數(shù)觀眾都非常熟悉摩爾定律的即將終結(jié):
為了進一步論證這一趨勢,我們看到從2016年開始,英特爾的固定成本已經(jīng)開始超過了其可變制造成本部分,也因此放棄了長期以來的Tick-Tock戰(zhàn)略,轉(zhuǎn)而采用三步走的“制程-架構(gòu)-優(yōu)化” —— 這是為了延長固定成本攤薄周期而做出的必要妥協(xié)。 這種變革的影響是如此之大,以至于像你和我這樣大多數(shù)普通人都能深切感受到通用計算的進步在放緩。正如我在幻燈片上所說的無形之手,它的本質(zhì)是市場的供求關(guān)系。當(dāng)這里的供應(yīng),即CPU的性能提升增長慢于對計算能力的需求時,這會造成數(shù)據(jù)中心實質(zhì)上的“赤字”——對于像阿里巴巴這樣的公司來說,云計算對計算能力有著巨大且持續(xù)增長的海量需求,那么對我們來說只有兩條路可走:要么再去建更多的數(shù)據(jù)中心并購買更多的CPU服務(wù)器,要么去尋求那些更強大、更經(jīng)濟、更高效的替代品。 這就是為什么我想說,摩爾定律的放緩和通用計算的衰落實際上更像是一個經(jīng)濟問題,而不僅僅是一個單純的技術(shù)問題(注:見后通用芯片時代:專用芯片興起背后的經(jīng)濟學(xué))。專用硬件的興起將能很大程度上緩解數(shù)據(jù)中心的”赤字“問題。 如果說智能手機是時代的必然,但iPhone的成功卻是不可預(yù)測的;就像一片落葉,我們不知道風(fēng)會把它吹到哪里,但我們知道最終它會落到地面上。 與許多大型互聯(lián)網(wǎng)公司一樣,AI在阿里巴巴遍地開花。近年來,無論是內(nèi)部應(yīng)用還是在阿里云上,我們都看到了對異構(gòu)計算資源(主要是GPU)的強烈需求,而這種趨勢也將會在未來相當(dāng)一段時間內(nèi)繼續(xù)持續(xù)下去。但是在這里我們不禁要問,如果AI加速器是歷史的必然,那GPU就是必然的選擇么? GPU很強大也很好用,但它也不是完美的:
雖然GPU在生態(tài)建設(shè)方面遠(yuǎn)遠(yuǎn)領(lǐng)先于其他所有人,但我并不認(rèn)為GPU是AI加速的最終答案和唯一選擇,尤其是在推理領(lǐng)域,AI加速有許多利基市場需要專業(yè)化的服務(wù)。同樣地,這個世界也需要更多的多樣性。 正如我們看到的,AI在各行各業(yè)生根發(fā)芽并茁壯成長,那些真正在乎自己軟件的人也正在考慮擁有自己的硬件加速器。 我在此要祝賀這里所有的AI芯片初創(chuàng)公司。你們在過去兩年里突飛猛進,總共籌集了超過25億美元的投資,非常厲害!來,讓我們?yōu)樽约合裙膫€掌! 有幸在過去的兩年里有機會和你們中的一部分人有過深入交流并有機會合作,很高興能成為你們初創(chuàng)項目前進的一部分。然而,每一個派對都有結(jié)束的時候,隨著帷幕逐漸落下,我不得不說,冬天已經(jīng)要來了。 我說冬天要來了,有這么幾個原因:
我夫人和我說過她第一天上法學(xué)院的故事——院長要求學(xué)生環(huán)顧四周看看誰坐在他們旁邊,然后說,“你沒必要記住這些人,這并不重要,因為你現(xiàn)在的許多鄰座無法熬過未來的3年”。這是生活展現(xiàn)給我們真實的一面。我也真心希望你們中的大多數(shù)人明年還能有機會參加今天這個峰會。 這聽了是不是很令人沮喪,不是嗎? 在中國,當(dāng)我們談到困難的時候,我們總是說“危機背后往往蘊藏機遇”,這也就是為什么我們創(chuàng)造了“危機”這個詞。就像英語里說的,“冬天來了,春天還會遠(yuǎn)嗎”? 我想,我對AI芯片行業(yè)總體是樂觀的,而其中最重要的因素在我看來就是中國(至少對中國公司來說)。
總而言之,我非??春弥袊臋C會。我們有理由相信中國將繼續(xù)在AI領(lǐng)域發(fā)揮重要作用,AI芯片將成為中國新興半導(dǎo)體產(chǎn)業(yè)的主導(dǎo)因素和驅(qū)動力。通用計算的放緩為中國提供了一個巨大的歷史機遇。 那么,我們?nèi)绾巫プ∵@些機會呢?當(dāng)我和你們中的許多人討論你們的產(chǎn)品時,總是被問到我是否能給你們一些建議。那今天,我想提三個建議:
我認(rèn)為如何強調(diào)軟件的重要性都不為過,對于軟件的認(rèn)知關(guān)系到你如何定位你的產(chǎn)品和你的公司。 說到定位,我們來談一下戰(zhàn)略的本質(zhì)。這是Michael Porter所作的一張著名圖表(我在商學(xué)院里最喜歡的圖表之一),我認(rèn)為它對當(dāng)今AI芯片的競爭版圖也非常適用。 一個公司可以針對多個細(xì)分市場做開發(fā),但歸納起來其實只有兩種真正的競爭優(yōu)勢:1)比競爭對手做到成本更低,2)或?qū)崿F(xiàn)差異化。 讓我試著解釋一下這個戰(zhàn)略的本質(zhì)并用例子來說明——比如說有公司來找我,“我的芯片具有非常好的perf/watt能效比,這就是我針對NVIDIA GPU的優(yōu)勢”。如果我們說同樣的一塊75瓦PCIe板卡形態(tài)的產(chǎn)品,那你的產(chǎn)品實際上就是在單卡上能處理更多工作,比如用1張卡替換2個GPU,這只是成本上的節(jié)省。如果我們從另外一個角度來看,比如你的芯片只有幾瓦卻能與一個75W的GPU性能等效,這樣你就可以在一個新的維度上進行競爭了。繼續(xù)用智慧城市場景作為例子,你現(xiàn)在可以用一個小型的機頂盒大小的設(shè)備替換掉一個大服務(wù)器,這樣可以讓AI變得更輕,更容易在在邊緣場景落地,而我將這樣的方案稱之為相對于GPU的差異化。 NVIDIA的GPU在軟件生態(tài)方面確實走在了前面,這在于先發(fā)優(yōu)勢和多年的積累。我不建議你直接在左上角與NVIDIA競爭——這個象限不適用于小公司或新項目。同樣地,我不認(rèn)為你們大多數(shù)人或你們的投資者希望你們永遠(yuǎn)停留在右上角。 我鼓勵后來者從特定的細(xì)分市場和特定的行業(yè)開始發(fā)力,并保持專注,這是實現(xiàn)成本效益和差異化的最佳機會。這也是為什么大多數(shù)公司從都是從推理芯片開始做,而非訓(xùn)練芯片。 如果過于野心勃勃,那么你可能會浪費寶貴的資源,最終陷入到“卡在中間”的困境中去。我有一個“卡在中間”的例子是那些看似巧妙的可變精度設(shè)計,而實際上每個應(yīng)用對此的要求都是不同的且難以做到通用化。Flexpoint是一個很有意思的想法但最終卻失敗了——英特爾最終不得不放棄這個方案。遺憾的是,這讓英特爾錯過了很好的時機,浪費了先發(fā)優(yōu)勢。
從這個案例的教訓(xùn)總結(jié)一下,我想鼓勵你多和你的顧客交流,不要閉門造車。作為一家芯片公司,不要夢想一夜之間就能改變整個軟件生態(tài)系統(tǒng)。技術(shù)可以自下而上,而戰(zhàn)略應(yīng)該自上而下。了解你之所長,再設(shè)計與之匹配的戰(zhàn)略。
當(dāng)了解了需求之后,我也希望你能更大膽一點。
這是最好的時代,也是最糟糕的時代。現(xiàn)在是你展示自己潛力的時候,抓住機會籌集更多的錢,為冬天做準(zhǔn)備,活下來才有繼續(xù)戰(zhàn)斗的資本。 要徹底解決AI加速的供需問題還需要很長的時間,只要你找到正確的方向,合理地利用你的資源,你就能成功。 我們正處在這樣一個時代:優(yōu)秀的產(chǎn)品可以快速地、非線性地實現(xiàn)增長。云就是你最好的朋友,如果你認(rèn)為你的產(chǎn)品不錯,歡迎來與我們交談。 對于所有公司來說,AI和AI加速都是一個相對新的領(lǐng)域,我想強調(diào)的是,現(xiàn)在正是開始討論并領(lǐng)導(dǎo)創(chuàng)建新標(biāo)準(zhǔn)的好時機。
AI基準(zhǔn)測試(benchmark)是我看到的機遇之一。 我在去年推出了阿里巴巴的AI Matrix benchmark。我們希望我們的benchmark能做到開放和靈活,并且可以讓測試評估AI加速器變得簡單。它現(xiàn)在已經(jīng)成為我們評估AI芯片的標(biāo)準(zhǔn)流程的一部分,你們中的許多人正在與我們合作——我也多次明確表示它是你們進入阿里巴巴生態(tài)系統(tǒng)的門票。我們的合作伙伴對此非常支持,如果你有興趣與我們合作,非常歡迎下載試用一下我們網(wǎng)站上的公開版本并向我們提供反饋。 同樣有著開放和快速迭代的理念,MLPerf是一個新興的國際AI benchmark社區(qū)。阿里巴巴是早期的參與者,也從一開始就為社區(qū)在做貢獻。我們正籌劃在今年創(chuàng)建一個正式的組織MLCommons,我鼓勵所有這里的公司,無論大小,特別是中國公司,參與進來并展現(xiàn)出你的技術(shù)能力和領(lǐng)導(dǎo)力。中國是AI應(yīng)用和AI芯片創(chuàng)新的試驗場(playground),要讓世界聽到你的聲音,這樣你也有機會參與到重塑世界格局的進程中去。作為MLCommons的董事會成員,我將非常樂意在茶歇期間與你分享更多相關(guān)信息。
所以,2019年是令人興奮的一年,我期待看到更多公司發(fā)布新產(chǎn)品,并將AI Matrix和MLPerf結(jié)果報告帶給我。我非常樂意與你們每一位進行合作。 行勝于言,我想看到你們能成功地做出芯片,亮出產(chǎn)品,show出benchmark的結(jié)果。
如果我們把AI芯片的旅程比作慢慢長征,那其中肯定會有起起伏伏。最后,我想以一句詩來結(jié)束我今天的演講——因為我擔(dān)心翻譯會詞不達(dá)意,所以我在這里直接使用中文。 “雄關(guān)漫道真如鐵,而今邁步從頭越。” 這句詩寫于84年前長征路上的關(guān)鍵時刻,我認(rèn)為它也很好地反映了今天我們所面臨的局勢。在AI應(yīng)用和AI芯片的強力推動下,2019年對于中國半導(dǎo)體行業(yè)而言很可能就是一個新的起點。 總結(jié)一下:
謝謝! 未來智能實驗室是人工智能學(xué)家與科學(xué)院相關(guān)機構(gòu)聯(lián)合成立的人工智能,互聯(lián)網(wǎng)和腦科學(xué)交叉研究機構(gòu)。 未來智能實驗室的主要工作包括:建立AI智能系統(tǒng)智商評測體系,開展世界人工智能智商評測;開展互聯(lián)網(wǎng)(城市)云腦研究計劃,構(gòu)建互聯(lián)網(wǎng)(城市)云腦技術(shù)和企業(yè)圖譜,為提升企業(yè),行業(yè)與城市的智能水平服務(wù)。 |
|
|