|
編|牛慧 8月28日至30日,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會正在貴陽火熱進行中?!爱a(chǎn)業(yè)鏈上下游的人都來了?!币晃恍袠I(yè)人士觀察,與以往不同,這屆數(shù)博會上,數(shù)據(jù)要素、智算基礎設施建設,正在和智能化、大模型行業(yè)應用等一起成為被密集討論的話題。
各種專業(yè)論壇上,人潮涌動,展區(qū)內(nèi)人頭攢動,大家交換著各地的項目信息和技術方案。 業(yè)界觀察,2024年,智算中心建設熱持續(xù)升溫。根據(jù)數(shù)智前線的不完全統(tǒng)計,今年僅前七個月,國內(nèi)就有140多個智算中心相關中標項目,且還有更多項目正在路上。 最近一個月,各地智算市場又有不少新動態(tài)。8月中旬,總投資13.5億元的兩個綠色智算中心項目在新疆石河子簽約落地并同步開工建設;下旬,華中地區(qū)的湖北襄陽官宣,該市首個智算中心正式啟用;緊接著,地處東北的哈爾濱也傳出消息,號稱“國內(nèi)最大的超萬卡智算中心”,將在月底投用。 各地都在緊鑼密鼓地上馬各種智算項目,不管是地方政府、央國企,還是各產(chǎn)業(yè)鏈企業(yè),態(tài)度都十分活躍積極。大家都把它看作新質(zhì)生產(chǎn)力發(fā)展的關鍵抓手,又或是招商引資的有力手段。 但與此同時,隨著建設的不斷深入,市場上也出現(xiàn)了一些共性問題。8月初在北京舉辦的一場氣氛熱烈的智算大會上,某大型央企就曾坦言,已投產(chǎn)的智算中心,目前成本和經(jīng)濟效益面臨較大挑戰(zhàn),呼吁產(chǎn)業(yè)鏈更多去使用算力。 智算中心的建設如何更加務實?大批建成后的算力如何運營消納?成為業(yè)界越來越關注的焦點。 01 算力焦慮,有解了嗎? 去年,大模型的爆發(fā),快速攪動了智算市場。“過往,百P的智算中心大家都不知道怎么去用,但大模型火起來后,社會上對算力的需求,處于瘋漲態(tài)勢。很多地方政府因此有信心去投入更大規(guī)模的智算中心?!币晃毁Y深行業(yè)人士告訴數(shù)智前線。 今年以來,智算中心的熱度有增無減。尤其是地方政府和以三大運營商為代表的央國企,都在大舉投入。比如,根據(jù)IDC的統(tǒng)計,截至今年6月,政府參與建設并已投產(chǎn)的智算中心數(shù)量已接近百個。 在這個態(tài)勢下,更多玩家,在產(chǎn)業(yè)鏈上迅速聚集、擴張。一位智算中心施工承包商告訴數(shù)智前線,大家都在瘋狂找項目、談合作。 但與此同時,隨著智算中心如雨后春筍般涌出,越來越多的智算算力如何用起來,成為關注點?!白罱K還是算力消納。”一位供應商在向數(shù)智前線介紹完自家方案后,旋即感嘆稱。 “算力問題現(xiàn)在是雙重焦慮,沒有的時候焦慮,有了也焦慮。”北電數(shù)智戰(zhàn)略與市場負責人楊震坦言,過去一年間,作為北京電控旗下一家AI原生企業(yè),他們接觸了大量政府和企業(yè)客戶,能明顯感覺大家對算力消納的需求越來越迫切。
畢竟,此前的一波智算中心建設,已經(jīng)踩過一波“高空置率”的坑。一位行業(yè)人士透露,2021、2022年左右有一些項目建成后,利用率甚至平均不到30%。 在新一波建設熱潮中,業(yè)界也看到了隱患?!拔覀児窘哟撕芏嗤獾貋淼目蛻簦蚕虢ㄖ撬阒行?,但一探討發(fā)現(xiàn),他們中有很多基本的概念都不知道。”一位智算服務商坦言,這讓他們擔心,在沒有足夠正確的認知和科學規(guī)劃的情況下“一哄而上”,未來會不會很快出現(xiàn)“一地雞毛”的情況。 過去,只要有錢、有人,自己也能搞一個小型云計算中心。但智算中心不同,發(fā)展還處于早期,從規(guī)劃、建設到運營每一個環(huán)節(jié)都極其復雜,充滿挑戰(zhàn)和風險,遠不是簡單堆一堆GPU服務器就完事了。 與此同時,在如火如荼的智算發(fā)展建設過程中,技術層面仍有大量卡點。“大型智算中心是重大科技攻關的重要基地,從底層芯片、數(shù)據(jù)原材料部分開始,再到工具鏈、大模型的能力制造部分,往上是智算云的能力投放,及液冷、網(wǎng)絡、存儲等各個基礎設施技術層面等等,以及最終如何真正服務于產(chǎn)業(yè),需要整體的規(guī)劃設計?!睏钫鹫f。 僅以電力問題為例,今年上半年,為應對人工智能和數(shù)據(jù)中心的電力需求,美國電力開發(fā)商新增發(fā)電量20.2GW(1GW=100萬KW),同比大增21%,創(chuàng)下了近20年以來的最大增幅。有企業(yè)更是測算,馬斯克最近落成的10萬卡AI集群“孟菲斯”一天的耗電,相當于北京東城區(qū)一天的電量。 實際上,為解決這些問題,業(yè)界已開始普遍關注智算中心的科學規(guī)劃,合理運營。今年7月,國家信息中心信息化和產(chǎn)業(yè)發(fā)展部主任單志廣就提醒稱,在一體化構建算力體系過程中,要避免重建設、輕需求,應以應用為導向,提高整個算力中心的利用度。 一些地方也正通過算力券的方式拉動算力需求。一些投資方則會在招標時就提出,項目承建方要做相應運營KPI的考核。但光做到這些,還遠遠不夠。 楊震認為,雖然市面上都傾向于通過包銷或招商引資的思路來解決問題,效果卻并非能夠立竿見影和可持續(xù)發(fā)展。比如,一些地方靠著算力券等方式能短暫拉動需求,但由于產(chǎn)業(yè)沒有實現(xiàn)“自生長”,后繼力量不足。這些客戶開始主動找上他們,協(xié)商對其算力進行有效納管、提速和運營。 一些業(yè)界人士開始反思和總結,各地真正需要建設的并不只是一個智算中心,而是以智算中心所在園區(qū)為核心,輻射產(chǎn)業(yè)鏈條上下游,聚集產(chǎn)、學、研融合的產(chǎn)業(yè)集群,形成當?shù)氐娜斯ぶ悄墚a(chǎn)業(yè)生態(tài)。 “長遠來看,'以終為始’地打造一個健康良性的智算中心商業(yè)閉環(huán),或是更為關鍵和有效的方式?!睏钫鸶嬖V數(shù)智前線。 為此,在幫助地方政府構建智算中心時,業(yè)界已經(jīng)開始呼吁,一開始就要與當?shù)氐漠a(chǎn)業(yè)經(jīng)濟緊密結合,進行建設規(guī)劃與生態(tài)引入,將人工智能產(chǎn)業(yè)鏈真正為當?shù)亟?jīng)濟所用,形成良性循環(huán)。 02 商業(yè)閉環(huán),如何跑通? 對于各地政府、企業(yè)而言,如何以終為始打造智算中心的商業(yè)閉環(huán),本質(zhì)上還是發(fā)掘人工智能的應用場景,實現(xiàn)當?shù)禺a(chǎn)業(yè)或企業(yè)智能化轉型升級。 “我們經(jīng)常講,與其給政策,不如給一個商業(yè)閉環(huán)的機會,讓人工智能企業(yè)能自循環(huán)長起來?!睏钫鹫f。比如,地方政府最初可把自身一些數(shù)據(jù)、場景釋放出來,形成一些人工智能標桿,再進一步與當?shù)禺a(chǎn)業(yè)、頭部企業(yè)結合,將雪球越滾越大。 不過,要讓政府和企業(yè)來打造標桿,業(yè)界先要從人工智能三要素——算力、數(shù)據(jù)和算法上做好準備。目前這些要素中還存在大量卡點。 比如,在算力方面,為支持人工智能產(chǎn)業(yè)爆發(fā)的需求及自主發(fā)展,采用多種國產(chǎn)芯片,構建更大的集群已成為趨勢,但各地最早一批落地的國產(chǎn)算力平臺利用率不高。很多用戶反饋,國產(chǎn)芯片的生態(tài)還有很大發(fā)展空間,它們架構不同,工具鏈、軟件、算子都自成一體。把大模型移植到這些平臺上,要做大量工作。 相較而言,英偉達市占率在80%~90%,它多年對CUDA生態(tài)的投入,使得全球框架、算法和應用的創(chuàng)新及優(yōu)化,無一例外都落在了它的平臺上。今年英偉達還突出了一個聲明:禁止其他硬件平臺運行基于CUDA的軟件。這意味著,其他芯片廠商更要孤軍作戰(zhàn)。 為了將底層算力溝壑填平,并實現(xiàn)大模型自如、流暢地運行在不同平臺上,一些廠商已經(jīng)開始行動。例如北電數(shù)智針對性地推出了“前進”和“寶塔”兩款產(chǎn)品,“初衷就是有效地幫助國產(chǎn)芯片更好集群作戰(zhàn)?!睏?/span>震說。
在這個過程中,要克服很多技術難關。北電數(shù)智產(chǎn)業(yè)生態(tài)負責人吳岳舉例說,他們開發(fā)了適配層,彌補、屏蔽國產(chǎn)芯片在軟件棧上的差異,對齊算子精度;還通過開發(fā)高性能算子、針對主流框架進行優(yōu)化加速,將國產(chǎn)芯片性能提高到2~3倍。 目前大部分異構集群本質(zhì)上還是割裂的,作為一家公共智算中心的規(guī)劃設計與建設運營方,北電數(shù)智希望能夠打消“算力煙筒”。“按Token計費的方式配合我們的混池技術,我們能把智算中心的利用率,提高到兩倍左右?!?/span> “這里有很多笨功夫,但我們認為是必須要做的?!眳窃勒f。只有跑通這些,才能讓國產(chǎn)芯片更好地賣起來、用起來,不斷獲得更好的生態(tài)支持。 另外,決定人工智能終局的關鍵要素——數(shù)據(jù)方面,根據(jù)統(tǒng)計,中國開源數(shù)據(jù)集總量只是美國的1/9,80%以上的高質(zhì)量數(shù)據(jù)掌握在政府、機構和企業(yè)手中,由于缺乏令人信任的數(shù)據(jù)空間,很多數(shù)據(jù)拿不出來,流通不起來,也用不起來。而人工智能是一個熱數(shù)據(jù)產(chǎn)業(yè),高質(zhì)量發(fā)展的基礎在于高質(zhì)量數(shù)據(jù)的流通。業(yè)界目前正在為此進行大量探索。 “這里面最關鍵的是保護數(shù)據(jù)提供方的權益。”楊震分析,“現(xiàn)階段市場不成熟,大家認知也拉不齊,最主要的還是把規(guī)則和機制搭建起來?!北热缦襻t(yī)院這樣的公共機構,其大量高質(zhì)量數(shù)據(jù)如果要真正能夠為公眾創(chuàng)造價值,除了需要一個安全可靠的平臺主體,能夠把數(shù)據(jù)供出來之外,在如制藥、診療、康養(yǎng)等不同領域的使用確權,及數(shù)據(jù)價值確定與分配都是要面對和解決的問題。 于是,基于上述考慮,他們專門打造了一個產(chǎn)品——紅湖·可信數(shù)據(jù)空間。楊震認為,如何在這個數(shù)據(jù)空間中,探索流通規(guī)則才是核心。相較于過去的公共數(shù)據(jù)空間,可信數(shù)據(jù)空間除了強調(diào)隱私計算、區(qū)塊鏈等數(shù)據(jù)安全技術,更關鍵的是通過上鏈存證、數(shù)字合約等能力,讓供方和需方能直接對接,對數(shù)據(jù)使用用途、使用次數(shù)進行約定,并用技術手段進行監(jiān)督,規(guī)則建立后,就能形成閉環(huán)。 目前,大部分企業(yè)對數(shù)據(jù)交易的規(guī)則、認知是沒有拉齊的,還有不少規(guī)則仍需去不斷建立。比如,在科研機構面向同一個研究領域,如果一方把所有洞察數(shù)據(jù)共享,就應該有權訪問空間中同一研究領域的其他科研機構的洞察數(shù)據(jù),這種規(guī)則建起來后,能把數(shù)據(jù)洞察有效疊加,讓該領域的研究進展得以加速度提升。 此外,面向企業(yè)級數(shù)據(jù)流通變現(xiàn)需求,需要通過第三方可信主體保障數(shù)據(jù)隱私和規(guī)避合規(guī)風險的基礎上,能夠?qū)佑袑嶋H場景應用的數(shù)據(jù)需求方,挖掘數(shù)據(jù)價值,在可信的數(shù)據(jù)生態(tài)系統(tǒng)里實現(xiàn)數(shù)據(jù)資產(chǎn)的商業(yè)轉化。 在算法方面,要打開數(shù)據(jù)的同時打開用戶的場景,業(yè)界認為垂類模型和場景模型是當下切實可行的辦法。北電數(shù)智布局的垂類模型矩陣,多與民生相關,如政務、醫(yī)療、文化、教育和交通等。比如,北電數(shù)智揭榜掛帥北京市某委辦局政務大模型項目;與三甲醫(yī)院合作簽署“皮膚數(shù)字醫(yī)療協(xié)同項目”,共同探索大語言模型、多模態(tài)AI技術、國產(chǎn)AI芯片等在醫(yī)院的落地應用等;與上市龍頭工業(yè)企業(yè)合作供應鏈模型等。 “這個時代需要有人善于干產(chǎn)業(yè)組織、產(chǎn)業(yè)攻堅的事,把底層的東西磕明白了,上層的東西就好解決了?!蹦壳埃彪姅?shù)智正在聯(lián)合生態(tài)伙伴,以打造AI工廠的智算中心模式,在AI產(chǎn)業(yè)鏈的每一層都打造產(chǎn)品,形成對外的全棧服務。 03 智算中心,為何需要“打開”? 除了算力、數(shù)據(jù)和算法層面的攻關,生態(tài)聚合也極為關鍵,這已成為產(chǎn)業(yè)共識。 “對于整個行業(yè)來說,過去20年中,我從未看到任何一個技術浪潮,能夠像這一輪大模型,從上到下對技術和商業(yè)產(chǎn)生如此大的顛覆?!币晃粡臉I(yè)者感嘆,所有從業(yè)者都轉向全面技術創(chuàng)新。開放協(xié)作、產(chǎn)學研聯(lián)合等方式變得極為重要。 “人工智能產(chǎn)業(yè),需要通過項目,用生態(tài)的做法把大家引進來,一塊干?!睏钫鹫J為,“這是我們一個最深刻的、最底層的理念和做法。” 由北電數(shù)智規(guī)劃設計與運營的首個星火·智算的標桿項目——北京市數(shù)字經(jīng)濟算力中心,與通常的智算中心不同,整棟樓并沒有都堆滿機柜、服務器、芯片等基礎設施,智算中心一層采用了開放式設計,在這里有算力展廳、算力劇場、聯(lián)合實驗室,以及籌備中的產(chǎn)投孵化計劃。這也是國內(nèi)智算中心的首創(chuàng)。
這樣的設計,寓意是將智算中心的產(chǎn)業(yè)聚集高地打開,將產(chǎn)業(yè)要素充分聚集起來,實現(xiàn)技術的攻關,以及生態(tài)的聚合,最終將人工智能的場景盡可能打開,讓產(chǎn)業(yè)形成閉環(huán)。智算中心不再僅僅是算力提供地,而是人工智能產(chǎn)業(yè)的孕育基地。 “本質(zhì)上我們不是運營智算中心,是在運營人工智能產(chǎn)業(yè)生態(tài)。我們的目標是成為生態(tài)的一級節(jié)點?!睏钫鹫f。過去一年,北電數(shù)智每個月幾乎接觸100家生態(tài)企業(yè),目的是能夠快速形成初具規(guī)模的人工智能產(chǎn)業(yè)鏈,為企業(yè)和政府客戶,形成“即插即用”的人工智能賦能平臺。 目前,通過這些技術攻關和生態(tài)聚合,北電數(shù)智已開始幫助各地智算中心進行規(guī)劃建設和運營。 智算中心在規(guī)劃初期就要考慮各地的產(chǎn)業(yè)結構。比如,某地以旅游業(yè)為主,需要結合文化模型,對文博、文創(chuàng)賦能。但離它很近的另一座城市,就有制造業(yè)龍頭,人工智能要考慮為制造業(yè)提質(zhì)增效。 智算中心建設為什么一開始要考慮當?shù)氐漠a(chǎn)業(yè)經(jīng)濟?這是因為它涉及智算中心的規(guī)劃設計。比如各地產(chǎn)業(yè)不同,有動漫、機器人、無人智駕、低空經(jīng)濟......它們對智算芯片的需求不盡相同,不同芯片之間的配比也不同。 “像低空經(jīng)濟,它要做大量仿真計算、圖形渲染和AI計算,這其中所需的芯片如何去配比,就有很大的學問。”吳岳說,這中間,怎么兼具訓練和推理給出芯片選型建議,是專業(yè)的事。而只有前期科學的規(guī)劃,后面才能更好地運營。 為了進一步更深入地幫助各地智算產(chǎn)業(yè)運營,他們還在機器人、AI制藥、工業(yè)、仿真等垂直行業(yè)開發(fā)者層面,花了更多心思。數(shù)智前線獲悉,北電數(shù)智即將攻關專用領域大模型算子,讓當下只能跑在英偉達算力上的專用領域模型算子,轉向國產(chǎn)算力平臺。 而這一切工作,將進一步深入打開各地產(chǎn)業(yè)中的人工智能場景,通過在算力、算法、數(shù)據(jù)三大要素的層面充分打開,以打開的理念建設與運營智算中心,充分擁抱AI產(chǎn)業(yè)鏈各個層面的生態(tài),以此,智算中心才能夠成為人工智能產(chǎn)業(yè)長遠發(fā)展的沃土,人工智能也能夠真正落入當?shù)禺a(chǎn)業(yè)經(jīng)濟發(fā)展環(huán)節(jié)。 |
|
|