电竞比分网-中国电竞赛事及体育赛事平台

分享

國(guó)內(nèi)超大型智能算力中心建設(shè)白皮書 2024

 非著名問天 2024-04-06
智算中心建設(shè)通過領(lǐng)先的體系架構(gòu)設(shè)計(jì),以算力基建化為主體、以算法基建化為引領(lǐng)、以服務(wù)智件化為依托,以設(shè)施綠色化為支撐,從基建、硬件、軟件、算法、服務(wù)等全環(huán)節(jié)開展關(guān)鍵技術(shù)落地與應(yīng)用。
一、體系架構(gòu)
(一)總體架構(gòu)
圖片
圖8 智算中心總體架構(gòu)
智能算力中心建設(shè)白皮書,重點(diǎn)圍繞基礎(chǔ)、支撐、功能和目標(biāo)四大部分,創(chuàng)新性地提出了智算中心總體架構(gòu)。
其中,基礎(chǔ)部分是支撐智算中心建設(shè)與應(yīng)用的先進(jìn)人工智能理論和計(jì)算架構(gòu);支撐部分圍繞智算中心算力生產(chǎn)、聚合、調(diào)度、釋放的作業(yè)邏輯展開;功能部分提供算力生產(chǎn)供應(yīng)、數(shù)據(jù)開放共享、智能生態(tài)建設(shè)和產(chǎn)業(yè)創(chuàng)新聚集四大平臺(tái),以及數(shù)據(jù)、算力和算法三大服務(wù);整體目標(biāo)是促進(jìn)AI產(chǎn)業(yè)化、產(chǎn)業(yè)AI化及政府治理智能化。
(二)技術(shù)演進(jìn)
智算中心的發(fā)展基于最新人工智能理論和領(lǐng)先的人工智能計(jì)算架構(gòu),算力技術(shù)與算法模型是其中的關(guān)鍵核心技術(shù),算力技術(shù)以AI芯片、AI服務(wù)器、AI集群為載體,而當(dāng)前的算法模型發(fā)展趨勢(shì)以AI大模型為代表。
在此基礎(chǔ)上,通過智算中心操作系統(tǒng)作為智算中心的“神經(jīng)中樞”對(duì)算力資源池進(jìn)行高效管理和智能調(diào)度,使智算中心更好地對(duì)外提供算力、數(shù)據(jù)和算法等服務(wù),支撐各類智慧應(yīng)用場(chǎng)景落地。而軟件生態(tài)則是智算中心“好用、用好”的關(guān)鍵支撐。
1.AI芯片
基于AI芯片的加速計(jì)算是當(dāng)前AI計(jì)算的主流模式。AI芯片通過和AI算法的協(xié)同設(shè)計(jì)來滿足AI計(jì)算對(duì)算力的超高需求。當(dāng)前主流的AI加速計(jì)算主要是采用CPU系統(tǒng)搭載GPU、FPGA、ASIC等異構(gòu)加速芯片。
AI計(jì)算加速芯片發(fā)端于GPU芯片,GPU芯片中原本為圖形計(jì)算設(shè)計(jì)的大量算術(shù)邏輯單元(ALU)可對(duì)以張量計(jì)算為主的深度學(xué)習(xí)計(jì)算提供很好的加速效果。隨著GPU芯片在AI計(jì)算加速中的應(yīng)用逐步深入,GPU芯片本身也根據(jù)AI的計(jì)算特點(diǎn),進(jìn)行了針對(duì)性的創(chuàng)新設(shè)計(jì),如張量計(jì)算單元、TF32/BF16數(shù)值精度、Transformer引擎(Transformer Engine)等。
近年來,國(guó)產(chǎn)AI加速芯片廠商持續(xù)發(fā)力,在該領(lǐng)域取得了快速進(jìn)展,相關(guān)產(chǎn)品陸續(xù)發(fā)布,覆蓋了AI推理和AI訓(xùn)練需求,其中既有基于通用GPU架構(gòu)的芯片,也有基于ASIC架構(gòu)的芯片,另外也出現(xiàn)了類腦架構(gòu)芯片,總體上呈現(xiàn)出多元化的發(fā)展趨勢(shì)。但是,當(dāng)前國(guó)產(chǎn)AI芯片在產(chǎn)品性能和軟件生態(tài)等方面與國(guó)際領(lǐng)先水平還存在差距,亟待進(jìn)一步完善加強(qiáng)。總體而言,國(guó)產(chǎn)AI芯片正在努力從“可用”走向“好用”。
2.AI服務(wù)器
AI服務(wù)器是智算中心的算力機(jī)組。當(dāng)前AI服務(wù)器主要采用CPU+AI加速芯片的異構(gòu)架構(gòu),通過集成多顆AI加速芯片實(shí)現(xiàn)超高計(jì)算性能。
為滿足各領(lǐng)域場(chǎng)景和復(fù)雜的AI模型的計(jì)算需求,AI服務(wù)器對(duì)計(jì)算芯片間互聯(lián)、擴(kuò)展性有極高要求。AI服務(wù)器內(nèi)基于特定協(xié)議進(jìn)行多加速器間高速互聯(lián)通信已成為高端AI訓(xùn)練服務(wù)器的標(biāo)準(zhǔn)架構(gòu)。
目前業(yè)界以NVLink和OAM兩種高速互聯(lián)架構(gòu)為主,其中NVLink是NVIDIA開發(fā)并推出的一種私有通信協(xié)議,其采用點(diǎn)對(duì)點(diǎn)結(jié)構(gòu)、串列傳輸,可以達(dá)到數(shù)百GB/s的P2P互聯(lián)帶寬,極大地提升了模型并行訓(xùn)練的效率和性能。
OAM是國(guó)際開放計(jì)算組織OCP定義的一種開放的、用于跨AI加速器間的高速通信互聯(lián)協(xié)議,卡間互聯(lián)聚合帶寬可高達(dá)896GB/s

浪潮信息基于開放OAM架構(gòu)研發(fā)的AI服務(wù)器NF5498,率先完成與國(guó)際和國(guó)內(nèi)多家AI芯片產(chǎn)品的開發(fā)適配,并已在多個(gè)智算中心實(shí)現(xiàn)大規(guī)模落地部署。
3.AI集群
大模型參數(shù)量和訓(xùn)練數(shù)據(jù)復(fù)雜性快速增長(zhǎng),對(duì)智算系統(tǒng)提出大規(guī)模算力擴(kuò)展需求。通過充分考慮大模型分布式訓(xùn)練對(duì)于計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)的需求特點(diǎn),可以設(shè)計(jì)構(gòu)建高性能可擴(kuò)展、高速互聯(lián)、存算平衡的AI集群來滿足尖端的AI計(jì)算需求。
AI集群采用模塊化方法構(gòu)建,可以實(shí)現(xiàn)大規(guī)模的算力擴(kuò)展。AI集群的基本算力單元是AI服務(wù)器。數(shù)十臺(tái)AI服務(wù)器可以組成單個(gè)POD計(jì)算模組,POD內(nèi)部通過多塊支持RDMA技術(shù)的高速網(wǎng)卡連接。在此基礎(chǔ)上以POD計(jì)算模組為單位實(shí)現(xiàn)橫向擴(kuò)展,規(guī)模可多達(dá)數(shù)千節(jié)點(diǎn)以上,從而實(shí)現(xiàn)更高性能的AI集群。
AI集群的構(gòu)建主要采用低延遲、高帶寬的網(wǎng)絡(luò)互連。為了滿足大模型訓(xùn)練常用的數(shù)據(jù)并行、模型并行、流水線并行等混合并行策略的通信需求,需要為芯片間和節(jié)點(diǎn)間提供低延遲、高帶寬的互聯(lián)。另外,還要針對(duì)大模型的并行訓(xùn)練算法通信模式做出相應(yīng)的組網(wǎng)拓?fù)渖系膬?yōu)化,比如對(duì)于深度學(xué)習(xí)常用的全局梯度歸約通信操作,可以使用全局環(huán)狀網(wǎng)絡(luò)設(shè)計(jì),配置多塊高速網(wǎng)卡,實(shí)現(xiàn)跨AI服務(wù)器節(jié)點(diǎn)的AI芯片間RDMA互聯(lián),消除混合并行算法的計(jì)算瓶頸。
AI集群的構(gòu)建需要配置面向AI優(yōu)化的高速存儲(chǔ)。通過配置高性能、高擴(kuò)展、多層級(jí)的智能存儲(chǔ),為各種數(shù)據(jù)訪問需求提供優(yōu)化性能。智能存儲(chǔ)具備隨需擴(kuò)展功能,實(shí)現(xiàn)高IOPS處理能力,支持RDMA技術(shù),同時(shí)實(shí)現(xiàn)高聚合帶寬。
4.AI大模型
超大規(guī)模智能模型,簡(jiǎn)稱大模型,是近年興起的一種新的人工智能計(jì)算范式。和傳統(tǒng)AI模型相比,大模型的訓(xùn)練使用了更多的數(shù)據(jù),具有更好的泛化性,可以應(yīng)用到更廣泛的下游任務(wù)中。按照應(yīng)用場(chǎng)景劃分,AI大模型主要包括語(yǔ)言大模型、視覺大模型和多模態(tài)大模型等。
自然語(yǔ)言處理是首個(gè)應(yīng)用大模型的領(lǐng)域,BERT是大模型的早期代表。隨著大模型在自然語(yǔ)言的理解和生成領(lǐng)域成功應(yīng)用,推動(dòng)了語(yǔ)言大模型向更大的模型參數(shù)規(guī)模和更大訓(xùn)練數(shù)據(jù)規(guī)模的方向發(fā)展。當(dāng)前,語(yǔ)言大模型的單體模型參數(shù)已經(jīng)達(dá)到千億級(jí)別,訓(xùn)練數(shù)據(jù)集規(guī)模也達(dá)到了TB級(jí)別,訓(xùn)練所需計(jì)算資源超過1000PetaFlop/s-day(PD)。業(yè)界典型的自然語(yǔ)言大模型有GPT-4、源、悟道和文心等。自然語(yǔ)言大模型已經(jīng)廣泛應(yīng)用于個(gè)人知識(shí)管理、輿情檢測(cè)、商業(yè)報(bào)告生成、金融反欺詐、智能客服、虛擬數(shù)字人等場(chǎng)景,同時(shí)也出現(xiàn)了一系列的創(chuàng)新應(yīng)用場(chǎng)景,如劇本殺、反網(wǎng)絡(luò)詐騙、公文寫作等。
在語(yǔ)言大模型大獲成功之后,相關(guān)技術(shù)和方法也被引入計(jì)算機(jī)視覺領(lǐng)域,通過構(gòu)建更大的預(yù)訓(xùn)練模型,使其可以適用于目標(biāo)檢測(cè)、語(yǔ)義分割、異常檢測(cè)等廣泛的視覺任務(wù)。
在算法架構(gòu)上,視覺大模型采用以Transformer架構(gòu)為主體的神經(jīng)網(wǎng)絡(luò)架構(gòu)和自監(jiān)督的訓(xùn)練方法以及十億級(jí)的無標(biāo)注圖片數(shù)據(jù)進(jìn)行訓(xùn)練。當(dāng)前業(yè)界已經(jīng)出現(xiàn)了越來越多的通用視覺大模型和面向特定領(lǐng)域的視覺大模型。視覺大模型也已廣泛應(yīng)用于自動(dòng)駕駛、智能安防、醫(yī)學(xué)影像等領(lǐng)域。
隨著大模型技術(shù)在語(yǔ)言、視覺等多個(gè)領(lǐng)域的應(yīng)用,融合多個(gè)模態(tài)的多模態(tài)大模型也逐漸成為了業(yè)界關(guān)注的重點(diǎn)?;诙嗄B(tài)大模型的以文生圖,文生視頻技術(shù)也迅速發(fā)展,代表性模型有DALLE-2、Stable Diffusion 3 和Sora等。由于多模態(tài)大模型的快速發(fā)展,AI內(nèi)容生成(AI Generated Content,AIGC)已成為下一個(gè)AI發(fā)展的重點(diǎn)領(lǐng)域。
5.智算OS
智算OS,即智算中心操作系統(tǒng),是以智算服務(wù)為對(duì)象,對(duì)智算中心基礎(chǔ)設(shè)施資源池進(jìn)行高效管理和智能調(diào)度的產(chǎn)品方案,可以使智算中心更好地對(duì)外提供算力、數(shù)據(jù)、算法、智件等服務(wù),有效降低算力使用門檻,提升資源調(diào)度效率,支撐各類智慧應(yīng)用場(chǎng)景落地,是智算中心的“中樞神經(jīng)”。

智算OS主要由三層架構(gòu)構(gòu)成,分別為基礎(chǔ)設(shè)施層、平臺(tái)服務(wù)層、業(yè)務(wù)系統(tǒng)層。基礎(chǔ)設(shè)施層主要實(shí)現(xiàn)將異構(gòu)算力、數(shù)據(jù)存儲(chǔ)、框架模型等轉(zhuǎn)化為有效的算力與服務(wù)資源,算力資源池能夠聚合并進(jìn)行標(biāo)準(zhǔn)化和細(xì)粒度切分,以滿足上層不同類型智能應(yīng)用對(duì)算力的多元化需求,并通過異構(gòu)資源管理和調(diào)度技術(shù),提升可同時(shí)支撐的智算業(yè)務(wù)規(guī)模。
平臺(tái)服務(wù)層主要提供AI訓(xùn)練與推理服務(wù)、數(shù)據(jù)治理服務(wù)、運(yùn)營(yíng)運(yùn)維服務(wù)等,并通過智算OS實(shí)現(xiàn)自動(dòng)化、智能化,有效擺脫人力束縛,促進(jìn)算力高效釋放并轉(zhuǎn)化為生產(chǎn)力。業(yè)務(wù)系統(tǒng)層是面向用戶端的統(tǒng)一服務(wù)入口,向下整合各層級(jí)核心功能,為用戶提供多元化、高質(zhì)量的智算服務(wù),滿足生產(chǎn)中不同階段、不同場(chǎng)景的智算需求。
智算OS以智算中心為載體,通過建設(shè)多元、開放的智算平臺(tái),融合國(guó)際、國(guó)內(nèi)先進(jìn)人工智能技術(shù),形成標(biāo)準(zhǔn)化、模塊化的模型、中間件及應(yīng)用軟件,以開放接口、模型庫(kù)、算法包等方式向用戶提供如行業(yè)大模型、自動(dòng)駕駛、元宇宙、智慧科研等人工智能服務(wù),促進(jìn)人工智能技術(shù)成果的開放與共享,構(gòu)建開放的智算生態(tài)。
6.軟件生態(tài)
基于業(yè)界主流、開源、開放的軟件生態(tài)建設(shè)智算中心,是智算中心能夠滿足前沿AI計(jì)算需求、提升AI創(chuàng)新和生產(chǎn)效率、豐富行業(yè)AI應(yīng)用、促進(jìn)AI產(chǎn)業(yè)快速發(fā)展的主要前提。深度學(xué)習(xí)的加速計(jì)算始于GPU,構(gòu)建于GPU之上的CUDA軟件棧為深度學(xué)習(xí)的算法開發(fā)提供了極大的便利。CUDA軟件棧為深度學(xué)習(xí)的應(yīng)用開發(fā)和計(jì)算加速提供了豐富的底層支撐,如張量和卷積計(jì)算加速、芯片互聯(lián)通信加速、數(shù)據(jù)預(yù)處理加速、模型低精度推理加速等。在此基礎(chǔ)上,學(xué)術(shù)界和工業(yè)界已經(jīng)構(gòu)建龐大的開源、開放、共享的AI軟件生態(tài),有力促進(jìn)和加速全球AI技術(shù)與應(yīng)用的蓬勃發(fā)展。
深度學(xué)習(xí)框架是當(dāng)前主要的人工智能算法開發(fā)工具。其中TensorFlow和PyTorch的使用較為廣泛。TensorFlow因其豐富的模型開發(fā)和應(yīng)用部署組件而在工業(yè)界廣泛應(yīng)用,PyTorch則由于其易用性和靈活性在前沿算法開發(fā)和學(xué)術(shù)創(chuàng)新研究領(lǐng)域取得了領(lǐng)先地位。國(guó)內(nèi)的AI科技公司也在開發(fā)和推廣深度學(xué)習(xí)框架。其中百度開發(fā)的飛槳提供了兼具靈活和效率的開發(fā)機(jī)制,并聯(lián)合開源社區(qū)打造了一系列覆蓋主流產(chǎn)業(yè)應(yīng)用需求的工業(yè)級(jí)模型,目前在國(guó)內(nèi)已得到較多的采用。
在深度學(xué)習(xí)框架之上,為了適應(yīng)計(jì)算機(jī)視覺任務(wù)、自然語(yǔ)言大模型等特定場(chǎng)景的應(yīng)用開發(fā)需求,業(yè)界構(gòu)建了一系列的開源開發(fā)庫(kù),比如面向目標(biāo)檢測(cè)任務(wù)的mmdetection、面向大模型訓(xùn)練任務(wù)的Megatron-LM、DeepSpeed,以及面向自監(jiān)督學(xué)習(xí)的VISSL等。
這些軟件庫(kù)進(jìn)一步簡(jiǎn)化了模型訓(xùn)練和應(yīng)用開發(fā)的難度,已成為當(dāng)前人工智能計(jì)算的重要軟件底座。業(yè)界前沿的知名AI算法,如ChatGPT、DALLE-2、StableDiffusion等都是在這樣的架構(gòu)下實(shí)現(xiàn)的。隨著國(guó)產(chǎn)AI計(jì)算產(chǎn)業(yè)的快速發(fā)展,各廠商也高度重視并投入軟件生態(tài)建設(shè),力求實(shí)現(xiàn)好用、易用的軟件開發(fā)和應(yīng)用生態(tài)。但總的來說,當(dāng)前國(guó)產(chǎn)AI計(jì)算軟件生態(tài)起步較晚、基礎(chǔ)薄弱,還要持續(xù)不斷加大投入,在各個(gè)層面加強(qiáng)建設(shè)完善。
(三)建設(shè)架構(gòu)
圖片
圖9 智算中心建設(shè)架構(gòu)
在智算中心總體架構(gòu)的基礎(chǔ)上,聚焦智算中心建設(shè)與應(yīng)用中涉及的關(guān)鍵技術(shù),進(jìn)一步提出智算中心建設(shè)架構(gòu)。智算中心建設(shè)架構(gòu)由四大關(guān)鍵環(huán)節(jié)組成,分別是算力基建化、算法基建化、服務(wù)智件化、設(shè)施綠色化,“四化”相互支撐、相互協(xié)調(diào),共同構(gòu)建起智算中心高效運(yùn)行體系。
同時(shí),在總體架構(gòu)三項(xiàng)服務(wù)、三項(xiàng)目標(biāo)的基礎(chǔ)上,進(jìn)一步拓展豐富智算中心的功能和目標(biāo),實(shí)現(xiàn)對(duì)外提供數(shù)據(jù)服務(wù)、算力服務(wù)、算法服務(wù)、生態(tài)服務(wù)四大服務(wù),支撐達(dá)成AI產(chǎn)業(yè)化、產(chǎn)業(yè)AI化、治理智能化、產(chǎn)業(yè)集群化四大目標(biāo)。
二、技術(shù)路線
智算中心建設(shè)的關(guān)鍵技術(shù)涉及與其建設(shè)和應(yīng)用相關(guān)的各類基建、硬件、軟件,體現(xiàn)在智算中心算力基建化、算法基建化、服務(wù)智件化、設(shè)施綠色化過程中。
(一)以算力基建化為主體
以智算中心為代表的算力基礎(chǔ)設(shè)施能夠有效促進(jìn)AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化,是支撐數(shù)字經(jīng)濟(jì)發(fā)展的重要基礎(chǔ)底座。為了讓AI真正地賦能到千行百業(yè),并推動(dòng)產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型發(fā)展,智算中心要具備對(duì)外提供高性價(jià)比、普惠、安全算力資源的能力,使AI算力像水、電一樣成為城市的公共基礎(chǔ)資源,供政府、企業(yè)、公眾自主取用。算力基建化供給成為支撐產(chǎn)業(yè)轉(zhuǎn)型升級(jí)以及創(chuàng)新發(fā)展的剛性需求和必然選擇。
1.面向潛在算力需求,適度超前規(guī)模化部署算力資源數(shù)據(jù)量的爆炸式增長(zhǎng)以及萬億參數(shù)大模型的出現(xiàn),使智能算力需求呈現(xiàn)高速增長(zhǎng)態(tài)勢(shì),并為算力基礎(chǔ)設(shè)施帶來巨大挑戰(zhàn)。在數(shù)據(jù)量方面,IDC發(fā)布的《數(shù)據(jù)時(shí)代2025》預(yù)測(cè),到2025年,全球數(shù)據(jù)量將達(dá)到175 ZB,而中國(guó)數(shù)據(jù)量的平均增速快于全球3%,預(yù)計(jì)到2025年將增至48.6 ZB,占全球數(shù)據(jù)圈的27.8%。在模型方面,當(dāng)前1萬億參數(shù)的單體模型需要1EFLOPS級(jí)算力(FP16)計(jì)算約50天,10萬億參數(shù)的單體模型需要10 EFLOPS級(jí)算力(FP16)計(jì)算約50天。因此在智算中心的規(guī)劃建設(shè)中,需要聚焦當(dāng)前算力應(yīng)用需求,同時(shí)面向未來數(shù)據(jù)量和大模型大參數(shù)量增長(zhǎng)空間,適度超前,部署滿足AI訓(xùn)練、AI推理等大規(guī)模計(jì)算需求的強(qiáng)大AI算力機(jī)組,構(gòu)建算力集群,提供大規(guī)模彈性算力。
2.聚焦異構(gòu)加速技術(shù),提升高性能人工智能計(jì)算能力自2012年以來,人工智能訓(xùn)練任務(wù)所需求的算力每3.43個(gè)月就會(huì)翻倍,大大突破了傳統(tǒng)以每18個(gè)月為周期實(shí)現(xiàn)芯片性能翻番的摩爾定律,這對(duì)人工智能計(jì)算架構(gòu)的性能提出了更高的要求。AI芯片是生產(chǎn)算力環(huán)節(jié)的關(guān)鍵組件,為AI訓(xùn)練和AI推理輸出強(qiáng)大、高效、易用的計(jì)算力。目前,AI芯片主要包括GPU、FPGA、ASIC、類腦芯片四大類,其中類腦芯片仍在探索階段,因此多元異構(gòu)芯片成為提升算力的關(guān)鍵手段。主流的人工智能計(jì)算架構(gòu)是以CPU+AI芯片為主體的異構(gòu)架構(gòu),通過將CPU與多種計(jì)算單元(如GPU、FPGA、ASIC等)集成,充分融合了CPU等傳統(tǒng)的通用計(jì)算單元和高性能專用計(jì)算單元的優(yōu)點(diǎn),可以同時(shí)兼顧AI模型的高效訓(xùn)練和精準(zhǔn)推理能力。異構(gòu)架構(gòu)具有高性能、高效率、低功耗等顯著優(yōu)點(diǎn),使AI芯片在未來人工智能算法不斷迭代更新的情況下,依舊能保持較好的兼容性和可擴(kuò)展性,在一定程度上延長(zhǎng)了AI芯片的生命周期。
3.兼顧軟硬一體協(xié)同,構(gòu)建智算中心多元融合型架構(gòu)人工智能計(jì)算場(chǎng)景和計(jì)算架構(gòu)的多元化要求智算中心從硬件、軟件、軟硬協(xié)同等層面開展優(yōu)化,提供彈性、可伸縮擴(kuò)展的算力聚合能力,依據(jù)不同類型智能應(yīng)用對(duì)算力的不同需求,提供更高效、更便捷的算力調(diào)度能力。采用融合架構(gòu)進(jìn)行整體設(shè)計(jì)是智算中心的發(fā)展方向。具體而言,在硬件層面,通過硬件重構(gòu)實(shí)現(xiàn)資源池化,結(jié)合新型超高速內(nèi)外部互連技術(shù)、池化融合、異構(gòu)存儲(chǔ)介質(zhì)等,推動(dòng)多元異構(gòu)智能算力設(shè)施的高速互聯(lián),形成高效池化的智算中心,實(shí)現(xiàn)多元計(jì)算資源高效協(xié)同;在軟件層面,通過軟件定義,將不同的資源池組成專業(yè)的服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)系統(tǒng),實(shí)現(xiàn)重構(gòu)硬件資源池的高效化、智能化管理,使智算中心的業(yè)務(wù)資源調(diào)度更為靈活、運(yùn)維管理能力更強(qiáng)。在安全方面,智算中心可以依托隱私安全計(jì)算等技術(shù),提供完善的隱私和數(shù)據(jù)保護(hù)解決方案,實(shí)現(xiàn)計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)等多層級(jí)、全方位的資源隔離與安全防護(hù)。
(二)以算法基建化為引領(lǐng)
建設(shè)適度超前的算力基礎(chǔ)設(shè)施,不僅體現(xiàn)在算力層面,也體現(xiàn)在算法層面,這是釋放算力環(huán)節(jié)的關(guān)鍵。人工智能算法正面臨著豐富化、專業(yè)化和巨量化的挑戰(zhàn),智算中心通過提供預(yù)置行業(yè)算法、構(gòu)建預(yù)訓(xùn)練大模型、推進(jìn)算法模型持續(xù)升級(jí)、提供專業(yè)化數(shù)據(jù)和算法服務(wù),讓更多的用戶享受普適普惠的智能計(jì)算服務(wù)。
1.面向千行百業(yè)發(fā)展需求,提供多類型預(yù)置行業(yè)算法AI落地面臨開發(fā)成本、技術(shù)門檻高的難題,算法模型平均構(gòu)建時(shí)間為3個(gè)月,同時(shí)算法還需要快速的迭代,再加上AI新算法、新理論層出不窮,行業(yè)用戶的智慧轉(zhuǎn)型存在著巨大的技術(shù)壁壘。智算中心應(yīng)圍繞政務(wù)服務(wù)、智慧城市、智能制造、自動(dòng)駕駛、語(yǔ)言智能等重點(diǎn)領(lǐng)域,在AI平臺(tái)內(nèi)預(yù)置實(shí)例分割、目標(biāo)檢測(cè)、邊緣檢測(cè)、圖像分類、人臉識(shí)別、視頻感知、自動(dòng)問答、機(jī)器翻譯、輿情分析、情感分析、語(yǔ)音識(shí)別、協(xié)同過濾、交通路線規(guī)劃等常用行業(yè)算法模型,并從硬、軟件對(duì)行業(yè)算法做性能優(yōu)化,從而幫助各行各業(yè)智慧應(yīng)用加速落地,推動(dòng)行業(yè)智能化轉(zhuǎn)型加速。
2.面向模型即服務(wù)應(yīng)用需求,構(gòu)建大規(guī)模預(yù)訓(xùn)練AI模型在產(chǎn)業(yè)AI化和數(shù)實(shí)融合的背景下,當(dāng)前的行業(yè)做法是針對(duì)每一個(gè)場(chǎng)景都做一個(gè)模型,即“有1萬個(gè)場(chǎng)景就有1萬個(gè)模型”。然而隨著以BERT、GPT-3、DALL·E、源1.0等為代表的高泛化能力和高通用性的大模型的出現(xiàn),一個(gè)模型可以覆蓋眾多場(chǎng)景?!邦A(yù)訓(xùn)練大模型+下游任務(wù)微調(diào)”的AI工程化模式已成為業(yè)內(nèi)共識(shí),層數(shù)、隱向量長(zhǎng)度、前饋網(wǎng)絡(luò)尺寸持續(xù)增長(zhǎng),參數(shù)規(guī)模迅速?gòu)膬|級(jí)增長(zhǎng)到百萬億級(jí)。
在充足數(shù)據(jù)和算力的支持下,大模型可以充分學(xué)習(xí)文本、圖像等數(shù)據(jù)中的特征。智算中心應(yīng)通過部署大模型所需要的訓(xùn)練、推理和數(shù)據(jù)處理系統(tǒng),構(gòu)建出不同功能、不同模態(tài)的大模型(如自然語(yǔ)言處理大模型、視覺大模型、多模態(tài)大模型等),從而更加快速地生產(chǎn)出專業(yè)的技能模型,并在更多專業(yè)場(chǎng)景中實(shí)現(xiàn)小型化、輕量化的落地運(yùn)作。
3.面向可持續(xù)化發(fā)展需求,推進(jìn)AI模型不斷演進(jìn)升級(jí)從感知機(jī)到深度神經(jīng)網(wǎng)絡(luò),從全連接網(wǎng)絡(luò)到模型剪枝、知識(shí)蒸餾、注意力機(jī)制,從有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)到強(qiáng)化學(xué)習(xí)、自監(jiān)督學(xué)習(xí),人工智能理論算法模型在持續(xù)深化發(fā)展中。當(dāng)前,人工智能算法正從單模態(tài)、有監(jiān)督學(xué)習(xí)向多模態(tài)、自監(jiān)督學(xué)習(xí)演進(jìn)。自監(jiān)督學(xué)習(xí)無需標(biāo)注數(shù)據(jù),可以直接從無標(biāo)簽數(shù)據(jù)中自行學(xué)習(xí),極大降低了人工標(biāo)注成本。
多模態(tài)學(xué)習(xí)更貼近人類對(duì)多感知模態(tài)的認(rèn)知過程,通過學(xué)習(xí)多種模態(tài)的數(shù)據(jù),可以突破自然語(yǔ)言處理和計(jì)算機(jī)視覺的界限,在圖文生成、看圖問答等視覺語(yǔ)言任務(wù)上具有更強(qiáng)表現(xiàn)。隨著人工智能相關(guān)技術(shù)和應(yīng)用需求的不斷升級(jí),智算中心所提供的算法模型也應(yīng)持續(xù)迭代升級(jí),與時(shí)俱進(jìn),保持算法模型的先進(jìn)性。未來,人工智能算法將朝著多模態(tài)、交互式主動(dòng)學(xué)習(xí)、規(guī)劃、實(shí)踐的方向發(fā)展,以期實(shí)現(xiàn)真正的認(rèn)知智能。
4.面向算法高效調(diào)用需求,提供專業(yè)化開發(fā)部署支撐智算中心除了提供深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等常見 A I算法模型外,還應(yīng)提供專業(yè)化基礎(chǔ)支撐和開發(fā)部署服務(wù)能力,以支撐AI算法模型的便捷調(diào)用和部署。為了滿足算法模型對(duì)大規(guī)模高質(zhì)量海量數(shù)據(jù)集的需求,智算中心應(yīng)搭載海量數(shù)據(jù)清洗系統(tǒng),提供全流程自動(dòng)化數(shù)據(jù)處理系統(tǒng),實(shí)現(xiàn)智能高效的數(shù)據(jù)處理和過濾。為了滿足AI算法模型高效訓(xùn)練和使用的需求,智算中心在基礎(chǔ)支撐層面應(yīng)部署分布式訓(xùn)練框架、高性能推理框架,在開發(fā)部署層面應(yīng)提供數(shù)據(jù)管理、模型開發(fā)、模型訓(xùn)練、模型管理等關(guān)鍵模塊,以模型API服務(wù)、領(lǐng)域模型、工具包、會(huì)話式開放框架、開發(fā)者社區(qū)等形式,形成強(qiáng)大的AI算法服務(wù)支撐能力。
(三)以服務(wù)智件化為依托
隨著人工智能應(yīng)用場(chǎng)景持續(xù)拓展和開發(fā)用戶不斷普及,對(duì)智能計(jì)算需求大幅提升、算法模型功能不斷強(qiáng)化的同時(shí),人工智能算法開發(fā)和模型訓(xùn)練正在從專業(yè)化、高門檻向泛在化、易用型轉(zhuǎn)變,智算中心的發(fā)展將由傳統(tǒng)的硬件、軟件向“智件”升級(jí)拓展?!爸羌笔侵钢撬阒行奶峁┤斯ぶ悄芡茝V應(yīng)用的中間件產(chǎn)品和服務(wù)。
傳統(tǒng)用戶進(jìn)行人工智能應(yīng)用時(shí),除了需要提供業(yè)務(wù)數(shù)據(jù),還需提供算法模型并進(jìn)行代碼開發(fā),“智件”的構(gòu)建可以改變這種服務(wù)模式,通過可視化操作界面,以及低代碼開發(fā)甚至無代碼開發(fā)的模式,為用戶提供功能豐富、使用便捷的人工智能算力調(diào)度、算法供給和個(gè)性化開發(fā)服務(wù),實(shí)現(xiàn)“帶著數(shù)據(jù)來、拿著成果走”的效果。
1.提供多元算力調(diào)度服務(wù),實(shí)現(xiàn)算力調(diào)度“智件化”算力是智算中心提供的核心產(chǎn)品和服務(wù)。面向不同用戶的不同算力需求,智算中心應(yīng)提供“智件化”算力服務(wù),讓用戶無需關(guān)注底層算力芯片和技術(shù)細(xì)節(jié),通過用戶交互界面,選擇業(yè)務(wù)場(chǎng)景類別、算法模型大小等參數(shù),獲得不同算力需求下的計(jì)算時(shí)間預(yù)估、服務(wù)費(fèi)用測(cè)算等針對(duì)性算力服務(wù)方案。
一方面,算力服務(wù)虛擬化,弱化底層算力芯片供給的技術(shù)差異性,為用戶提供標(biāo)準(zhǔn)化的算力供給服務(wù)。
通過抽象芯片架構(gòu)并融合算力特性將提供底層計(jì)算能力的GPU、FPGA、ASIC等AI芯片進(jìn)行統(tǒng)一管理和調(diào)度,以PFLOPS、EFLOPS作為計(jì)算能力單位向用戶提供算力服務(wù),讓用戶可以更便捷地調(diào)度算力,進(jìn)行AI應(yīng)用部署。
另一方面,算力服務(wù)協(xié)同調(diào)度,要強(qiáng)化對(duì)外的算力調(diào)度與服務(wù)能力。在構(gòu)建全國(guó)一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系和“東數(shù)西算”工程的背景和要求下,智算中心可以作為算力基礎(chǔ)單元,通過云服務(wù)方式融入全國(guó)算力調(diào)度體系中,滿足更大范圍、更強(qiáng)算力調(diào)度需求。
2.提供簡(jiǎn)便算法模型服務(wù),實(shí)現(xiàn)算法供給“智件化”人工智能是一門極其復(fù)雜的學(xué)科,要求應(yīng)用開發(fā)者不僅要有扎實(shí)的理論功底,還要有高超的編程技術(shù),門檻極高。算法模型是人工智能應(yīng)用的靈魂,也是智算中心提供服務(wù)的主要輸出物。從計(jì)算智能到感知智能,再到認(rèn)知智能,人工智能的應(yīng)用模型越來越復(fù)雜,從公共服務(wù)到社會(huì)治理再到產(chǎn)業(yè)發(fā)展,人工智能的應(yīng)用需求越來越廣泛,對(duì)人工智能模型和算法的要求也越來越高。
為了緩解人工智能模型訓(xùn)練成本高、技術(shù)門檻高的問題,智算中心應(yīng)加強(qiáng)算法供給服務(wù)模式的創(chuàng)新,開發(fā)可視化操作界面,用戶通過API、模塊化代碼即可獲得所需的人工智能應(yīng)用效果,減輕代碼開發(fā)壓力,使用戶無需關(guān)注算法和模型本身的復(fù)雜技術(shù)細(xì)節(jié),只需聚焦相應(yīng)業(yè)務(wù)領(lǐng)域的業(yè)務(wù)邏輯和數(shù)據(jù)就能實(shí)現(xiàn)人工智能應(yīng)用。用戶可以基于“智件化”的算法模型進(jìn)行探索和創(chuàng)新,開發(fā)出適用于各種場(chǎng)景的新型智能應(yīng)用。
3.提供開放生態(tài)環(huán)境服務(wù),實(shí)現(xiàn)供需對(duì)接“智件化”人工智能場(chǎng)景日趨豐富,應(yīng)用需求和技術(shù)供給個(gè)性化特征明顯,為滿足部分用戶和場(chǎng)景對(duì)于人工智能算法優(yōu)化、系統(tǒng)優(yōu)化服務(wù)的個(gè)性化需求,智算中心應(yīng)構(gòu)建開放合作生態(tài),加大數(shù)據(jù)資源供給,聚焦先進(jìn)的技術(shù)并適配典型場(chǎng)景應(yīng)用一方面,加大數(shù)據(jù)供給,數(shù)據(jù)是人工智能應(yīng)用的基礎(chǔ),智算中心應(yīng)打造數(shù)據(jù)共享平臺(tái),推動(dòng)計(jì)算機(jī)視覺、自然語(yǔ)言處理、重點(diǎn)行業(yè)領(lǐng)域等高質(zhì)量公開數(shù)據(jù)集的匯聚,為用戶人工智能應(yīng)用提供增值性數(shù)據(jù)服務(wù)。另一方面,開放發(fā)展生態(tài),圍繞滿足不同用戶個(gè)性化人工智能應(yīng)用需求,智算中心應(yīng)將其計(jì)算平臺(tái)、資源平臺(tái)和算法平臺(tái)對(duì)外開放,聚集行業(yè)內(nèi)領(lǐng)先企業(yè)的力量,及時(shí)響應(yīng)用戶個(gè)性化需求,提升智算中心技術(shù)能力的同時(shí)形成新的產(chǎn)業(yè)和生產(chǎn)力。
(四)以設(shè)施綠色化為支撐
能耗是衡量智算中心發(fā)展水平的重要維度之一。“碳達(dá)峰、碳中和”目標(biāo)背景下,國(guó)家和地方持續(xù)出臺(tái)政策,進(jìn)一步規(guī)范數(shù)據(jù)中心的能耗水平和平均電能利用效率(PUE)。為了進(jìn)一步降低智算中心能耗,設(shè)施綠色化是智算中心建設(shè)的必然選擇。設(shè)施綠色化主要包括設(shè)備節(jié)能化、能源供給綠色化等方面。
1.采用先進(jìn)節(jié)能技術(shù),全面降低智算中心能耗制冷設(shè)備和IT設(shè)備是智算中心主要的能耗來源。液冷技術(shù)采用冷卻液和工作流體對(duì)發(fā)熱設(shè)備進(jìn)行冷卻,利用高比熱容的液體代替空氣,提升了制冷效率,降低制冷能耗。液冷技術(shù)是智算中心制冷的主要發(fā)展趨勢(shì)。數(shù)據(jù)中心采用全棧布局液冷,冷板式液冷、熱管式液冷、浸沒式液冷等先進(jìn)液冷技術(shù),構(gòu)建包含一次側(cè)二次側(cè)液冷循環(huán)、CDU等的智算中心液冷整體解決方案,可以進(jìn)一步降低能耗、降低PUE,實(shí)現(xiàn)綠色化。液冷智算中心采用余熱回收技術(shù),可以為智算中心自身以及鄰近區(qū)域供暖,進(jìn)一步提升能源利用效率。此外,智算中心采用高壓直流、集中供電等高效供配電系統(tǒng)、能效環(huán)境集成檢測(cè)等高效輔助系統(tǒng)、智能監(jiān)控運(yùn)維系統(tǒng)等綠色管理系統(tǒng)可以進(jìn)一步降低能耗。
2.采用綠色清潔能源,從源頭上實(shí)現(xiàn)綠色低碳
一方面,智算中心的大部分業(yè)務(wù)負(fù)載,特別是企業(yè)負(fù)載,在時(shí)間上主要集中于白天工作時(shí)段,與光伏、風(fēng)電的主要發(fā)電時(shí)段匹配性較高,無需過多儲(chǔ)能與調(diào)峰,使得智算中心在運(yùn)用光伏、風(fēng)電等綠色電力方面具有天然優(yōu)勢(shì)。采用綠色電力供給的智算中心綜合運(yùn)用線性規(guī)劃、混合整數(shù)規(guī)劃、啟發(fā)式算法等多種能耗管理方法,可以在降低碳排放的同時(shí)也節(jié)約電價(jià)成本。智算中心采用優(yōu)化調(diào)度與需求響應(yīng)控制策略,還可作為需求側(cè)可調(diào)載荷參與電力需求側(cè)響應(yīng),不僅提升智算中心自身能源利用效率,而且提升新型電力系統(tǒng)需求側(cè)資源優(yōu)化配置效率。
另一方面,智算中心所在的建筑物、園區(qū)空間大,可以充分利用,發(fā)展屋頂光伏、園區(qū)風(fēng)電等可再生能源發(fā)電設(shè)施,優(yōu)化能源綠色供給格局。應(yīng)用分布式光伏發(fā)電、分布式燃?xì)夤┠艿燃夹g(shù)可以提升智算中心園區(qū)綠色化水平。小型智算中心還可以利用模塊化氫燃料電池、太陽(yáng)能板房等技術(shù)優(yōu)化能源供給格局。
應(yīng)用篇
在識(shí)別檢測(cè)、語(yǔ)音交互、智能客服等智能應(yīng)用在各行業(yè)領(lǐng)域得到了廣泛使用,以自動(dòng)駕駛為代表的高算力需求場(chǎng)景從實(shí)驗(yàn)環(huán)境逐步走向試點(diǎn)應(yīng)用階段,而以元宇宙、智慧科研(AI for Science)為代表的新興場(chǎng)景也逐漸走進(jìn)大眾視野,并帶來無限發(fā)展可能。
作為支撐人工智能應(yīng)用的關(guān)鍵基礎(chǔ)設(shè)施,智算中心匯聚數(shù)據(jù)、算力、算法等要素,通過生產(chǎn)算力、聚合算力、調(diào)度算力、釋放算力等關(guān)鍵環(huán)節(jié),實(shí)現(xiàn)“以數(shù)據(jù)輸入,讓智能輸出”,助力AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化,讓智能計(jì)算真正惠及經(jīng)濟(jì)社會(huì)發(fā)展。
一、智算中心激發(fā)AI產(chǎn)業(yè)化創(chuàng)新活力
(一)自動(dòng)駕駛
自動(dòng)駕駛是汽車智能化和自動(dòng)化的高級(jí)形態(tài),作為AI技術(shù)備受關(guān)注的重要落腳點(diǎn),被公認(rèn)是汽車出行產(chǎn)業(yè)的未來方向之一。自動(dòng)駕駛場(chǎng)景的實(shí)現(xiàn),需要通過感知融合、虛擬路測(cè)(模擬仿真)、高精地圖、車路協(xié)同等核心技術(shù)將數(shù)字世界與實(shí)體路況進(jìn)行深度融合,基于人工智能技術(shù),讓車輛能夠像人類駕駛員一樣準(zhǔn)確地識(shí)別車道、行人、障礙物等駕駛環(huán)境中的關(guān)鍵信息,并及時(shí)對(duì)周圍運(yùn)動(dòng)單元的潛在軌跡做出預(yù)判。
自動(dòng)駕駛落地需要超大AI算力支持自動(dòng)駕駛需要通過對(duì)車身多個(gè)傳感器的數(shù)據(jù)進(jìn)行感知和融合,并在此基礎(chǔ)上對(duì)自動(dòng)駕駛車輛的行為進(jìn)行決策和控制,其中涉及大量AI算法、機(jī)器視覺與傳感器數(shù)據(jù)整合分析、面向各類算力平臺(tái)及傳感器配置方案的適配能力等。
為了提升自動(dòng)駕駛系統(tǒng)的感知和決策性能,當(dāng)前通行的做法是在數(shù)據(jù)中心端基于海量的道路采集數(shù)據(jù)來進(jìn)行感知模型訓(xùn)練和仿真測(cè)試。隨著AI技術(shù)的發(fā)展,通過AI算法對(duì)多傳感器的數(shù)據(jù)以及多模態(tài)的數(shù)據(jù)進(jìn)行融合感知,已經(jīng)成為了當(dāng)前主流的發(fā)展趨勢(shì)。另外自監(jiān)督大模型的技術(shù)也在逐步地引入到自動(dòng)駕駛場(chǎng)景中。
這都使得自動(dòng)駕駛感知模型的訓(xùn)練算力消耗遠(yuǎn)大于一般的計(jì)算機(jī)視覺感知模型。比如,Tesla構(gòu)建的L2級(jí)別的FSD自動(dòng)駕駛?cè)诤细兄P偷挠?xùn)練使用了百萬量級(jí)的道路采集視頻片段,算力投入約為500PD。隨著自動(dòng)駕駛級(jí)別從L2到L4的提升,對(duì)算力的需求將進(jìn)一步提高。
算力供給是自動(dòng)駕駛系統(tǒng)得以大規(guī)模落地和進(jìn)一步商業(yè)化的前提條件。自動(dòng)駕駛產(chǎn)業(yè)的集成化、規(guī)模化發(fā)展需要由智算中心提供超大算力、先進(jìn)AI算法等支撐。智算中心提供的普惠算力可以極大降低自動(dòng)駕駛所需算力的成本,同時(shí)加速自動(dòng)駕駛新技術(shù)與新產(chǎn)品的研發(fā)、測(cè)試和應(yīng)用。
(二)機(jī)器人
機(jī)器人是人工智能技術(shù)多領(lǐng)域應(yīng)用的重要載體,主要分為工業(yè)機(jī)器人、服務(wù)機(jī)器人和特種機(jī)器人。作為一種重要的智能硬件,隨著計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)、智能語(yǔ)音等多種智能算法技術(shù)的進(jìn)步,機(jī)器人產(chǎn)業(yè)也將實(shí)現(xiàn)飛速的發(fā)展。
《中國(guó)機(jī)器人產(chǎn)業(yè)發(fā)展報(bào)告(2022年)》數(shù)據(jù)顯示,2022年中國(guó)機(jī)器人市場(chǎng)規(guī)模約為174億美元,五年年均增長(zhǎng)率達(dá)到22%,其中工業(yè)機(jī)器人和服務(wù)機(jī)器人市場(chǎng)規(guī)模均保持增長(zhǎng),二者呈現(xiàn)出齊頭并進(jìn)、快速發(fā)展的態(tài)勢(shì)。
“AI算法+AI算力”支撐機(jī)器人從量變到質(zhì)變機(jī)器人與新一代信息技術(shù)的融合逐漸深入,機(jī)器人的感知、計(jì)算、執(zhí)行能力都得到了大幅提升,處理實(shí)際問題的穩(wěn)定性和可靠性也進(jìn)一步提高,這背后離不開人工智能技術(shù)和強(qiáng)大算力的支撐。機(jī)器人需要和環(huán)境進(jìn)行交互感知以及決策控制,和環(huán)境的交互感知不僅涉及到視覺、聽覺等多個(gè)模態(tài),也會(huì)涉及到不同模態(tài)的感知融合,這都需要AI算法作為底層支撐。為了實(shí)現(xiàn)相應(yīng)的感知和決策算法,一般會(huì)在數(shù)據(jù)中心端構(gòu)建真實(shí)世界數(shù)據(jù)采集→AI模型構(gòu)建→孿生世界的決策控制模型訓(xùn)練→真實(shí)世界驗(yàn)證測(cè)試的閉環(huán),來逐步地提升機(jī)器人在真實(shí)世界的感知和決策能力。
用于學(xué)習(xí)和訓(xùn)練的數(shù)據(jù)越多,算法迭代得越完善,機(jī)器人的決策準(zhǔn)確度將越高。智算中心的算力服務(wù)可以為機(jī)器人的大規(guī)模模型訓(xùn)練和預(yù)測(cè)提供強(qiáng)大算力支撐,智算中心的算法服務(wù)可以實(shí)現(xiàn)機(jī)器人智能化應(yīng)用算法模型的敏捷開發(fā)和快速訓(xùn)練上線,為機(jī)器人產(chǎn)業(yè)的高質(zhì)量發(fā)展提供全方位支撐。
(三)元宇宙
元宇宙是基于數(shù)字技術(shù)進(jìn)行創(chuàng)造和連接,與現(xiàn)實(shí)空間映射交互形成的虛擬空間,是整合多種新技術(shù)而產(chǎn)生的下一代互聯(lián)網(wǎng)應(yīng)用和數(shù)字形態(tài)的新型社會(huì)體系。元宇宙在5G、人工智能、物聯(lián)網(wǎng)、AR/VR、云計(jì)算、區(qū)塊鏈等技術(shù)及產(chǎn)品的支持下,為現(xiàn)實(shí)世界構(gòu)建數(shù)字化虛擬平行世界,為用戶提供沉浸式交互體驗(yàn),大幅提升各行業(yè)生產(chǎn)效率。
智算中心是支撐元宇宙實(shí)現(xiàn)的關(guān)鍵基礎(chǔ)設(shè)施元宇宙的沉浸式體驗(yàn)離不開擴(kuò)展現(xiàn)實(shí)、人工智能、區(qū)塊鏈等元宇宙核心技術(shù)的支持,對(duì)系統(tǒng)的計(jì)算、存儲(chǔ)、帶寬、功耗等都提出了極高的要求,其所需消耗的算力資源也是巨量的。
元宇宙的協(xié)同創(chuàng)建、高精仿真、實(shí)時(shí)渲染、智能交互等環(huán)節(jié)都需要大量算力做支撐,想要真正邁入虛擬和現(xiàn)實(shí)融合的3D互聯(lián)網(wǎng)時(shí)代,元宇宙對(duì)算力的需求將呈指數(shù)級(jí)增長(zhǎng),這遠(yuǎn)遠(yuǎn)超過了通用CPU的發(fā)展速度。傳統(tǒng)以提升CPU時(shí)鐘頻率和內(nèi)核數(shù)量來提高計(jì)算性能的方式遇到了瓶頸,形成了巨大的算力缺口。元宇宙從本質(zhì)上看是對(duì)算力的重構(gòu),這部分算力缺口需要由智算中心來彌補(bǔ),從而不斷提升元宇宙場(chǎng)景的性能和能效。
1.虛擬數(shù)字人
虛擬數(shù)字人是可以感知、規(guī)劃、行動(dòng)的虛擬形象,由計(jì)算機(jī)圖形學(xué)、圖形渲染、動(dòng)作捕捉、深度學(xué)習(xí)、語(yǔ)音合成等技術(shù)生成,具備類人外貌、交互能力等高度擬人化特征,是元宇宙的重要組成部分。虛擬數(shù)字人正逐步“闖入”現(xiàn)實(shí)虛擬數(shù)字人的應(yīng)用領(lǐng)域非常廣泛,按照應(yīng)用場(chǎng)景或行業(yè)的不同,已經(jīng)出現(xiàn)了虛擬主播、虛擬偶像等娛樂型數(shù)字人,虛擬教師等教育型數(shù)字人,虛擬客服、虛擬導(dǎo)游等助手型數(shù)字人,替身演員、虛擬演員等影視數(shù)字人應(yīng)用。據(jù)《虛擬數(shù)字人深度產(chǎn)業(yè)報(bào)告》預(yù)測(cè),2030年我國(guó)虛擬數(shù)字人整體市場(chǎng)規(guī)模將達(dá)到2,700億元。
智算中心助力虛擬數(shù)字人應(yīng)對(duì)AI算力和算法挑戰(zhàn)虛擬數(shù)字人相關(guān)的建模、驅(qū)動(dòng)、渲染和感知交互均需要巨量的算力支撐。當(dāng)前,虛擬數(shù)字人的建模以基于3D建模軟件的手工建模+真人驅(qū)動(dòng)為主。
隨著AIGC等AI技術(shù)的應(yīng)用,基于AI算法的自動(dòng)建模將逐步替代手工建模,成為數(shù)字人建模的主要方式。與此同時(shí),基于AI算法的數(shù)字人驅(qū)動(dòng)也將逐步替代當(dāng)前以“中之人”驅(qū)動(dòng)為主的真人驅(qū)動(dòng)方式。與此同時(shí),視覺感知、語(yǔ)音識(shí)別和語(yǔ)音合成以及自然語(yǔ)言處理等多種AI算法在數(shù)字人中的應(yīng)用,將推動(dòng)數(shù)字人向“數(shù)智人”轉(zhuǎn)變,也是虛擬數(shù)字人應(yīng)用普及的關(guān)鍵。智算中心可以為虛擬數(shù)字人制作、感知交互提供強(qiáng)大的算力和算法支撐,加速虛擬數(shù)字人產(chǎn)業(yè)的商業(yè)化落地。
2.?dāng)?shù)字孿生
數(shù)字孿生是指充分利用物理模型、傳感器、運(yùn)行歷史等數(shù)據(jù),集成多學(xué)科、多尺度的仿真過程,以數(shù)字化方式創(chuàng)建物理實(shí)體的虛擬鏡像,通過模擬、驗(yàn)證、預(yù)測(cè)和控制物理實(shí)體全生命周期行為,實(shí)現(xiàn)在物理空間的最優(yōu)決策。數(shù)字孿生是構(gòu)建元宇宙數(shù)字空間的基礎(chǔ)數(shù)字孿生在元宇宙的發(fā)展進(jìn)程中扮演著重要角色,是元宇宙耦合物理世界的基石。
元宇宙的目標(biāo)是構(gòu)建一個(gè)與現(xiàn)實(shí)物理世界高度貼合的甚至是超越現(xiàn)實(shí)世界的虛擬世界,因此需要通過海量數(shù)據(jù)模擬和強(qiáng)大算力來實(shí)現(xiàn)1:1的數(shù)字空間創(chuàng)造,這個(gè)過程中的核心關(guān)鍵就是數(shù)字孿生。數(shù)字孿生技術(shù)能夠以極致細(xì)節(jié)的方式將現(xiàn)實(shí)世界映射到虛擬世界中。因此,數(shù)字孿生技術(shù)的成熟度在一定程度上決定了元宇宙在虛實(shí)映射與虛實(shí)交互上的發(fā)展?jié)摿Α?/span>
強(qiáng)大算力是數(shù)字孿生高效穩(wěn)定運(yùn)行的重要支撐數(shù)字孿生的應(yīng)用十分廣泛。例如,數(shù)字孿生城市可以在虛擬世界模擬仿真城市管理、產(chǎn)業(yè)發(fā)展、消防應(yīng)急、環(huán)境變化等情況,為現(xiàn)實(shí)中關(guān)鍵問題的決策提供技術(shù)支撐,提升城市規(guī)劃和城市治理的效率和精準(zhǔn)度。
在元宇宙中,大規(guī)模、高度復(fù)雜的數(shù)字孿生空間的構(gòu)建,以及現(xiàn)實(shí)世界和數(shù)字世界的實(shí)時(shí)交互,需要有強(qiáng)大且物理準(zhǔn)確的高精度仿真算力和實(shí)時(shí)高清3D渲染算力作為支撐。隨著AI技術(shù)的發(fā)展,基于AI算法的高精仿真逐步替代了傳統(tǒng)基于數(shù)值求解算法的仿真系統(tǒng),成為了數(shù)字孿生系統(tǒng)的核心底層支撐技術(shù)。智算中心可以為大規(guī)模數(shù)字孿生提供專業(yè)化的算力和應(yīng)用支持,支撐數(shù)字孿生空間的實(shí)時(shí)創(chuàng)建、復(fù)雜模型的高效運(yùn)行,以及逼真仿真環(huán)境的快速生成。
二、智算中心助力產(chǎn)業(yè)AI化走深向?qū)?/span>
(一)智慧醫(yī)療
國(guó)家統(tǒng)計(jì)局《2021年國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展統(tǒng)計(jì)公報(bào)》顯示,2021年全年總診療人次85.3億人次,基本醫(yī)療保險(xiǎn)覆蓋13.6億人。然而,各個(gè)地區(qū)醫(yī)療服務(wù)水平參差不齊,醫(yī)療服務(wù)資源不均等現(xiàn)象普遍存在,基層患者尤其是偏遠(yuǎn)地區(qū)的患者難以獲得高質(zhì)量的醫(yī)療救治。
AI輔助診斷助力解決診療“三大難題”當(dāng)前,醫(yī)療診斷主要面臨三大挑戰(zhàn):
一是數(shù)據(jù)量巨大。粗略估算診療人次所對(duì)應(yīng)的就醫(yī)環(huán)節(jié)及相應(yīng)的醫(yī)療數(shù)據(jù)質(zhì)量,加上血壓、心率、體重、心電圖等醫(yī)療監(jiān)測(cè)數(shù)據(jù),規(guī)模早已突破TB級(jí),并且以“秒”為單位持續(xù)更新疊加,需要強(qiáng)有力的算力支撐平臺(tái)。
二是數(shù)據(jù)結(jié)構(gòu)多元。不僅包含大量醫(yī)學(xué)術(shù)語(yǔ)、專業(yè)名稱,還包括文檔、影像、視頻等非結(jié)構(gòu)化數(shù)據(jù),對(duì)AI服務(wù)器等新型智能計(jì)算硬件要求較高。
三是數(shù)據(jù)實(shí)時(shí)處理要求高。醫(yī)療服務(wù)中存在大量時(shí)間性強(qiáng)和決策周期短的應(yīng)用場(chǎng)景,如臨床中的診療和用藥建議、健康指標(biāo)預(yù)警等,對(duì)在線計(jì)算、實(shí)時(shí)處理的需求顯著,亟需構(gòu)建強(qiáng)大的算力平臺(tái)支撐基于醫(yī)療健康領(lǐng)域數(shù)據(jù)規(guī)?;R(shí)圖譜。
醫(yī)療機(jī)構(gòu)通過引入AI輔助診療,可實(shí)現(xiàn)診斷、治療工作的智能化。從算力需求看,人工智能輔助診療應(yīng)用涉及海量圖形數(shù)據(jù)的處理,所需的算力要求較高。智算中心具備的強(qiáng)大算力可以支持大規(guī)模、高難度的模型訓(xùn)練,全方位支撐海量醫(yī)療影像數(shù)據(jù)的分析挖掘和精準(zhǔn)診斷,能夠有效縮短診斷時(shí)間,提高診療效率。
(二)文娛創(chuàng)作
近年來,AI在文娛創(chuàng)作方面有諸多突破,通過融合人工智能、認(rèn)知心理學(xué)、哲學(xué)和藝術(shù)等多個(gè)學(xué)科,可完成詩(shī)詞、繪畫、音樂、影視、小說等創(chuàng)作。
人工智能正在逐漸改變文娛創(chuàng)作的發(fā)展范式對(duì)藝術(shù)家來說,靈感極為可貴并難以捕捉,當(dāng)文娛創(chuàng)作遇上人工智能,整個(gè)行業(yè)迸發(fā)出了全新的生機(jī)和活力。AI技術(shù)將是未來數(shù)字化創(chuàng)作的重要生產(chǎn)工具。當(dāng)前出現(xiàn)的創(chuàng)作生態(tài)可分為專業(yè)生成內(nèi)容(Professionally Generated Content,簡(jiǎn)稱PGC)、用戶生成內(nèi)容(User Generated Content,簡(jiǎn)稱UGC)、AI輔助生產(chǎn)內(nèi)容和AIGC。

其中,PGC和UGC都是以人為主體的創(chuàng)作模式,PGC是由專業(yè)人士進(jìn)行內(nèi)容創(chuàng)作,成本較高且產(chǎn)能有限;UGC降低了生產(chǎn)成本,滿足了個(gè)性化需求,但存在不可控因素。從長(zhǎng)期來看,數(shù)字內(nèi)容生成的需求會(huì)愈發(fā)強(qiáng)烈,但是人腦處理信息的能力有限,當(dāng)以人力為主的內(nèi)容生產(chǎn)潛力逐漸消耗殆盡,以AI為主的內(nèi)容生產(chǎn)模式將彌補(bǔ)數(shù)字世界內(nèi)容供需的缺口。Gartner數(shù)據(jù)顯示,到2023年將有20%的內(nèi)容由AI創(chuàng)作生成,預(yù)計(jì)到2025年生成式AI產(chǎn)生的數(shù)據(jù)將占所有數(shù)據(jù)的10%。
AIGC將成為數(shù)字內(nèi)容生產(chǎn)的長(zhǎng)期發(fā)展方向AIGC是一種通過生成對(duì)抗網(wǎng)絡(luò)、深度學(xué)習(xí)、大型預(yù)訓(xùn)練模型等人工智能技術(shù)挖掘數(shù)據(jù)中的規(guī)律,并通過適當(dāng)?shù)姆夯芰ι上嚓P(guān)內(nèi)容的技術(shù)。深度學(xué)習(xí)技術(shù)(如深度學(xué)習(xí)模型CLIP等)的突破為AIGC商業(yè)落地提供了可能,而數(shù)字內(nèi)容、數(shù)字資產(chǎn)等的快速發(fā)展又進(jìn)一步加速了AIGC的應(yīng)用與優(yōu)化。
利用AIGC技術(shù)可以生成多種模態(tài)的數(shù)字作品,如AI寫作(文本)、AI繪畫(圖像)、AI作曲(音頻)、AI換臉(視頻)等。同時(shí),AIGC技術(shù)也可以實(shí)現(xiàn)由文字生成圖像、文字生成視頻、圖像/視頻生成文字等跨模態(tài)創(chuàng)作,以及Game AI等各類綜合型場(chǎng)景創(chuàng)作。AIGC的出現(xiàn)使數(shù)字內(nèi)容創(chuàng)作的生產(chǎn)效率和互動(dòng)性得到了進(jìn)一步提升。隨著人工智能技術(shù)的不斷升級(jí)以及算力、數(shù)據(jù)、算法等要素的持續(xù)迭代,未來AIGC技術(shù)將持續(xù)賦
能各類文化創(chuàng)意、生產(chǎn)生活,為數(shù)字內(nèi)容生產(chǎn)帶來巨大變革。AI大模型和開放平臺(tái)為文娛創(chuàng)作提供技術(shù)支撐隨著各類AI大模型及支持開發(fā)者創(chuàng)作的各類AI開源平臺(tái)的陸續(xù)上線,用戶可以獲取涵蓋開源模型API、高質(zhì)量中文數(shù)據(jù)集、模型訓(xùn)練代碼、推理代碼、應(yīng)用代碼、面向AI芯片的模型移植開發(fā)等內(nèi)容的多場(chǎng)景服務(wù)。
大模型開放平臺(tái)的出現(xiàn)極大地降低了文娛類AI應(yīng)用的開發(fā)門檻,即使是幾乎沒有任何編程經(jīng)驗(yàn)的文娛創(chuàng)作者,通過在平臺(tái)上進(jìn)行簡(jiǎn)單學(xué)習(xí),也可以快速實(shí)現(xiàn)文娛類AI應(yīng)用的開發(fā)。AI大模型和AI開源平臺(tái)作為智算中心算法基建化的重要構(gòu)成,配合其強(qiáng)大的算力資源,將為創(chuàng)作者打造一片創(chuàng)作的樂土。
(三)智慧科研
AI技術(shù)成為繼計(jì)算機(jī)之后,科學(xué)家新的生產(chǎn)工具,并催生出了新的科研范式AI for Science??茖W(xué)家們用AI技術(shù)去學(xué)習(xí)科學(xué)原理,根據(jù)實(shí)驗(yàn)或者計(jì)算產(chǎn)生的數(shù)據(jù)對(duì)所求解的科學(xué)問題進(jìn)行建模,從而使復(fù)雜問題得到有效解決。近年來,AI也被證明能用來做規(guī)律發(fā)現(xiàn),幫助人類從大量的復(fù)雜數(shù)據(jù)中,抽取一些人類觀察不到的高維信息和高價(jià)值規(guī)律,不僅在應(yīng)用科學(xué)領(lǐng)域,也能在自然科學(xué)領(lǐng)域發(fā)揮作用。AI for Science 不僅帶來了科研效率的顯著提升,還能降低科研成本,讓更多人都能參與到科學(xué)研究中來。
1.生命科學(xué)
隨著大數(shù)據(jù)和人工智能的發(fā)展、普及和成熟,越來越多的科學(xué)研究從假設(shè)推動(dòng)的范式向數(shù)據(jù)驅(qū)動(dòng)的范式轉(zhuǎn)變,利用大數(shù)據(jù)和計(jì)算機(jī)技術(shù)挖掘科學(xué)洞見。在生命科學(xué)領(lǐng)域,通過采用深度學(xué)習(xí)方法處理海量數(shù)據(jù),已經(jīng)在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)等領(lǐng)域?qū)崿F(xiàn)了落地應(yīng)用。
蛋白質(zhì)作為生命活動(dòng)的主要承擔(dān)者,長(zhǎng)期以來都是生命科學(xué)工作者研究的重點(diǎn),其中確定蛋白質(zhì)的三維空間結(jié)構(gòu)尤為重要。受困于計(jì)算量龐大、計(jì)算準(zhǔn)確度有限,蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)領(lǐng)域近年來進(jìn)展較為緩慢。
采用傳統(tǒng)的冷凍電鏡三維重構(gòu)方法,實(shí)驗(yàn)儀器昂貴,且圖像重構(gòu)需要耗費(fèi)大量計(jì)算力,而采用傳統(tǒng)的分子動(dòng)力學(xué)結(jié)構(gòu)預(yù)測(cè)計(jì)算方案,在平均10300的搜索空間枚舉蛋白質(zhì)的可能構(gòu)型,需要極高的算力和漫長(zhǎng)的計(jì)算時(shí)間,因此在過去50年的時(shí)間,僅有17%的人類蛋白質(zhì)組得到結(jié)構(gòu)解析。
在智能算力的支持下,DeepMind開發(fā)了基于注意力機(jī)制深度神經(jīng)網(wǎng)絡(luò)的AlphaFold2模型,通過對(duì)當(dāng)前已經(jīng)測(cè)序的數(shù)十萬蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)和數(shù)百萬蛋白質(zhì)序列數(shù)據(jù)進(jìn)行學(xué)習(xí),實(shí)現(xiàn)了端到端直接預(yù)測(cè)蛋白質(zhì)的三維結(jié)構(gòu),并取得了突破性進(jìn)展,預(yù)測(cè)結(jié)果準(zhǔn)確率達(dá)到了92.4%。相較于使用費(fèi)用高昂的實(shí)驗(yàn)儀器,單個(gè)蛋白結(jié)構(gòu)的預(yù)測(cè)時(shí)間縮短到了分鐘級(jí)。AlphaFold2的開發(fā)是以巨量算力為支撐,具體來說,其訓(xùn)練數(shù)據(jù)準(zhǔn)備消耗了約2億核時(shí)的CPU算力,訓(xùn)練過程消耗了約300PD的AI算力。
2.大規(guī)模分子模擬
分子動(dòng)力學(xué)模擬通過求解原子運(yùn)動(dòng)的經(jīng)典力學(xué)牛頓方程對(duì)相空間進(jìn)行采樣,可以研究體系在相空間的演化過程,還可以通過統(tǒng)計(jì)方法得到體系在非零溫度下的各種性質(zhì),是當(dāng)前材料和生物化學(xué)領(lǐng)域最常用的計(jì)算研究方法之一。
近年來,借助神經(jīng)網(wǎng)絡(luò)從大量數(shù)據(jù)中獲得規(guī)律的優(yōu)勢(shì),將第一性原理計(jì)算結(jié)果作為訓(xùn)練數(shù)據(jù),利用神經(jīng)網(wǎng)絡(luò)訓(xùn)練構(gòu)建勢(shì)函數(shù)的方法引起了廣泛的關(guān)注。該系列方法從上世紀(jì)90年代開始,經(jīng)過二十多年的發(fā)展,在準(zhǔn)確性、可擴(kuò)展性等方面得到了提升,比較常用的方法有DeePMD、SchNet、GAP、MTP等。
2020年深度勢(shì)能(DP)團(tuán)隊(duì)因“結(jié)合分子建模、機(jī)器學(xué)習(xí)和高性能計(jì)算相關(guān)方法,將具有從頭算精度的分子動(dòng)力學(xué)模擬的極限提升至1億個(gè)原子規(guī)?!?,斬獲了當(dāng)年的戈登·貝爾獎(jiǎng)(Gordon Bell Prize)。原子間機(jī)器學(xué)習(xí)勢(shì)函數(shù)已經(jīng)應(yīng)用于許多實(shí)際研究中,可以用于模擬復(fù)雜的、多元素的晶體、非晶、液晶、界面、缺陷和摻雜等實(shí)驗(yàn)體系,計(jì)算精度接近從頭算,計(jì)算速度卻可以比從頭算快數(shù)百到上千倍。
3.?dāng)?shù)值計(jì)算
矩陣乘法是許多計(jì)算任務(wù)的核心,其中包括神經(jīng)網(wǎng)絡(luò)、3D圖形和數(shù)據(jù)壓縮等。因此,提高矩陣乘法效率將直接作用于許多應(yīng)用。幾個(gè)世紀(jì)以來,數(shù)學(xué)家認(rèn)為標(biāo)準(zhǔn)矩陣乘法算法是效率最高的算法,但在1969年,德國(guó)數(shù)學(xué)家Volken Strassen通過研究非常小的矩陣(大小為2x2)證明確實(shí)存在更好的算法。然而,更大矩陣相乘的高效算法仍屬于尚未攻克的難題。
DeepMind的最新研究探討了現(xiàn)代AI技術(shù)——強(qiáng)化學(xué)習(xí)如何推動(dòng)新矩陣乘法算法的自動(dòng)發(fā)現(xiàn)?;舅悸肥菍l(fā)現(xiàn)矩陣乘法高效算法的問題轉(zhuǎn)換為單人游戲,然后訓(xùn)練一個(gè)基于強(qiáng)化學(xué)習(xí)的智能體 AlphaTensor 來玩這個(gè)游戲,通過對(duì) AlphaTensor進(jìn)行調(diào)整,專門用以發(fā)現(xiàn)在給定硬件(如 NVIDIA V100 GPU、Google TPU v2)上運(yùn)行速度快的算法。實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),這些算法在相同硬件上進(jìn)行大矩陣相乘的速度比常用算法快了10-20%,表明AlphaTensor在優(yōu)化任意目標(biāo)方面具備了不錯(cuò)的靈活性。因此,強(qiáng)化學(xué)習(xí)成為加速新矩陣乘法算法自動(dòng)發(fā)現(xiàn)的一種新思路。
從算力需求看,蛋白質(zhì)結(jié)構(gòu)分析、大規(guī)模分子模擬、數(shù)值計(jì)算相關(guān)應(yīng)用主要涉及海量數(shù)據(jù)并行計(jì)算和大規(guī)模模擬實(shí)驗(yàn),對(duì)算力和存力需求較高,屬于計(jì)算密集型和數(shù)據(jù)密集型任務(wù)。智算中心所具備的算力服務(wù)能力極度契合AI for Science相關(guān)場(chǎng)景的算力需求,將成為支撐科研高質(zhì)量、突破式發(fā)展的重要基礎(chǔ)設(shè)施。



建設(shè)篇
從建設(shè)用途來看,智算中心除充分考慮其普惠性、開放性和集約性外,核心是以高質(zhì)量、低成本、高性能的AI算力來支撐產(chǎn)業(yè)創(chuàng)新、城市發(fā)展中的各項(xiàng)智能服務(wù)。智算中心建設(shè)以總體規(guī)劃、政企協(xié)同、需求牽引為宗旨,聚焦先進(jìn)的技術(shù)和適配典型場(chǎng)景。同時(shí),以智算中心建設(shè)和應(yīng)用帶動(dòng)人工智能產(chǎn)業(yè)集群的匯聚,吸引數(shù)字化人才,激發(fā)人工智能產(chǎn)業(yè)的創(chuàng)新活力,推動(dòng)人工智能產(chǎn)業(yè)和區(qū)域經(jīng)濟(jì)的可持續(xù)發(fā)展。
一、建設(shè)類型與策略
智算中心建設(shè)并非簡(jiǎn)單做好基建即可,還需結(jié)合建設(shè)基礎(chǔ)、當(dāng)?shù)鼗騾^(qū)域產(chǎn)業(yè)特色,以差異化算力需求為導(dǎo)向,分類引導(dǎo)施策,優(yōu)化建設(shè)方式,改建并行,發(fā)展與數(shù)字經(jīng)濟(jì)相適應(yīng)的智算中心。
(一)建設(shè)原則
政府引導(dǎo),需求牽引。以政府側(cè)和市場(chǎng)側(cè)實(shí)際需求為牽引,以高標(biāo)準(zhǔn)建設(shè)、可持續(xù)發(fā)展為路徑,改造存量與優(yōu)化增量協(xié)同推進(jìn),引導(dǎo)龍頭企業(yè)建設(shè)高附加值、產(chǎn)業(yè)鏈帶動(dòng)效應(yīng)明顯的重點(diǎn)項(xiàng)目。
開放多元、培育生態(tài)。以開放計(jì)算為核心,以多元算力融合為方向,推進(jìn)智算產(chǎn)業(yè)核心關(guān)鍵技術(shù)的研發(fā)標(biāo)準(zhǔn)化、產(chǎn)業(yè)化和應(yīng)用迭代。加強(qiáng)對(duì)智算中心關(guān)鍵軟硬件產(chǎn)品的研發(fā)支持和大規(guī)模應(yīng)用推廣,突破關(guān)鍵核心技術(shù),提升智能算力全產(chǎn)業(yè)鏈自主創(chuàng)新能力。
普適普惠、創(chuàng)新發(fā)展。以融合架構(gòu)計(jì)算系統(tǒng)為平臺(tái),以數(shù)據(jù)為資源,以強(qiáng)大的計(jì)算力驅(qū)動(dòng)AI模型對(duì)數(shù)據(jù)進(jìn)行深度加工,使智能算力可以像水電一樣,成為社會(huì)基本公共服務(wù),面向城市各領(lǐng)域應(yīng)用提供高品質(zhì)智算服務(wù)。
集約高效、節(jié)能降碳。堅(jiān)持集約化、規(guī)?;ㄔO(shè)方向,加快節(jié)能低碳技術(shù)研發(fā)應(yīng)用,提升可再生能源利用率,應(yīng)用節(jié)能新技術(shù),減少碳排放,推進(jìn)智算中心綠色、高質(zhì)量發(fā)展。
(二)依據(jù)建設(shè)方式分類建設(shè)
1.新建智算中心
(1)建設(shè)條件
面向京津冀、長(zhǎng)三角、粵港澳大灣區(qū)、成渝,以及貴州、內(nèi)蒙古、甘肅、寧夏等全國(guó)一體化算力網(wǎng)絡(luò)國(guó)家樞紐節(jié)點(diǎn)和數(shù)據(jù)中心集群,以及人工智能產(chǎn)業(yè)領(lǐng)域應(yīng)用場(chǎng)景多元和科教資源豐富的優(yōu)勢(shì)地區(qū),建設(shè)智算中心,以智算中心為牽引推動(dòng)人工智能領(lǐng)域創(chuàng)新要素集聚,打造人工智能產(chǎn)業(yè)生態(tài)圈。新建智算中心作為新型公共算力基礎(chǔ)設(shè)施和賦能平臺(tái),應(yīng)支撐國(guó)家和區(qū)域內(nèi)重要需求、科研創(chuàng)新和戰(zhàn)略任務(wù)落地,為AI大模型訓(xùn)練、自動(dòng)駕駛、生物工程、智能制造、數(shù)字孿生、空間地理等人工智能探索應(yīng)用提供強(qiáng)大的智能算力服務(wù),通過智能算力服務(wù)賦能產(chǎn)業(yè)升級(jí),帶動(dòng)區(qū)域經(jīng)濟(jì)發(fā)展。
(2)建設(shè)方式與策略
加快梯次布局,打造一批城市級(jí)智算中心。對(duì)于產(chǎn)業(yè)智能化發(fā)展需求迫切、人工智能產(chǎn)業(yè)集聚的地區(qū),可新建圍繞人工智能產(chǎn)業(yè)需求設(shè)計(jì)、為人工智能提供專門服務(wù)的智算中心,按照適度超前原則配置優(yōu)質(zhì)算力資源,提供兼具公有、專用、彈性計(jì)算的服務(wù)能力,滿足不同應(yīng)用場(chǎng)景和多類型用戶的需求,面向當(dāng)?shù)仄髽I(yè)、科研院所等提供科研創(chuàng)新、人才培養(yǎng)、應(yīng)用孵化、產(chǎn)業(yè)發(fā)展等服務(wù),打造“易用”“好用”的智算中心。
強(qiáng)化普惠智能算力高質(zhì)量供給,降低算力使用門檻,推動(dòng)智能算力服務(wù)與物聯(lián)網(wǎng)和區(qū)塊鏈等技術(shù)融合創(chuàng)新,打造具有地方特色服務(wù)本地輻射周邊的智算中心。加強(qiáng)場(chǎng)景賦能,按需建設(shè)專業(yè)型智算中心。開展面向性能、價(jià)格、效益等多方面的測(cè)算,形成應(yīng)用需求供給和可持續(xù)的長(zhǎng)效動(dòng)力機(jī)制,加快重點(diǎn)行業(yè)的智算中心建設(shè),圍繞智能經(jīng)濟(jì)、智能社會(huì)、科研活動(dòng)、國(guó)家重大活動(dòng)和重大工程等領(lǐng)域的人工智能創(chuàng)新應(yīng)用場(chǎng)景,加強(qiáng)供需對(duì)接,打造特色場(chǎng)景智算中心,發(fā)揮倍增效應(yīng),做大做強(qiáng)形成規(guī)?;瘧?yīng)用,帶動(dòng)人工智能和相關(guān)產(chǎn)業(yè)發(fā)展。
2.已建數(shù)據(jù)中心升級(jí)
(1)建設(shè)條件
面向北京、上海、廣州以及東部經(jīng)濟(jì)發(fā)達(dá)、人口密度大,對(duì)數(shù)據(jù)要素的產(chǎn)生、存儲(chǔ)和處理需求高,但面臨地區(qū)能耗指標(biāo)緊張、電力成本高、大規(guī)模數(shù)據(jù)中心開發(fā)空間受限等問題的地區(qū),對(duì)已建數(shù)據(jù)中心進(jìn)行智能化改造,推動(dòng)傳統(tǒng)數(shù)據(jù)中心向綠色高效、智能集約轉(zhuǎn)型升級(jí)。改造升級(jí)后的智算中心應(yīng)優(yōu)先滿足國(guó)家及當(dāng)?shù)卣?wù)服務(wù)、重大項(xiàng)目及重點(diǎn)實(shí)驗(yàn)室的熱數(shù)據(jù)處理和匯聚需求,保障城市基本運(yùn)行和高效治理需求,保障金融、通信、互聯(lián)網(wǎng)等戰(zhàn)略性行業(yè)數(shù)據(jù)匯集和實(shí)時(shí)響應(yīng)計(jì)算需求,保障科技賦能和產(chǎn)業(yè)創(chuàng)新高性能算力需求。
(2)建設(shè)方式與策略
以“以舊換新、增減替代”為原則,對(duì)已建存量數(shù)據(jù)中心進(jìn)行改造升級(jí),加強(qiáng)AI和傳統(tǒng)計(jì)算的融合。重點(diǎn)將一些冷數(shù)據(jù)、靜態(tài)備份數(shù)據(jù)為主的存儲(chǔ)類數(shù)據(jù)中心,替換為支撐數(shù)字經(jīng)濟(jì)、人工智能、區(qū)塊鏈、工業(yè)互聯(lián)網(wǎng)等前沿產(chǎn)業(yè)發(fā)展的智算中心。適度利用關(guān)閉及騰退的其他老舊落后的自用型數(shù)據(jù)中心、存儲(chǔ)型數(shù)據(jù)中心、容災(zāi)備份中心資源和空間,升級(jí)改造為支撐低時(shí)延業(yè)務(wù)應(yīng)用,服務(wù)智慧城市、車聯(lián)網(wǎng)等重點(diǎn)應(yīng)用場(chǎng)景落地。
加快傳統(tǒng)數(shù)據(jù)中心節(jié)能低碳技術(shù)研發(fā)推廣,提升資源能源利用效率。智算中心具備高功率密度屬性,在制冷方面具有更高的要求。目前大多數(shù)AI服務(wù)器采用的仍是常規(guī)風(fēng)冷模式,部分超過30kW的數(shù)據(jù)中心采用液冷模式。隨著AI服務(wù)器功率密度的提升和使用場(chǎng)景的增多,需要在推動(dòng)已建老舊小散數(shù)據(jù)中心向規(guī)?;瘮?shù)據(jù)中心集群或智能化計(jì)算中心轉(zhuǎn)型升級(jí)基礎(chǔ)上,逐步推廣液冷技術(shù)的應(yīng)用,促進(jìn)全產(chǎn)業(yè)鏈綠色低碳有序發(fā)展,助力國(guó)民經(jīng)濟(jì)各行業(yè)整體實(shí)現(xiàn)“碳達(dá)峰、碳中和”的輻射帶動(dòng)作用。
(三)依據(jù)功能定位分類建設(shè)
1.產(chǎn)業(yè)合作平臺(tái)
(1)建設(shè)條件
面向絕大多數(shù)無法承擔(dān)自建智算中心和獨(dú)立運(yùn)營(yíng)費(fèi)用的企業(yè),由政府主導(dǎo),通過統(tǒng)一建設(shè)高性能、大規(guī)模的智算中心,并以租賃形式為有需求的企業(yè)提供算力支撐,省去企業(yè)投資建設(shè)和運(yùn)營(yíng)費(fèi)用。通過平臺(tái)開放接口的方式,鼓勵(lì)行業(yè)領(lǐng)軍企業(yè)將開源的算法、開放的數(shù)據(jù)資源及運(yùn)營(yíng)服務(wù)等創(chuàng)新要素輸送給IT基礎(chǔ)相對(duì)薄弱的企業(yè),進(jìn)一步降低人工智能使用門檻,助力各行業(yè)智慧化轉(zhuǎn)型升級(jí)。
(2)建設(shè)方式與策略
借助ICT基礎(chǔ)設(shè)施企業(yè)物理設(shè)施建設(shè)優(yōu)勢(shì),通過承建智算中心,搭建產(chǎn)業(yè)合作平臺(tái),集成最新的人工智能加速芯片和存儲(chǔ)介質(zhì)等,使其成為各新興計(jì)算單元進(jìn)行大規(guī)模融合的重要載體,從需求側(cè)刺激硬件重構(gòu)和軟件定義等融合架構(gòu)技術(shù)創(chuàng)新發(fā)展。通過推進(jìn)平臺(tái)、框架和算法的協(xié)同優(yōu)化,打通人工智能軟硬件產(chǎn)業(yè)鏈,打造人工智能算力技術(shù)和產(chǎn)業(yè)生態(tài)。依托人工智能行業(yè)領(lǐng)域企業(yè)的專精優(yōu)勢(shì),通過成立合資公司等形式參與智算中心建設(shè)和運(yùn)營(yíng),借助智算中心平臺(tái)擴(kuò)大自有生態(tài)優(yōu)勢(shì)。
2.產(chǎn)業(yè)園區(qū)
(1)建設(shè)條件
面向各地方政府以云計(jì)算、大數(shù)據(jù)、智慧城市、虛擬現(xiàn)實(shí)、人工智能、區(qū)塊鏈等技術(shù)應(yīng)用為核心發(fā)展方向的頂層規(guī)劃布局,圍繞利用新一代信息技術(shù)對(duì)農(nóng)業(yè)、工業(yè)、服務(wù)業(yè)進(jìn)行全方位、全角度、全鏈條的數(shù)字化改造升級(jí)需求,通過合力打造面向未來的智算中心、智算產(chǎn)業(yè)促進(jìn)中心等產(chǎn)業(yè)配套載體,構(gòu)建“產(chǎn)業(yè)+配套、平臺(tái)+生態(tài)、數(shù)字+賦能”數(shù)字產(chǎn)業(yè)生態(tài),吸引相關(guān)技術(shù)企業(yè)落戶本地,逐步促進(jìn)產(chǎn)業(yè)集群規(guī)?;l(fā)展,立足本地,輻射帶動(dòng)周邊,推動(dòng)數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展。
(2)建設(shè)方式與策略
根據(jù)城市規(guī)模和產(chǎn)業(yè)發(fā)展定位的需求,以及經(jīng)濟(jì)社會(huì)發(fā)展等因素,由政府為主導(dǎo),與企業(yè)開展合作,以智算中心項(xiàng)目為依托,建設(shè)配套產(chǎn)業(yè)園區(qū)和人才培養(yǎng)平臺(tái)等,分類給予針對(duì)性的優(yōu)惠政策,吸引人工智能及其相關(guān)領(lǐng)域企業(yè)和人才向智算產(chǎn)業(yè)園區(qū)聚集。針對(duì)重點(diǎn)行業(yè)的特色應(yīng)用開展試點(diǎn)示范,形成一批可推廣的典型應(yīng)用創(chuàng)新模式。引導(dǎo)有智算需求的企業(yè)積極接入智算中心,使用智算中心服務(wù),加速企業(yè)集聚和數(shù)據(jù)共享。
政府根據(jù)智算中心運(yùn)營(yíng)的特點(diǎn)進(jìn)行規(guī)劃與開發(fā),并在此基礎(chǔ)上為園區(qū)提供政策支持、稅收優(yōu)惠等,加快應(yīng)用落地,引領(lǐng)塑造產(chǎn)業(yè)生態(tài)。
二、建設(shè)運(yùn)營(yíng)模式
為保證智算中心所釋放的經(jīng)濟(jì)社會(huì)效益最大化,需要選擇合理的建設(shè)和運(yùn)營(yíng)模式,保證智算中心的公共屬性,實(shí)現(xiàn)長(zhǎng)效運(yùn)營(yíng),促進(jìn)有序布局。
(一)主流建設(shè)模式
在全國(guó)一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系構(gòu)建背景下,地方政府、產(chǎn)業(yè)園區(qū)、企業(yè)等紛紛將智算中心作為培育人工智能產(chǎn)業(yè)生態(tài)、提升數(shù)字經(jīng)濟(jì)能級(jí)的有力工具,常見的建設(shè)模式包括三種。
1.獨(dú)立投資建設(shè)模式
一是政府獨(dú)立投資建設(shè)。政府對(duì)建設(shè)項(xiàng)目進(jìn)行直接投資和管理,建設(shè)資金主要來自地方政府財(cái)政資金、專項(xiàng)債券發(fā)行等,建設(shè)完成后智算中心所有權(quán)歸政府所有。出于促進(jìn)產(chǎn)業(yè)發(fā)展、優(yōu)化產(chǎn)業(yè)服務(wù)的考慮,不同規(guī)模的產(chǎn)業(yè)園區(qū)日益成為智算中心的投資主體,由園區(qū)管委會(huì)出資建設(shè)智算中心。
二是企業(yè)獨(dú)立投資建設(shè)。主要由企業(yè)聯(lián)盟、少數(shù)企業(yè)聯(lián)合、單獨(dú)企業(yè)等形式進(jìn)行投資,旨在服務(wù)于特定產(chǎn)業(yè)發(fā)展和特定場(chǎng)景應(yīng)用。部分負(fù)責(zé)投資的企業(yè)可以同時(shí)作為智算中心的建設(shè)方,部分負(fù)責(zé)投資的企業(yè)需要聯(lián)合專業(yè)化建設(shè)企業(yè)進(jìn)行施工。該模式雖然由企業(yè)出資,但是考慮到智算中心的高投入、對(duì)于地方經(jīng)濟(jì)發(fā)展的高影響等因素,應(yīng)緊密配合國(guó)家“東數(shù)西算”工程、全國(guó)一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系等建設(shè)指引。
三是高?;蚩蒲袡C(jī)構(gòu)獨(dú)立投資建設(shè)。主要由高校、科研院所、國(guó)家實(shí)驗(yàn)室等進(jìn)行投資,建設(shè)一般以智能計(jì)算平臺(tái)為主,服務(wù)場(chǎng)景相對(duì)單一,建設(shè)成本比智算中心小。平臺(tái)可以向師生、研究人員提供免費(fèi)的算力支撐,服務(wù)于科研教育場(chǎng)景,高校和各類科研機(jī)構(gòu)的科研資源疊加智能算力,為基礎(chǔ)研究、前沿科學(xué)技術(shù)研究提供支持。
2.由第三方出資的建設(shè)模式智算中心建設(shè)的第三方一般為國(guó)有控股企業(yè)。該模式下,既實(shí)現(xiàn)了政府對(duì)項(xiàng)目的建設(shè)全過程把控和需求的充分對(duì)接,還能有效利用相關(guān)國(guó)有控股公司已有的科技、人力資本、平臺(tái)資源、市場(chǎng)等優(yōu)勢(shì)。智算中心建成后歸第三方公司所有,可以由政府承諾用其他項(xiàng)目進(jìn)行補(bǔ)貼或者置換。具體細(xì)分為兩類。一種是由地方政府成立新的國(guó)有控股公司,專門負(fù)責(zé)智算中心的建設(shè)投資,另一種由地方政府委托或者授權(quán)已有的國(guó)有控股公司負(fù)責(zé)出資。
3.基于特殊項(xiàng)目公司的建設(shè)運(yùn)營(yíng)(SPV)模式
政府與企業(yè)共同出資成立智算中心建設(shè)運(yùn)營(yíng)項(xiàng)目公司,雙方在合作框架協(xié)議下按比例出資建設(shè)智算中心。政府既可以直接投資參與項(xiàng)目建設(shè),也可以通過國(guó)有控股公司、下屬事業(yè)單位等參與項(xiàng)目建設(shè)。項(xiàng)目公司需要由政府授權(quán),按照公司化方式獨(dú)立運(yùn)作,負(fù)責(zé)設(shè)計(jì)、融資、建造和運(yùn)營(yíng)等,向政府、企業(yè)提供服務(wù)或產(chǎn)品并收取費(fèi)用。該模式優(yōu)勢(shì)在于能夠節(jié)約政府部門的項(xiàng)目建設(shè)成本,實(shí)現(xiàn)建設(shè)資金籌集,同時(shí)啟用了專業(yè)化建設(shè)團(tuán)隊(duì),項(xiàng)目管理方式靈活多樣,在項(xiàng)目設(shè)計(jì)、建設(shè)和運(yùn)營(yíng)中效率較高。
(二)主流運(yùn)營(yíng)服務(wù)模式
智算中心出現(xiàn)時(shí)間尚短,其運(yùn)營(yíng)模式極具探索性,可按照運(yùn)營(yíng)方、服務(wù)類型、服務(wù)內(nèi)容三方面分析。
1.運(yùn)營(yíng)方選擇
運(yùn)營(yíng)主體指具體負(fù)責(zé)智算中心投入建設(shè)使用后的運(yùn)營(yíng)服務(wù)機(jī)構(gòu)。與投資主體相比,智算中心運(yùn)營(yíng)主體類型應(yīng)更加多元,運(yùn)營(yíng)模式也更為靈活,各類主體通過積極探索差異化個(gè)性化運(yùn)營(yíng)服務(wù)模式保障智算中心高效穩(wěn)定運(yùn)行。
一種方式為“投-運(yùn)”一體化,即由項(xiàng)目投資方出資成立實(shí)體運(yùn)營(yíng)公司,負(fù)責(zé)管理算力服務(wù)和生態(tài)服務(wù)。團(tuán)隊(duì)成員一般包括運(yùn)營(yíng)公司自身管理職能部門,算力服務(wù)營(yíng)銷人員、技術(shù)支持工程師等算力建設(shè)方人員等組成。
一種方式是“投-建”合作模式,即由投資方和承建方共同成立新公司,專職負(fù)責(zé)算力的運(yùn)營(yíng)和對(duì)外服務(wù)等。該模式下,可以形成投資方和建設(shè)方的運(yùn)營(yíng)聯(lián)合,實(shí)現(xiàn)運(yùn)營(yíng)風(fēng)險(xiǎn)共擔(dān),特別是考慮到智算中心后期維護(hù)存在一定的技術(shù)門檻,在此種方式下,可以保證運(yùn)營(yíng)的專業(yè)性和高產(chǎn)出。
另一種方式是“建-運(yùn)”一體化,以承建方主要負(fù)責(zé)運(yùn)營(yíng)。具體由承建方成立運(yùn)營(yíng)公司,專職負(fù)責(zé)算力運(yùn)營(yíng)和對(duì)外服務(wù)??紤]到這種模式下由承建方單獨(dú)承擔(dān)運(yùn)營(yíng)風(fēng)險(xiǎn),可以由政府給予運(yùn)營(yíng)費(fèi)用補(bǔ)貼,為了約束運(yùn)營(yíng)公司經(jīng)營(yíng)行為,可由政府對(duì)運(yùn)營(yíng)公司進(jìn)行算力利用率等指標(biāo)的考核。運(yùn)營(yíng)收入收益可以由運(yùn)營(yíng)方和政府部門共享。
2.運(yùn)營(yíng)服務(wù)類型
隨著人工智能產(chǎn)業(yè)不斷壯大,應(yīng)用場(chǎng)景的持續(xù)創(chuàng)新,智算中心逐漸走向市場(chǎng)化,服務(wù)對(duì)象日益多元。一是綜合型。以地方政府建設(shè)為主,服務(wù)于產(chǎn)業(yè)發(fā)展、科學(xué)研究、公共服務(wù)等多元場(chǎng)景。該類型一般由地方政府主導(dǎo)建設(shè),有效發(fā)揮了智算中心的公共屬性。
二是服務(wù)于產(chǎn)業(yè)發(fā)展。多由產(chǎn)業(yè)園區(qū)或龍頭企業(yè)、企業(yè)聯(lián)盟主導(dǎo)建設(shè),主要服務(wù)于園區(qū)及企業(yè)的發(fā)展,為人工智能產(chǎn)業(yè)向更深更廣行業(yè)應(yīng)用發(fā)展提供算力保障。
三是服務(wù)于科學(xué)研究。該類型多由高校、科研院所、國(guó)家實(shí)驗(yàn)室等承擔(dān)建設(shè),以投資較低的智能計(jì)算平臺(tái)為主,主要是為高校師生、科研人員的科研工作提供算力、算法等支撐。
3.運(yùn)營(yíng)服務(wù)內(nèi)容
提供數(shù)據(jù)服務(wù)。
智算中心作為專門服務(wù)于人工智能的數(shù)據(jù)中心,可以為服務(wù)購(gòu)買方提供多元化的數(shù)據(jù)服務(wù),例如數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)清洗、數(shù)據(jù)分析、數(shù)據(jù)查詢、數(shù)據(jù)可視化等。該服務(wù)屬于智算中心的基礎(chǔ)性服務(wù)。提供算力服務(wù)。服務(wù)購(gòu)買方無需關(guān)注底層算力芯片和技術(shù)細(xì)節(jié),只需要把計(jì)算過程看作“黑箱”,通過選擇業(yè)務(wù)場(chǎng)景、算法模型等,獲取服務(wù)方案。政府部門、企業(yè)、研究機(jī)構(gòu)可以依托智算中心提供的強(qiáng)大算力,驅(qū)動(dòng)AI模型進(jìn)行數(shù)據(jù)深度加工,實(shí)現(xiàn)AI應(yīng)用創(chuàng)新。提供算法服務(wù)。人工智能以算法作為靈魂,算法同樣是
智算中心的主要服務(wù)產(chǎn)品。
隨著技術(shù)的持續(xù)精進(jìn)和場(chǎng)景的持續(xù)拓展,人工智能的算法日趨復(fù)雜,面臨模型訓(xùn)練成本和技術(shù)門檻“雙高”的問題。在算法服務(wù)模式下,有利于購(gòu)買服務(wù)方專注于自身領(lǐng)域的業(yè)務(wù)邏輯和數(shù)據(jù),依托智算中心提供的語(yǔ)音、圖像、自然語(yǔ)言處理、決策等領(lǐng)域的算法能力,創(chuàng)新智慧應(yīng)用。
提供生態(tài)服務(wù)。
通過智算中心對(duì)外提供算力、數(shù)據(jù)和算法服務(wù),實(shí)現(xiàn)了不同主體的線上匯聚,有利于打造開放、共享的生態(tài),實(shí)現(xiàn)多方融合性、深度化合作探索。同時(shí)圍繞購(gòu)買服務(wù)方的共性需求,智算中心的運(yùn)營(yíng)主體和技術(shù)團(tuán)隊(duì)可以發(fā)掘研判行業(yè)動(dòng)態(tài)和用戶需求,提升智算中心的共性支撐能力,引領(lǐng)探索新的業(yè)務(wù)場(chǎng)景,構(gòu)筑新的產(chǎn)業(yè)和生產(chǎn)力。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多