5月17日,由工業和信息化部、安徽省人民政府主辦的2023世界電信和信息社會日大會在安徽合肥成功舉辦。在大會同期召開的“智能算網與數字經濟發展”論壇上, 新華三集團運營商事業部技術總監陳峰受邀出席并發表主題演講。
智能算力的“優”與“憂”
《2022—2023 中國人工智能計算力發展評估報告》顯示,中國人工智能計算力繼續保持快速增長,2022年智能算力規模達到268EFLOPS,超過通用算力規模,預計到2026年中國智能算力規模將達到1271.4EFLOPS。眾所周知,智能算力對于提升國家、區域經濟核心競爭力的重要作用已經成為業界共識。隨著“東數西算”工程的啟動以及智算中心的建設,從國家層面實現有效的資源結構整合,助力產業結構調整,構建更為健全的算力、算法基礎設施。
“當前,智能算力規模已超過通用算力,并將持續高速增長?!? 陳峰在演講中表示。據悉,目前我國數據中心通用算力占比90%以上,未來五年智能算力復合增長率達52.3%,同期通用算力規模的復合增長率為18.5%,人工智能計算需求未來將占據80%以上的計算需求。
隨著近期GhatGPT的爆火,AIGC引發了智能算力的巨大需求?!凹僭OChatGPT有1750億參數,訓練一次模型的總算力消耗約為3640P,需要7~8個投資規模30億、算力500P的數據中心才能支撐運行,且消耗GPU算力?!标惙逵肅hatGPT舉例道。“雖然全國智算中心建設項目已超過40多個,但能提供的智能算力不足20 EFLOPS,智能算力供需缺口較大?!笨梢源_定,AIGC爆發進一步推動了智能算力的需求,對于智算中心來說,既是巨大需求和商機,又是極大挑戰。
新華三持續提供高效、共享智能算力服務
相關數據顯示,中國AI服務器市場領跑全球,2021年人工智能服務器市場規模59.2億美元,與2020年相比增長68.2%,預計到2026年,中國人工智能服務器市場將達到123.4億美元。
“高性能AI服務器可提供超強智能算力?!闭劶癆I服務器陳峰特別強調。對于小型訓練和推理場景中,可使用PCIE形態的節點,同樣應該支持異構混合算力;而在大模型訓練集群則需要高性能網絡的有力支撐,往往采用混合并行的方式進行訓練,GPU集群從存儲集群拉去樣本數據、GPU節點之間的參數交互,這兩個數據傳輸的流程都需要高性能、低延時的網絡作為基礎。
新華三的算力網絡是基于兩個基礎建立起來的,一是源于整個數據中心網絡的網絡控制器,WAN的控制器,能夠全面了解現網的所有的,尤其是承載網的所有信息,并進行相應的控制;另一個就是多地的智算平臺,包括上面匯聚的多云管理平臺形成的對算力資源整體的了解和供應能力,以及納管?!霸谶@兩個之上,我們構建算網大腦,完成算和網的一體化信息拉通和資源的供給能力,我們對北向也提供非常開放的,豐富的接口,提供給算網運營,算網編排,也可以提供給各種paas應用,來更好地進行應用的銜接和結合”陳峰表示。
“新華三智算中心運營平臺可提供高效、共享智能算力服務能力支持?!标惙褰榻B道。通過統一運維運營中心,每一項服務需求都按交付單的方式整體執行,各模塊分工明確,既可實現產品自由組合,同時保證流程順暢傳遞,保證了智算中心的順利運行。
“標準、融合、安全、試點?!边@是陳峰為智算發展提出的四個建議關鍵詞。智算中心是算力網絡的重要組成,但是目前在智算中心RoCE網絡、智算中心與算網的融合、智算中心安全要求等方面在標準、互通性、標準成熟性還存在明顯的差距,新華三期望產業界可以盡快推動相關的標準成熟,并通過試點方式推動技術的驗證。未來,新華三也將持續在算網融合領域深耕,攜手運營商及產業相關單位,共同為智能算網與數字經濟發展助力。