近年來,我國從芯片、整機、操作系統、云平臺、中間件到應用軟件等技術領域的創新鏈、產業鏈已初步形成,以X86、ARM、Power等不同架構處理器的為基礎的產業生態框架已基本就緒。國內IT產業生態也隨著新一代技術應用場景不斷拓展,已經形成了多技術路線全棧式支撐能力。在數據中心建設方面,隨著企業“上云用數賦智”的不斷加速和深化,新場景下的算力孤島問題逐漸凸顯。
如何實現多種芯片技術路線的高效協同,以應用為導向、從系統設計視角出發,滿足多芯共存、多云異構條件下的云原生環境構建,保障業務應用的穩定運行、平滑切換和線性增長,成為新一代云數據中心架構體系需要攻克的新的挑戰。
對此,浪潮信息副總裁張東表示,“一云多芯“是打破小生態、構建大生態的關鍵紐帶。同時,其在一定程度上激發了IT產業鏈上下游的創新活力,進而促進整體生態的協同發展。
具體來說,“一云多芯”可滿足用戶算力多樣化需求,并且可有效規避算力孤島。為充分發揮多元異構(不同架構、不同種類)芯片的能力優勢,金融、能源等關鍵行業應基于多種芯片架構來構建云基礎設施底座,實現多元算力的統一池化管理、統一調度以及業務的差異化部署等,逐步實現從算力并存到算力統一。
不過,張東也進一步表示,雖然“一云多芯”在云計算步新中已經成為業內共識,但在產業落地過程中仍存在多方面挑戰。
首先是理念的轉變。IT基礎架構經過長期的發展,從大機、小機時代逐步演進到云計算時代,開放計算深入人心。但直至今日,芯片指令集、操作系統架構上的差異化依然制約著架構的橫向協同,比如一個應用需要同時適配多個指令集和操作系統的問題仍然很嚴重。IT產業需要新的理念、新的路徑、新的設計,即以CPU為核心的設計模式轉變為以系統為核心的設計,以“以應用為導向,以系統為核心”構建新一代產業生態。“一云多芯”是就是這種理念的具體體現。
其次是缺乏統一的“一云多芯”建設標準、規范。算力標準化是產業的愿景,因此基于“一云多芯”打造的算力平臺需要標準化、統一化、服務化。各廠商因技術能力差別導致理解和落地模式均有所不同,比如部分廠商將納管多個獨立的不同芯片架構資源池的這種模式也包裝成“一云多芯”,由于無法實現真正的互聯互通,對業務的連續性造成很大的風險。
對此,張東認為,基于以系統設計為核心的思維,采用以場景驅動的“硬件重構+軟件定義”的融合架構,是數據中心體系結構的發展方向,可以分“有-好-優”三步走來實現一云多芯的中長期目標。
第一階段解決“有”的問題。以云為入口,通過云操作系統實現異構處理器服務器的統一管理,覆蓋國內外主流處理器,提供統一操作界面、操作方式及統一監控運維等,解決云資源池只能承載單一廠商或單一架構處理器的服務器而導致的應用無法跨架構部署、協同的問題。
第二階段解決“好”的問題。在第一階段的基礎上,進一步實現應用的低成本跨架構切換。通過資源層、平臺層和應用層的“分層解耦”設計,實現架構升級。
第三階段是解決“優”的問題。從業務連續性的維度,我們認為“一云多芯”的終極目標是實現應用與芯片架構的徹底解耦。這需要硬件、云以及應用等產業鏈上下游的共同協同,完善異構架構下有效算力的量化方法,以支持應用在不同架構處理器間的等價切換。共同推動應用與云基礎設施的一云多芯相結合,打造垂直一體化方案,實現應用層面的跨架構無感知切換。在標準和測評方面,聯合專業軟件測評機構及產業鏈上下游生態,形成一云多芯行業標準。