近日,IDC與浪潮信息聯合發布了《2022-2023中國人工智能計算力發展評估報告》(以下簡稱“報告”)。報告預測,2022年中國人工智能市場相關支出將達到130.3億美元,并有望在2026年達到266.9億美元,2022至2026年年復合增長率達19.6%。
其中,人工智能服務器仍是人工智能市場增長的主力軍。IDC數據顯示,2021年全球人工智能服務器市場的同比增速為39.1%,超過全球整體人工智能市場增速(20.9%),是整體人工智能市場增長的推動力。
在中國,人工智能應用的加速落地很大程度推動了中國人工智能服務器市場的高速增長。2021年人工智能服務器市場規模59.2億美元,與2020年相比增長68.2%,預計到2026年,中國人工智能服務器市場將達到123.4億美元。
與此同時,中國的算力規模,尤其是智能算力規模,也正在高速增長。報告稱,2021年中國通用算力規模達47.7EFLOPS(每秒百億億次浮點運算),預計到2026年通用算力規模將達到111.3EFLOPS。
而中國智能算力規模在2021年達到155.2EFLOPS,2022年將達到268EFLOPS,預計到2026年可進入每秒十萬億億次浮點計算(ZFLOPS)級別,達到1271.4EFLOPS。
這也意味著,2021-2026年期間,中國智能算力規模年復合增長率可達52.3%,同期通用算力規模的年復合增長率為18.5%。
近幾年業內比較流行的大模型就是在智能算力驅動下最為典型的重大創新。報告稱,得益于模型泛化能力強、長尾數據的低依賴性以及下游模型使用效率的提升,大模型被認為具備了“通用智能”的雛形,并成為業內探索實現普惠人工智能的重要途徑之一。
大模型的技術基礎是transformer架構、遷移學習和自監督學習,transformer架構應用于NLP領域并取得了突破性進展,其在視覺任務上也同樣證明了有效性。從算力的視角看,語言類、視覺類模型容量和相應的算力需求都在快速擴大,大模型發展的背后是龐大的算力支撐。
如果用“算力當量”(PetaFlops/s-day,PD),即每秒千萬億次的計算機完整運行一天消耗的算力總量,來對人工智能任務所需算力總量進行度量,AI+Science領域的AlphaFold2、自動駕駛系統、GPT-3等模型訓練需要幾百甚至幾千PD的算力支持,如GPT-3訓練需要3640PD的算力。
在大模型的能力加持下,包括以文生圖以及虛擬數字人等AIGC類應用快速進入到商業化階段,并為元宇宙內容生產帶來巨大的變革。報告認為,大模型正在讓人工智能技術從五年前的“能聽會看”,走到今天的“能思考、會創作”,未來有望實現“會推理、能決策”的重大進步。
不過,大模型的發展同樣給算力帶來巨大的挑戰。報告稱,大模型訓練的計算和存儲資源開銷之大,對加速計算系統和人工智能軟件棧都有很高的要求,訓練千億、萬億模型動輒需要上千塊加速卡,對大模型的推廣和普惠帶來了很大的挑戰。
同時,受限于邊際遞減效應,模型復雜度與精度的進一步提升將會需要更大比例的計算資源開銷,對計算效率問題的顧慮會限制大模型參數規模的持續擴張。
正因如此,盡管目前的大模型參數數量還沒有達到人腦神經系統的突觸規模,但市場對于大模型的認知趨于理性。業內逐漸認識到,大模型的發展更要注重綠色低碳、服務能力下沉以及商業模式的實踐,這將為大模型在各行各業的規模落地鋪平道路。
報告指出,總體來看,人工智能在各個行業的應用程度都呈現不斷加深的趨勢,應用場景也越來越廣泛,人工智能已經成為企業尋求新的業務增長點、提升用戶體驗、保持核心競爭力的重要能力。
同時,在2022年中國人工智能城市排行榜中,北京、杭州、深圳繼續保持前三名,上海和廣州分列第四、五名,天津進入前十名。除了 TOP10 城市之外,諸如合肥、武漢、長沙等多個城市在自身產業優勢及各種因素推動下,人工智能應用取得了較大進展。