9月1日,2022世界人工智能大會(WAIC 2022)正式開幕。1日下午,由深度學習技術及應用國家工程研究中心主辦的“AI開源開放與產業智能化高峰論壇”成功舉辦。百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰致開場辭,中國科學院何積豐院士、王懷民院士等多位專家共同探討AI開源開放的價值,分享AI與不同領域融合創新的實踐,為產業智能化建言獻策。
王海峰在致辭中提出,大模型的產業模式將是“類臺積電”模式。大模型加深度學習平臺,貫通AI全產業鏈,是產業智能化的基座。
當前,作為新一輪科技革命和產業變革的重要驅動力量,人工智能技術呈現出很強的通用性,廣泛滲透進經濟生產活動的主要環節。大模型是近幾年人工智能發展的重要方向,具有效果好、泛化性強、研發流程標準化的特點,進一步增強了人工智能的通用性,為人工智能進一步發展帶來了新機遇。
與此同時,大模型研發也面臨著數據規模大、數據質量參差不齊、模型體積大、訓練難度高、算力需求大等一系列挑戰。
在這樣的背景下,如何加速大模型的產業落地,讓大模型發揮更大價值?在王海峰看來,具有算法、算力和數據綜合優勢的企業可以將模型生產的復雜過程封裝起來,通過低門檻、高效率的生產平臺,為千行百業提供大模型服務。如此一來,大數據、大算力、大模型能力僅需少數企業操心,千行百業直接應用AI模型即可。
王海峰以臺積電、三星等企業為例,進一步闡釋大模型的產業模式,可類比芯片行業的代工廠模式。他表示,“芯片制造工藝有很高的技術壁壘,有價格高昂的產線,能夠根據客戶需求,標準化、自動化地大批量生產芯片,形成規模經濟。同理,大模型生產企業在大模型能力、海量數據、大規模算力等方面具有優勢,能夠根據AI應用方的需求,自動化、標準化地進行多場景多領域的模型生產,當達到一定規模時,即可形成健康、可持續發展的大模型產業模式?!?/span>
大模型的開發、訓練、推理部署以及產業落地,離不開深度學習平臺的支撐。深度學習平臺下接芯片,上承應用,相當于智能時代的“操作系統”。大模型加上深度學習平臺,可以貫通從硬件適配、模型訓練、推理部署,到場景應用的AI全產業鏈。
大模型的“類臺積電”產業模式,已經在百度的大模型實踐中得到驗證。
百度研制了文心產業級知識增強大模型系列,包括以鵬城-百度·文心為代表的基礎通用大模型、生物計算領域大模型,以及能源、金融和航天行業大模型等,還包括輔助大模型適配場景應用的工具和平臺,探索生態共建的創意社區旸谷等。百度文心大模型也作為今年WAIC “八大鎮館之寶”之一,在展區硬核亮相。
文心系列大模型的成功研制和應用,背后是基于飛槳的有力支撐。飛槳作為我國首個自主研發、開源開放的產業級深度學習平臺,集核心框架、產業級模型庫、開發套件和工具組件,以及學習和實訓社區于一體,標準化、自動化地支撐大模型生產和應用。
在大模型訓練方面,飛槳研發了端到端自適應分布式訓練技術,根據模型特性和算力平臺特性,自動選擇并行策略,實現端到端極致的性能優化。
在大模型推理方面,飛槳打造了針對大模型的壓縮、推理、服務化全流程部署方案,能廣泛支持不同種類的模型結構,實現高速推理。同時,飛槳還提供自動模型壓縮工具,幫助節約算力資源。
文心大模型基于飛槳平臺開源開放,共建生態,累計已有超過1萬開發者,基于文心大模型,創建了3萬多個任務。目前,文心大模型已廣泛應用于百度產品,顯著提升產品效果和研發效率,并應用于金融、能源、醫療、制造、企業服務等領域,大模型的生態初現崢嶸。
“大模型的產業模式將是‘類臺積電’模式。大模型加上深度學習平臺,貫通AI全產業鏈,是產業智能化的基座。”王海峰最后總結。