ChatGPT的起步槍打響之后,2023年,大型語言模型(LargeLanguage Models,LLMs)開始了“百模大戰”。接著,《生成式人工智能服務管理暫行辦法》(以下簡稱《辦法》)出臺,旨在維護國家安全和社會公共利益,保護公民、法人和其他組織的合法權益。自此,大模型發展邁入了嶄新階段。
這半年多來,百度的“文心一言”、阿里的“通義千問”、華為的“盤古”、商湯的“書生”、 科大訊飛的“星火”、360的“SEEChat”集體進入大模型競技場,中國聯通的“鴻湖”、中國移動的“九天”、中國電信的“TeleChat”、中國電科的“小可”等央企系大模型也紛紛入局。
面向人工智能和產業發展的新融合,中國工程院院士鄔賀銓指出,要將大模型切實投入到城市發展、工業制造等領域,需要專業的企業和組織加速其在實體產業落地,為產業剛需帶來實實在在的價值。
怎樣落地、落于何地、價值幾何?多位受訪者認為,大模型落地是央企的優勢,也是責任,更是機遇。
我們了解到,國資央企發揮各自所長,挖掘場景所需,探索形成“大模型研發—應用—合作”的方法路徑,構建良性生態。同時,冷靜研判并應對人工智能發展帶來的風險及挑戰,創造出中國特色的“大模型—人工智能技術體系”,成為大模型落地的“新勢力”,為中國智能社會的變遷帶來央企“加速度”。
01
大模型迎來落地挑戰
在熱情和爭議聲中,大型語言模型成為了人工智能產業發展的一幕生動側寫。
從20世紀80年代末發展至今日,大模型成功破解了語言的復雜密碼,不僅在學習上下文和邏輯時完成推演創造,還能微調以適應不同任務,或成為經濟發展的新支點。麥肯錫《生成式人工智能的經濟潛力》報告中顯示,大模型驅動下的生成式人工智能,將為全球經濟帶來11萬億—17.7萬億美元經濟價值,使全球GDP增加15%—40%。
在2023世界人工智能大會現場,我們看到大模型展區人聲鼎沸,30余款基礎大模型、垂直大模型爭相亮相,從不同賽道切入市場。
“在中國,廣告營銷、直播短視頻、客服、基礎性專業咨詢、智能車出行服務存在快速切入空間。能源、金融、地產、政務、醫療等產業大模型的商業空間潛力巨大。服務機器人、工業機器人、AR眼鏡等具有快速增長的藍海市場趨勢。”商湯智能產業研究院院長田豐在采訪中表示。
從有量到有用,大模型產品的落地拐點已至。按照2022年度Gartner魔力象限技術成熟度曲線,基礎大模型已經從實驗室中走入產業,被數億人使用、全民所認知,正處于炒作周期的頂點。頂峰顯現,投資涌入,產業價值迎來了返璞歸真、接受實際產業難題的挑戰時期。適應產業者生存,無法商業變現者將被淘汰或邊緣化。
大模型如何適應產業?當我們詢問“大模型如何助力戰略性新興產業發展?”商湯商量大模型給出了如下答案(節選):
“首先,大模型能夠通過對海量數據的分析和挖掘,提供更加精準的市場預測和分析,提高戰略規劃和決策的科學性和準確性。其次,大模型可以應用于新產品研發、生產制造、供應鏈管理等領域,提高生產效率和質量,降低成本。此外,大模型還可以應用于智慧城市、智能交通等領域,推動新興產業和傳統產業的深度融合。”
但無法回避的是,對于大模型的研發和落地,業內存在多重爭議:能耗浪費、倫理道德、評估驗證。央企作為大模型“國家隊”,能夠成為行業爭議的解決者,以及大模型體系的建設者。
首先,“百模大戰”熱潮的背后,存在算力浪費現象。有的地方開始自建超大規模數據中心,當智算的需求上來了,國家算力網絡建設也將隨之調整。
對此,許多業內人士呼吁,從基礎設施建設到研發、應用,需要國家和重點企業來統籌引導,避免資源空耗。同時,央企發揮各自或算力,或應用的優勢,分類合作推進。
其次,如何持續完善央企人工智能倫理風險治理體系?田豐提出,要重點針對AI模型風險、數據風險、技術設施風險、業務流程風險、法律合規風險等,建立社會主義核心價值觀/國家市場秩序核心原則、科技倫理委員會、風險識別體系、風險改進流程、AI安全自動化審核平臺。
針對央企大模型的統籌建設和評估驗證,國網數科控股公司數字技術研究院(雙創中心)運營總監張賓強調,在“一”字上下功夫,打造“一個引擎、一套標準、一支隊伍”。
“央企是各行各業的領軍者,央企有責任、有能力牽頭組織好行業大模型應用的標準和規范。”國投集團特級專家、美亞柏科AI研發中心總經理趙建強說。
為了對國內外大模型有效評測分析,7月17日,中國移動研究院聯合知名高校、科研機構和頭部企業聯合發布了《“弈衡”通用大模型評測體系白皮書》,這是行業中首個大模型評測領域白皮書,創新提出“2—4—6”的“弈衡”通用大模型評測體系。該體系將評估場景劃分為基礎任務和應用任務,明確四項主要評測要素,并制定涵蓋六大維度的50余個評測指標。揭示大模型在應用中的固有問題,客觀反映各模型在準確性、可靠性以及安全性等方面的差異,為大模型的評測實踐和產業應用提供指導。
02
央企的大模型工具箱
從目前發展情況來看,央企大模型的類型有兩種,第一種是通信類央企從算力和數據出發,以通用大模型賦能千行百業。第二種是其他行業的央企從場景數據出發,以行業大模型反哺自身業務。
“央企的責任在于,用技術上自主可控、內容生成上符合中國特色社會主義核心價值觀、賦能內外部應用、提前規避各類風險來填平落地的鴻溝。”中國電信大數據和AI中心/數字智能科技分公司產品和解決方案中心總經理劉翼對記者說。
央企具有豐厚的行業數據積累、行業知識與專家資源、AIDC算力技術設施投資建設潛力、相對成熟的AI安全治理體系和投融資渠道,能夠承擔自研之責和橋梁之責,促進大模型的價值實現。
“央企正在積極探索大模型的商業模式。”劉翼繼續說,產品形態一是眾所周知的行業大模型;二是搭建大模型的開發和訓練平臺,讓其他大模型來訓練研發;三是大模型的軟硬一體化產品,即提供“算力+大模型+大模型開發服務+場景”工具箱。
如果大模型是汽車,算力就是發動機。多年來,通信類央企已經儲備了強大的算力能力,一系列大模型產品于今年夏天接連發布。記者采訪發現,4家通信類央企的大模型技術扎實、基座穩定。
6月28日,中國聯通發布圖文大模型“鴻湖圖文大模型1.0”,可實現以文生圖、視頻剪輯、以圖生圖等功能。據了解,“鴻湖圖文大模型1.0”立足文旅產業的真實需求和年輕用戶群的增值業務場景,主打國風水墨畫生成。該大模型已成功賦能文旅數字人的建設,實現了降本增效。
立足社會主義核心價值觀的大模型“TeleChat”于7月2日發布。中國電信數字智能科技分公司依托電信云網融合優勢,利用自研技術增強大模型的預訓練和推理能力,賦能數據中臺、智能客服和智慧政務。“超過20家官媒內容、10G+的文本的訓練,加上針對敏感關鍵詞打標簽,共同保證TeleChat回答的價值觀正確。”劉翼說。
實踐中,還有政務客服雙覆蓋的“九天”。早在2013年,中國移動就成立了“九天”團隊,攻關智能客服和智能大數據分析等應用。近半年,“九天”團隊在基礎大模型的結構設計、數據構建、并行策略、推理加速等方面開展技術攻關,并于7月9日發布“九天·海算政務大模型”,首創政務大模型—信息場—應用端到端政務服務體系,滿足動態管理、公文寫作等需求,并可以為人工客服提供回復建議。
中國移動集團高級首席科學家、人工智能與智慧運營中心總經理馮俊蘭介紹說,政務大模型基于中國移動積累的豐富數字政府建設經驗,目標是助力政府為百姓提供更加便捷和智能的政務服務,提升政府社會治理的智能化水平。客服大模型則是基于9.83億移動客戶、2.53億家庭寬帶客戶、將近2500萬的政企客戶以及云客服等產品服務的企業,所積累的大量客服經驗而構建。
有解決工作效率難題的“小可”。為解決重復性工作繁多、基于個人經驗決策不夠科學、工作效率不高等痛點,6月9日,中國電科旗下電科太極發布大模型“小可”,旨在幫助黨政企用戶智能化開展業務。目前已推出擬文助手、編碼助手、智能標繪等一系列智能應用,可滿足降本增效、流程優化和工作創新等需求。
“用來訓練大模型的除開放數據外,還有行業專用數據、政府政策數據、代碼庫數據和開發知識數據。”楊軍表示,電科太極將持續在內容安全、數據安全、系統安全、算法安全等方面提升大模型安全性。
通過收集數據或用公開數據為大模型構建“訓練場”相對簡單,但想要為之注入產業能力,高質量數據和高質量的行業專業知識是一大關鍵。這正是央企另一大優勢:基于數據和場景深耕行業大模型,并形成方法論。
“研發大模型是順理成章,水到渠成的過程,”趙建強說,“在既有的數據、算法和人才積累上,當前大模型是在為之前的產品積累做技術迭代。”
國投下屬美亞柏科的人工智能探索始于2017年。美亞柏科依靠20年積累形成的豐富行業知識和合規數據,于6月28日發布國內首個公共安全大模型“天擎”,其已具備警務意圖識別、警務情報分析、案情推理等業務理解能力。如此,便可告別取證環節的繁復業務系統和操作,辦案人員只需輸入一條指令,就能將相關人員的涉案線索一站式呈現,并自主得出研判結論,大幅提高辦案效率和研判的準確率。
再如,國網數科對大模型的應用與探索,更關注于模型服務化、工程化能力以及生態的打造,構建了基于“大模型+小模型”的電力大模型引擎,提供平臺化的模型服務,減少重復訓練和重復創新,串聯了不同場景的業務知識和需求。
“聚焦源網荷儲和供應鏈兩類模型的訓練和服務化應用,有所為有所不為。”國網數科控股公司數字技術研究院(雙創中心)運營總監張賓向記者介紹道,依托電力大模型引擎,國網數科還為公司內兄弟單位提供模型微調、訓練、發布等技術服務,提高公司大模型生產、引用效率。
7月5日,南方電網人工智能科技有限公司上線全國產電力行業百億參數規模大模型,為南方電網輸配電、電力調度、市場營銷、安監、綜合管理等業務提供了解決方案。據了解,整體流程除訓練微調之外,還使用強化學習評價模型迭代微調,推動智能客服、生產和安監等業務域落地,已形成從研發到應用場地落地的方法論。
“南方電網以高智慧產品和解決方案為導向,在垂直領域發力。”在采訪中,南方電網人工智能科技有限公司副總經理、南方電網公司高級技術專家梁壽愚表示,將針對智能客服場景完成二次訓練,實現智能機器人、智能客服助手、智能質檢、智能外呼、智能知識庫等功能。預計2023年底,高頻業務實現“機器代人”的比例將由60%提高到80%。
03
共建生態服務產業剛需
不同于其他行業的正面競爭,央企和民企自進入大模型之始,就帶著彼此互補的基因。
學界認為,大模型耗盡高質量的自然語言數據的時間,可能在2026年。加之由人類原生的數據會更加稀缺,以后只能依靠在新的場景里帶出增量的數據飛輪,持續投喂模型。
此時,生態合作成為了一道必答題,產業剛需是出題人,行業大模型是答題者。實踐中,央企發揮產業鏈“扁擔作用”,升級人工智能產業合作生態,形成面向經濟社會各領域的賦能輻射圈,已經取得了一系列深度融合成果。
山東能源創新礦山AI開發模式,將盤古人工智能礦山大模型應用在礦山一線,充分展現出了商用價值。比如,鉆孔卸壓是防治沖擊地壓的主要手段,引入AI大模型視覺識別技術來分析卸壓鉆孔施工質量、輔助驗證工程規范性,可以減少82%的人工審核工作量,將3天的防沖卸壓施工監管流程縮短至10分鐘內,并且做到驗收率100%。
6月14日,中國石化與百度簽署戰略合作框架協議,在行業人工智能基礎設施建設、互聯網新業態、數字化轉型升級與大模型等新技術創新、智慧營銷等方面合作建設,探索利用AIGC、數字人等技術,助力打造中國石化智慧傳媒平臺。
目前,南方電網正在研發模型即服務(MaaS)的電力場景化人工智能平臺,提供電力系統模型訓練、數據集發布和舉辦大賽等服務。通過開放平臺、發放一定數量代金券給生態方、進一步完成幾十個場景落地三個步驟,完成生態構建路徑規劃,實現從平臺開放到規模化活躍用戶的轉變。
類似的案例還有很多。6月9日,中核集團中核裝備院和滴普科技聯合成立“大模型數據智能實驗室”,以AIGC大模型數據智能化關鍵技術為牽引,打造數據引擎、訓練微調引擎、評測引擎,推進以核工業領域大模型技術為核心的解決方案。
7月13日,華潤燃氣與騰訊云簽署合作協議,探索AI大模型在燃氣行業的深度應用,深耕分布式計算、連接和客戶運營等領域。
中興通訊以DPU為中心,構建了軟硬協同新型算網基礎設施,實現了GPU算力的聚合,最大程度地提升了GPU集群的算力。據了解,中興通訊計劃于今年底推出支持大帶寬的ChatGPT的GPU服務器。
為了提高企業運營效率和管理能力,7月27日,用友發布企業服務大模型,結合了財稅、人力、供應鏈領域的專業知識和數據優勢,預期將用在十大領域。“企業服務大模型是理解工具,可以提高國企數智化服務工具的使用率和適用面。”用友網絡CTO樊冠軍認為,由于缺少人機協同,企業對ERP(企業資源規劃)功能的使用效果只發揮到了30%,大模型會使ERP的使用率提高到70%。
關于大模型合作生態的未來情景,中國國際經濟交流中心副理事長、世界經濟論壇基金董事會成員朱民有兩種預測:一是由多個大模型基礎設施公司,為上游應用提供API(應用程序接口)和模型服務,上游應用公司只需要專注于開發產品邏輯。二是AI公司多為垂直公司,每個公司都根據自身需要研發底層大模型,為自身應用提供技術支持。
中國大模型產品化經驗不足、研發同質化等問題,將使市場競爭變得趨于內卷。
許多從業者提出,重復開發并非上策,央企要厘清自身的優勢和特色,以及大模型的差異化建設重點,進行長板合作。
“未來將會看到‘央企+AI基礎科研’的組合落地模式。”田豐認為,應對之道是準確選擇基礎科研實力雄厚、產業化解題能力強、創新迭代速度快的AI戰略伙伴,共研行業基礎大模型、共建AI倫理治理體系、共創行業AI新應用與商業新模式。應對瓶頸迎接人工智能新未來 有專家指出,不要高估大模型的現在,也不能低估大模型的未來。大模型未來的成功,取決于技術、產品、產業能否齊頭并進。
技術層面,需要解決的瓶頸來自安全、數據、算法和算力等方面。
首先,隱私和安全是從業者擔憂的焦點。“在進行海量行業數據學習時,隱私數據要非常妥善地處理。”趙建強說,“對于人工智能本身的安全。要遵循《辦法》的條款,確保模型本身的可信、可靠。”
自2023年8月15日起施行的《生成式人工智能服務管理暫行辦法》,提出了包容審慎、分類分級的監管方法,國家堅持發展和安全并重、創新和依法治理相結合的原則,從算法設計與備案,訓練數據處理活動和數據標注,用戶隱私、商業秘密的保護,防沉迷等方面作出了指引。
其次,數據質量不夠高,數據資源存在分散現象。據張賓介紹,數據“投毒”等安全問題不容忽視,不僅影響數據質量,甚至會出現誤導。而且,大模型的訓練成本居高不下,算力資源缺乏且分布不均勻。
因此,“數據方面,亟須統籌建設高質量數據集并建立數據流通共享機制。國產智算芯片等基礎軟硬件較為薄弱,亟須大力推進人工智能新型基礎設施建設帶動國產化加快發展。”馮俊蘭建議。
模型算法層面,存在可解釋性問題、算法偏見問題、技術依賴和風險集中問題。
對此,受訪者提出,要解釋黑盒算法的決策過程,重視算法的公平性和透明度,確保訓練數據的多樣性和代表性,并對算法審查監督,防止偏見。
對此,梁壽愚認為:“不能過于依賴特定的技術專家,應積極培養內部技術團隊,與多個技術供應商建立合作關系,降低技術依賴風險。”
當技術問題逐步解決,產品應用將邁向新的階段。有觀點稱,今年的大模型熱過去后,會有2—3年的沉降期,5—10年逐步回升,回升的速度和高度,取決于行業商業模式的可行程度。
中國信息通信研究院發布的《人工智能白皮書(2022年)》顯示,預計到2023年,我國人工智能產業規模將超過8000億元。“人工智能將以解決人類剛需而更深刻地載入史冊。”語音及語言信息處理國家工程研究中心主任 、科大訊飛董事長劉慶峰認為認知大模型建設需要確保應用成效、確保自主可控、確保科學評估。可以預見,以大模型為代表的通用人工智能離人們越來越近,被定義為“新基建之智”的人工智能服務,會像今日的水電、通信服務一樣便捷、普適、安全、低成本,真正“飛入尋常百姓家”。
埃森哲在其AI成熟度報告中表示,2024年,科技等行業的人工智能成熟度領先優勢會減弱。比如,汽車公司的自動駕駛汽車銷量將大幅增長,航空航天公司將建設人工智能遠程系統,生命科學行業將推進人工智能在線高效藥物開發。
對于各行各業來說,這都是一個巨大的機會。“人類已經從云原生走向了智原生時代。”樊冠軍說,AI將在四大方面精準服務企業運營:智能業務運營、人機交互、知識生成和應用生成。
面對大模型的市場競逐和新技術熱潮,大模型“國家隊”堅持自主創新,久久為功。當談及新的時代需要新的智能服務運營范式,馮俊蘭稱:“創新運營供給模式,實現全場景全要素能力運營與供給。創新業務賦能模式,實現從X+AI向AI+X的根本性變革。創新產業合作模式,實現向體系化協同創新轉變。”