在發布大模型這件事兒上,華為的“畫風”顯得不太一樣。
對C端消費者而言,往往期待在科技巨頭們的大模型發布會上看到直觀的演示——或是流暢解答各種問題,或是數秒生成多種風格文案,或是輕松求解數學難題,如果再能夠春花秋月地賦詩作詞一首,贏得滿場掌聲和喝彩也并非難事。
然而,如果對華為盤古大模型抱有類似的期待,難免會“失望而歸”。
就在今天(7月7日),盤古大模型 3.0于華為云開發者大會上重磅亮相。在這場發布會上,與會者反復聽到的關鍵詞是“行業”、“行業”、還是“行業”。
正如華為常務董事&華為云CEO張平安在開場演講時所說:“ 自OpenAI 發布ChatGPT之后,全球掀起了一股大模型研發熱潮。據不完全統計,全球有名有姓的大模型已經多達數百個,僅中國上半年就發布了80多個AI大模型。這些大模型都有非常好的對話能力,非常好的文案生成能力,甚至還會寫詩作畫。那么很多人就問華為——既然華為2021年就有大模型了,為什么今年上半年幾乎聽不到一丁點消息呢?”
“我想告訴大家的是,華為盤古大模型不會寫詩,只會做事!盤古大模型是要扎根行業,為各個行業帶來價值!我們一直堅持的方向就是 AI for Industry,所以盤古大模型不會作詩,他也沒有時間作詩,因為他要深入到各行各業里頭去!因為他要讓 AI 來賦予千行百業價值!”
盤古大模型,為行業而生!
在發布會現場,我們依然也能看到精彩的實機演示,不過這些也都是關于千行百業的落地應用!
盤古大模型,為行業而生
沒有多余廢話,張平安開門見山地在“AI重塑千行百業”的主題演講中,一口氣介紹了盤古大模型在礦山、鐵路、氣象、金融、制造等多個行業的應用。
盤古for礦山
我國是一個煤礦高產國,擁有大概 4400 處煤礦,每年產煤 45.6 億噸煤,但我國煤礦的數字化、智能化程度較低。為了產出 45.6 億噸的煤,需要280萬的煤礦工人,他們幾乎可以說是中國工人里工作最艱苦的群體之一。而盤古大模型就是要助力煤礦行業的智能化,讓更多煤礦工人能夠在地面辦公室進行煤礦的采煤作業。
發布會現場的大屏上展示了一個煤礦的綜采面,一臺40多米長的采煤機正在井下持續作業。以前也有一些技術手段,比如通過監控攝像頭來監控井下的作業狀況,但由于現場大量的粉塵影響了畫面的清晰度,最終還是需要煤礦工人親自下井進行及時巡檢。
如今,盤古大模型能夠將100多路視頻集中在一起,形成如下圖所示的巨幅畫面,由于采用了投塵的算法,使得即使在塵土遮擋下也能清晰看到畫面。
由此,管理人員可以非常容易地識別出采掘過程中大塊的巖石造成的卡堵問題,使得地面工作人員不用下井就能看的全、看得清、看得準,從而在地面進行煤機的操控作業。
基于盤古礦山大模型,云鼎科技和華為達成深度合作,開發了 21 個場景化應用,覆蓋了7 大業務系統。目前,盤古礦山大模型已經在全國 8 個礦井里規模使用,覆蓋了煤礦的綜采、掘進、機電、運輸、通風、洗選等流程下的 1000 多個細分場景,目標是讓更多的煤礦工人在地面上作業,不僅使其工作環境更加舒適,而且可以極大減少安全事故。
盤古for鐵路
礦山說完,再來看看鐵路行業。中國總共擁有超過 100 萬輛貨車,每年跑在鐵路上的運輸貨物量高達近五十億噸,怎么保障這些貨車的安全運行?這也是盤古大模型大顯身手的地方,它要跑到鐵路上來服務于貨車的安全運行。
在傳統的貨運鐵路巡檢中,TFDS(貨車運行故障動態圖像檢測)系統作為5T檢測技術的重要組成部分,通過高速拍攝的“電子眼”,動態采集列車車底配件、車體側部等部位圖像,以判別貨運列車是否存在故障。而這些圖像照片會被送到檢測員前面,需要檢測員在屏幕上一張一張地看。
以平均每天過站1000輛的一個樞紐站為例,系統將采集400萬張圖像,需要260個有經驗的檢測員采用四班倒的工作節奏,一屏一屏的看,防止漏掉任何故障圖像,每一屏至少要看 8 秒,因此這些檢測員的工作強度極大,責任也很重。
而在部署了盤古大模型之后,一雙盤古眼就能看完所有的圖片,然后再將有潛在故障的圖片送到檢測員手里,使得需要列車檢測員看的圖片從 400 萬張銳減到20萬張,極大降低了檢測員的工作量,提升了其工作效率。
如今,盤古鐵路大模型可以對跑在鐵路上的 67 種貨車的 430 多種故障進行檢測,故障檢測漏檢率為0,檢測效率提升了 20 倍。
盤古for氣象
在氣象領域,全球每年大約會生成 80 個臺風,平均有 7 個臺風會經過我國或登陸我國,這將對沿海城市造成極大的影響。所以盤古氣象大模型就是要提前精準地預測臺風路徑,從而助力更好的防災減災。
如果我們想用傳統方法來預測一個10 天的臺風的路徑,需要3000臺高性能服務器花費4-5個小時來完成相應的計算。現在基于預訓練的盤古大模型,通過 AI 推理的方式,只需要在單臺服務器上 10 秒內就可以給出更精確的預測。
據悉,基于近40年的全球氣象數據,華為云盤古氣象大模型在中長期確定性預報上超越當前最強的數值預報方法(歐洲氣象中心的IFS系統),是業內首個精度超過傳統數值預報方法的全球AI氣象預測模型。平均預報誤差降低了10%-15%,速度提升10000倍以上,實現秒級全球氣象預報。
今年5月,臺風“瑪娃”走向受到廣泛關注。中央氣象臺表示,華為云盤古大模型在“瑪娃”的路徑預報中表現優異,提前五天預報出其將在臺灣島東部海域轉向路徑。
這種實力也得到了科技界的認可。就在昨日(7月6日),國際頂級學術期刊《自然》(Nature)雜志正刊發表了華為云盤古大模型研發團隊研究成果——《三維神經網絡用于精準中期全球天氣預報》(《Accurate medium-range global weather forecasting with 3D neural networks》)。這是近年來中國科技公司首篇作為唯一署名單位發表的《自然》正刊論文。
華為云盤古氣象大模型研究成果在《Nature》正刊發表
《自然》審稿人對該成果給予高度評價:“華為云盤古氣象大模型讓人們重新審視氣象預報模型的未來,模型的開放將推動該領域的發展。”
盤古for制造
再來看看制造業,眾所周知,制造業的產線效率極為關鍵,盤古大模型也走進了華為的制造生產線,為其產線制定最優的排產計劃。
據張平安介紹,在沒有大模型之前,依靠個人經驗,華為的單產線器件分配計劃往往需要花3小時才能做齊。如今,盤古全局統籌的最優規劃,使得1分鐘就可以做出未來三天的生產計劃。
值得一提的是,在后續的演講環節,華為云EI服務產品部部長尤鵬還為大家帶來了令人印象深刻的現場演示。
在傳統制造行業中,不管是生產、供應還是交付,都存在大量的決策優化問題,比如說生產的排程、運力的規劃等等,其實傳統的求解過程是非常復雜的,需要非常多的業務專家、數學專家、編程專家來把一個運籌優化的問題變成一個求解問題。
而在現場演示中,尤鵬展示了一個器件分配的場景——假設計劃員收到了一個器件分配的需求,如下圖所示,其關鍵在于把兩種核心器件分配到三個逆變器的生產計劃當中,尋求最優化的成本控制。
只需將這段自然語言拷貝到盤古制造大模型里,大模型能夠立即識別出這是一個建模需求,然后將其轉換一個標準的數學建模語言。
當計劃員確認完這個數學建模是準確的之后,就可以直接調用天籌 AI 求解器來求解。通過盤古大模型和天籌 AI 求解器的結合,可以大幅降低求解的門檻,讓決策優化快速找到最優的解答。
盤古for政務
另一個讓筆者印象深刻的現場演示在于盤古大模型在政務領域的應用。
華為盤古大模型政務場景應用演示 - 西瓜視頻 (ixigua.com)
據尤鵬介紹,盤古政務大模型能夠準確地理解民眾的咨詢意圖,改變傳統一網通辦的模式,把老百姓的話語轉化為政府辦事的語言,讓城市更加有溫度,更加有愛。
就在發布會當天,華為聯合深圳市福田區政務局上線了基于盤古政務大模型的福田政務智慧助手小福。
假設你是一個來福田投資的企業負責人,可以直接向小福詢問:福田區有哪些招商政策?對新落戶的企業有哪些優惠?政策對象有哪些群體?
小福的回答如下所示,其回答了福田區正在推行的產業發展政策,解答了對新落戶企業的具體優惠措施,最后還說到了招商引資對象涵蓋的機構和個人。
除了一網通辦,城市治理是另一個典型場景。基于政務大模型已有的 100 多種視覺場景,盤古政務大模型可以實現對城市各類事件的秒級發現。
如下圖所示,這里有一張圖片,我們可以向盤古詢問:假設現在是上午8點,根據深圳市的交通規定,畫面中是否有禁止通訊的交通工具?
盤古大模型很快識別出了違規的大型貨車,并提供了交通規則的判斷依據——也就是在每天7-24 時這個時間段內,大型貨車是有違規嫌疑的。
多模態大模型對話的能力能夠像人一樣,除了識別圖片中的物體之外,還可以結合的語義進行理解,實現全場景的識別。
除了以上場景,張平安和尤鵬還在演講中闡述了盤古大模型在金融、軟件開發、數字內容生產等領域的應用。更進一步,盤古大模型+具身智能,還能讓機器人具備自然語義理解和全域感知引導的自主智能。
總而言之,華為希望盤古大模型希望讓每個人,每個企業,每個行業都擁有自己的專家助手,讓工作更高效、更輕松。
盤古大模型的三層架構
在秀完行業肌肉之后,張平安宣布華為云盤古大模型3. 0正式發布。盤古就是要重塑千行百業,盤古大模型3. 0就是一個完全面向行業的大模型系列!
具體而言,該大模型系列包含三層架構:
第一層L0層是盤古的5個基礎大模型,包括盤古自然語言大模型、盤古多模態大模型、盤古視覺大模型、盤古預測大模型、盤古科學計算大模型,它們提供滿足行業場景的多種技能。
盤古3.0為客戶提供100億參數、380億參數、710億參數和1000億參數的系列化基礎大模型,匹配客戶不同場景、不同時延、不同響應速度的行業多樣化需求。同時提供全新能力集,包括NLP大模型的知識問答、文案生成、代碼生成,以及多模態大模型的圖像生成、圖像理解等能力,這些技能都可以供客戶和伙伴企業直接調用。無論多大參數規模的大模型,盤古提供一致的能力集。
第二層L1層是N個行業大模型,既可以提供使用行業公開數據訓練的行業通用大模型,包括政務、金融、制造、礦山、氣象等;也可以基于行業客戶的自有數據,在盤古的L0和L1上,為客戶訓練自己的專有大模型。
第三層L2層是為客戶提供更多細化場景的模型,它更加專注于某個具體的應用場景或特定業務,為客戶提供開箱即用的模型服務。
盤古大模型采用完全的分層解耦設計,可以快速適配、快速滿足行業的多變需求。客戶既可以為自己的大模型加載獨立的數據集,也可以單獨升級基礎模型,也可以單獨升級能力集。
在L0和L1大模型的基礎上,華為云還為客戶提供了大模型行業開發套件,通過對客戶自有數據的二次訓練,客戶就可以擁有自己的專屬行業大模型。同時,根據客戶不同的數據安全與合規訴求,盤古大模型還提供了公用云、大模型云專區、混合云多樣化的部署形態。
據介紹,盤古可以一己之力做到網絡搜索、請教專家、參考案例、查閱書籍等,讓每個開發者都擁有一個自己的編程助手,甚至還可以實現一句對話代碼生成、一個按鍵用例測試、一次點擊自動注釋、一條指令智能部署,極大地簡化了開發的流程。
我們知道,AI能夠創造的價值絢麗而美好,但對開發者而言,方案落地產業的過程卻絕非一個“苦”字可以形容。
在過去分散化的模型研發模式下,單一的AI應用場景下的多個任務都需要由多個模型支撐完成,每一個模型建設都需要算法開發、數據處理、模型訓練與調優過程。
這種傳統的AI開發模式就如同“小作坊”——試想一下,如果每家企業在進行研發時,都需要自己從頭造輪子,那整個社會的工業化從何說起?從工業體系的邏輯上看,解決這一問題的核心就是提升AI開發前置工作的標準化程度,將不同開發者所需模型的公約部分提前訓練好,即工業化中的零件化、標準化和流程化。
在探索AI工業化的過程中,預訓練大模型逐漸成為了行業認可的方案。其邏輯是提前將知識、數據、訓練成果沉淀到一個模型中,然后將這個基礎釋放到產業,再由不同行業、不同企業的開發者在此基礎上進行二次開發和微調。
華為云盤古大模型的三層架構,正是為“預訓練+下游微調”的開發模式提供了支撐。預訓練大模型增強了人工智能的通用性、泛化性,隨后大模型負責向小模型輸出模型能力,小模型更精確地處理自己“擅長”的任務,基于大模型通過零樣本或小樣本精調,就可實現在多種任務上的較好效果。
大模型“預訓練+下游微調”的模式帶來了新的標準化AI研發范式,開發者無需針對每一個場景重復開發AI模型,實現AI模型在更統一、簡單的方式下規模化生產。
這是從“作坊模式”向“工廠模式”的進化,是AI產業的“工業革命”!
盤古大模型是怎樣煉成的?
在了解了盤古大模型在千行百業的能力之后,你是否會好奇——盤古大模型是如何從通用大模型練成行業大模型的?
據華為云人工智能領域首席科學家田奇介紹,當前通用的大模型落地行業存在三大挑戰:
第一個挑戰,大模型通用性強,但專業性弱。落地行業需要具備專業知識,明白行業的工作流程,給出專業準確的回答。
第二個挑戰,大模型知識居多,但技能不足。目前通用大模型多為通用語言大模型,而企業場景復雜,需要模型能說、會看、能想、會算。
第三個挑戰,數據是企業的核心資產之一,大模型可以有效地存儲和挖掘知識,但訓練和使用大模型需要保證企業數據的安全合規。
為了應對這些挑戰,如上文所述,華為把盤古大模型的結構分為三層。
其中,L0基礎大模型已經存儲了大量知識,但如何將這些知識靈活地加以運用,以解決實際問題,就需要名師加以引導。
在L0功能的構建階段,華為通過有監督、精調技術和強化學習來對模型進行引導,讓模型在其收集的5000多萬條高質量題庫上進行大量的練習,掌握了上百種的能力。
讀了萬卷書,也有了名師指導,接下來就要進入行萬里路的階段。行萬里路就是將模型應用到具體的行業中,學習各種專業知識,在行業工作流程中進行大量的錘煉,從而得到各個行業大模型。這一階段,華為將與合作伙伴共建,沉淀行業know-how,解決企業實際的生產問題。
在盤古大模型 的L0功能層,華為做了上百種能力,比如語言模型的事實問答、文案生成等能力;視覺模型的檢測、分割、三維重建等能力;多模態模型的文生圖能力;科學計算的偏微分、基于方程求解、分子屬性預測等能力;以及模型編排和插件調用等高階能力。
華為深耕行業,讓盤古大模型從知到行,有四大關鍵舉措。
第一個關鍵舉措是沉淀行業知識。盤古學習了十多個行業的公開數據,涵蓋金融、政務、氣象、醫療健康、互聯網、教育、汽車、零售等。更為重要的是,華為有30多年行業經驗的積累。近年來,其也成立了10多個軍團深耕行業,深入了解了400多個業務場景,幫助大模型具備行業知識,熟悉行業機理。
第二個關鍵舉措是淬煉行業技能。即結合專家和行業數字環境的反饋進行強化學習,以達到符合行業應用的最佳結果。
第三個關鍵舉措是對話專業工具。除了人與機器的對話,在行業應用中,和華為更多地解決的是機器與工具的對話,以此將大模型與業務系統進行融合,產生對話與交流,讓大模型能夠調用大量的行業資產和工具
第四個關鍵舉措是保證安全合規。盤古提供公有云、混合云、大模型專區這三種模式,保證安全的部署,同時建立長效機制,確保大模型安全。合規包括數據集來源和使用合規數據,全生命周期安全構建完整的數據標注以及審核機制,構建模型合規使用的政策,確保大模型的使用邊界。
寫在最后
任何一門技術突破都需要以產業賦能為技術指引,對于大模型而言,如果在消費場景處在追趕國外的境況,不妨直接從產業側出發,依托中國本身具備的龐大業態尋求突圍機會。
在華為看來,人工智能要面向千行百業走深向實,創造更大的價值。當前,AI for Industry,使能行業,以及AI for Science,助力科研是關鍵方向。
古有盤古開天地,今有盤古縱四海。當其他大模型還在吟詩作畫、講段子、抖機靈的時候,盤古大模型下礦井、上鐵路、深入網點、走進車間,賦能千行百業的創新,這就是華為云一直以來所秉持的核心價值理念。
華為云堅定的表示——未來我們也將一如既往的秉持這個理念,用盤古大模型賦能千行百業。