大模型的火正以燎原之勢從學術界到產業界,再到工業界,引發了廣泛的關注和討論。然而,大模型在工業領域的應用面臨著各種挑戰,因為工業界并不期待模型突然產生出乎意料的能力,而是希望模型能夠穩定運行、整合分散的數據并提高效率。
對于工業生產,探索最佳工藝需要大量的專業知識和經驗,對于算法而言,這相當于將工業機理模型這類“黑箱”轉化為可量化的數據和指標,從而將主觀經驗升華為科學且易于使用的工業智能。
目前,國內規模以上工業企業數量超過40萬家,覆蓋41個工業大類、207個工業中類、666個工業小類,存在大量的場景和業務痛點。工業制造領域應用潛力巨大,數字孿生、工業大腦等規?;a等工業場景開始逐步成熟落地,將大模型融入進來形成技術底座,也是大家都在探索的方向。
我們曾在文章《在工業領域談GPT和大模型究竟是不是“扯淡”?當中介紹了業界人士對于將GPT類產品引入工業實現垂直應用的看法。
反對者表示,在大模型應用中經常會遇到一些ChatGPT胡編亂造的“驚喜”,但是工業界不需要“驚喜”,因為很小的故障就可能帶來巨大的損失,此外,工業制造細分領域眾多,各領域在生產流程、工藝、生產線配置、原材料及產品類型上均具有較大差異,強調的是細分行業的機理融合和行業知識,如果沒有海量數據標簽,基本上不可能形成類似GPT的大模型。
支持者則表示:生成式AI類產品能夠壓縮設計和迭代的流程,帶來效率的提升,在數據追蹤與分析、人機交互方面也具有很好的優勢。
北京信息化和工業化融合服務聯盟理事長閆同柱接受媒體采訪時表示:工業互聯網平臺下方有終端軟件,中間有操作系統,但還缺少一個大腦,大模型可以充當這個大腦。而工業互聯網平臺沉淀了大量人機料法環測(人員、機器、原料、方法、環境、測量)的數據,也能反過來滿足大模型的大數據需求。
卡奧斯COSMOPlat就是這樣一個工業互聯網平臺,擁有幾十年工業制造的數據知識圖譜和產業know-how,也在工業大腦領域深耕多年,致力于將行業AI落地應用進行廣泛落地,是科技部批復建設工業大腦國家新一代人工智能開放創新平臺。讓我們一起來了解一下卡奧斯COSMOPlat的工業大模型。
卡奧斯工業大模型(COSMO-GPT)由卡奧斯COSMOPlat基于開源LLM自主研發,擁有百億以上參數并內置了3900多個機理模型、200多個專家算法庫,功能范圍覆蓋智能問答、文本生成、圖文識別、控制代碼生成、數據庫查詢、輔助決策、運籌規劃等。
COSMO-GPT被賦予了更廣博的工業知識和更深度的工業行業Know-how,它能夠讀懂工業語言、理解工業工藝及機理、生成工業執行指令及執行工業機械控制,目前主要應用于智能柔性裝配、生產工藝優化、工業企業智能中臺三大領域。將工業互聯網當中的需求轉化成大模型可生成的能力,從工藝、流程、能源、效率和體驗等方面進行優化。
一方面,對于追求精確性的工業而言,工業大腦往往更依賴知識圖譜,知識圖譜能夠準確反映已有的常識、特定領域知識、百科知識以及精確把握多模態的數據,并且在果斷性、可解釋性、一致性等方面則具有非常明顯的優勢。另一方面,盡管知識圖譜在捕捉結構化數據方面表現出色,對于自然語言理解和非結構化文本則捉襟見肘,對于一些不完整的知識和未見事實也存在缺陷。而大模型卻能憑借其常識和泛化性以及超強的自然語言處理與理解能力提升整個系統的可操控性。
通過將大模型的自然語言交互能力、豐富的信息表示能力、圖構建能力與知識圖譜的可解釋性、一致性、信息準確性結合,工業大模型就能比知識圖譜更靈活,比大模型更精確。
圖源:wisecube
為響應工信部號召,著力推動大模型算法、框架等基礎性原創性技術突破,不斷推進算力基礎設施建設,加快產業自主創新??▕W斯COSMOPlat將大模型與知識圖譜相結合,打造了“卡奧斯BaaS工業大腦”,用于實現工業領域的群體智能決策。通過知識圖譜和機理模型等形式的信息,構建了工業大腦平臺的“大腦”,為工業企業提供智能化轉型的平臺底座,解決了千行百業智能化升級的問題。作為卡奧斯COSMOPlat的BaaS引擎的延伸,COSMO-GPT繼承了海爾近40年在數字化、信息化、智能化領域的實踐經驗,為工業設計與研發、機理仿真與數字孿生等領域的應用提供了解決方案。
除了COSMO-GPT外,市面上已經有不少工業大模型:例如,以科大訊飛的星火大模型為模型底座、結合工業場景打造的羚羊工業大模型,具有工業文本生成、工業知識問答、工業理解計算、工業代碼生成、工業多模態五大核心能力,可以從海量數據和大規模知識中持續進化,實現從提出、規劃到解決問題的全流程閉環;也有華為這樣的ICT企業完全面向行業提供服務,以行業需求為基準進行設計的盤古大模型,它能夠根據不同行業和場景需求,選擇合適的基礎大模型,利用數據工程套件構建自動化數據清洗模型,持續提升數據質量;還有來自思謀科技這樣以視覺能力和智能制造起家,涌入大模型潮流當中的工業多模態大模型IndustryGPT V1.0。在軟硬件層面都能夠充分利用大模型的交互與智能決策優勢。還有相當多企業也投入到大模型的研發和實踐當中。
那么,這么多大模型,哪一個才能算是“最懂工業”呢?
這就要看業界的需求和難點是什么,工業生產當中往往存在以下特點:
生產當中的數據保密、呈現碎片化特點,know-how(技術訣竅)不公開;
要素多、流程長,對于人機物協同的要求較高;
高精度、高效率的要求為大模型的建設提高了門檻;
工業界的主要需求在于節能、降碳、增效
制造業致力于數智化轉型、努力發展成新一代智造工業也已成為大勢所趨,而轉型的難點和突破口就是數據和知識。在2023年11月舉辦的CNCC工業大模型論壇上,中科大李向陽教授在《“數據+知識”驅動的工業智能》報告中指出,“數據+知識”協同驅動是實現數智化轉型的突破口,而這也正是COSMO-GPT的典型差異化優勢——擁有大量制造業數據以及專家算法、know-how等產業知識。
綜合來看,COSMO-GPT具有以下顯著優勢,使其能夠著眼于“最懂工業”的大模型:
制造基因沉淀:
COSMO-GPT基于海爾幾十年智能制造經驗沉淀,使其融合深度的工業知識與行業know-how,企業只需將工業軟件部署在BaaS數字工業操作系統就可完成企業AI轉型升級,充分利用大模型這一大腦;
追求工業精度:
通過調用機理模型工具,通過大模型的推理和決策能力,自動生成可精確執行的機器運動控制指令;
模型規模落地:
據悉,該工業大模型已經在注塑、化工等11個行業的產線進行落地實踐,助力工廠注塑領域能耗降低30%、良品率提升10%、停機時長降低15%,在產業鏈剖析部分,COSMO-GPT面對復雜NLP任務處理,能夠通過任務分解、行業知識注入、數據特征分析等方案,提升任務準確率達90%以上。
工藝優化提效:
大模型上線后,解決了以洗衣機生產為代表的離散制造業效率低的痛點,實現了工藝設計環節效率提高不小于30%,換產調試環節效率提高不小于50%。
總的來說:工業大模型已經受到產業的廣泛關注,不同廠商圍繞自身優勢均投入此領域。但工業領域自身的復雜性和精度要求,決定了未來“最懂工業”的大模型需要滿足什么條件。COSMO-GPT秉承卡奧斯COSMOPlat多年助力制造業數智轉型經驗,深度融合行業數據和知識,實現精細化生產優化,其融合行業知識和生產數據,以及生成高精度執行指令的能力,正是工業界所追求的。
當前,工業大模型處于起步階段,各廠商積極探索如何最大限度將大模型技術用于工業。中國工業互聯網研究院在近日發布的《AI大模型工業應用現狀、模式與展望》指出,工業大模型還存在一定的挑戰:應用市場仍以基礎大模型為主,下沉到垂類領域的不夠多;尚未形成標準化、體系化的大模型工業應用范式;從底層開始訓練的大模型具有一定的技術門檻。
隨著大模型向B端尤其是工業領域應用已成為行業共識。大模型已呈現出以基礎大模型為技術底座,工業應用為切入點的發展趨勢,工業大模型概念和落地案例也不斷涌現。未來的大模型也將在數據、安全和商業模式方面開啟更多落地探索。隨著各方共同努力,未來五到十年,相信將見證工業大模型成為智能制造新領域的重要范式,造福更多產業應用。