2025年,產(chǎn)業(yè)鏈進展頻頻,標志著端側(cè)AI進入規(guī)模化商用元年。產(chǎn)業(yè)生態(tài)呈現(xiàn)出雙向奔赴的積極態(tài)勢:終端廠商加速推進“All in AI”戰(zhàn)略轉(zhuǎn)型,通過硬件架構(gòu)重構(gòu)和系統(tǒng)級優(yōu)化打造AI原生設備;上游芯片廠商推出專用NPU架構(gòu);模組企業(yè)則開發(fā)貼合應用場景的端側(cè)AI計算解決方案。至此,產(chǎn)業(yè)鏈上下游形成了“芯片-算法-模組-終端-應用”的協(xié)同創(chuàng)新閉環(huán)。本期《端側(cè)AI領(lǐng)袖之聲:中國端側(cè)AI企業(yè)深度訪談專欄》,物聯(lián)網(wǎng)智庫邀請到移遠通信產(chǎn)品總監(jiān)——王韜,就端側(cè)AI產(chǎn)業(yè)發(fā)展以及移遠通信目前的端側(cè)AI布局進行了深入交流。
終端智能化革命,本質(zhì)上是將AI從技術(shù)特性升維為設備本體屬性,其商業(yè)價值的創(chuàng)造邏輯正在從“功能滿足”轉(zhuǎn)向“智能共生”。在端側(cè)AI技術(shù)推進下,智能終端產(chǎn)業(yè)正在迎來新的戰(zhàn)略機遇期。對于端側(cè)AI的獨特價值,移遠通信產(chǎn)品總監(jiān)王韜表示,“端側(cè)AI部署會將大量的數(shù)據(jù)存儲和處理都在本地設備內(nèi)直接完成,顯著縮短響應時間。其次,可以極大降低個人隱私、工業(yè)生產(chǎn)等敏感數(shù)據(jù)泄露風險。”同時,移遠通信的端側(cè)AI方案支持在離線環(huán)境中運行,大模型在本地即可完成推理,通過模型工程化調(diào)配,整個推理成本也有所降低。王韜認為,在端側(cè)部署 AI,難點在于如何做到平衡。端側(cè)設備硬件資源有限,要在有限的資源里,充分實現(xiàn)端側(cè)AI的高性能、低延遲以及高能效,并非易事。“本質(zhì)上,這是個復雜的系統(tǒng)平衡問題,移遠通信在不斷優(yōu)化,力求讓整個解決方案達到最佳平衡點。”具體來說,首先是模組算力與功耗的平衡。移遠通信會根據(jù)不同的應用場景,對算法壓縮和硬件加速做差異化調(diào)整。在模型效率和精度上,針對端側(cè)模型AI智能的損失,移遠通信運用向量數(shù)據(jù)庫、RAG、模型微調(diào)等一系列技術(shù)加以補償。對于傳統(tǒng)算法模型的解決方案,移遠通信推出了AIFex算法訓練平臺來進行高效訓練,以提升端側(cè)AI設備的智能化程度。從端側(cè)AI本身的獨特價值,到模組、模型、應用的適配調(diào)整,體現(xiàn)了移遠通信在端側(cè)AI模型的開發(fā)和應用能力。移遠通信產(chǎn)品總監(jiān)王韜強調(diào),想要充分發(fā)揮端側(cè)AI大模型的應用潛力,離不開周邊一系列的AI算法,比如音頻算法、圖像算法等等。“端側(cè)大模型周邊的算法是我們的傳統(tǒng)強項,移遠通信不僅提供端側(cè)AI模組,更能提供這種完整的端側(cè)AI算法和整體解決方案。”
在采訪中我們還了解到,在模型落地應用方面,移遠通信已經(jīng)積累了很多年,尤其是端側(cè)部署的AI算法模型。移遠通信在研發(fā)智能模組時,就開始根據(jù)客戶不同的算法需求,積累深度學習、神經(jīng)網(wǎng)絡等方面的技術(shù)。隨著AI技術(shù)爆發(fā),特別是今年端側(cè)模型大量涌現(xiàn),移遠通信憑借積累已久的全棧AI研發(fā)能力,快速推出端側(cè)AI模型整體解決方案。除此之外,不管是傳統(tǒng)的Transformer模型,還是現(xiàn)在以DeepSeek為代表的MoE架構(gòu)模型,移遠通信均表示會持續(xù)關(guān)注,并針對不同架構(gòu)的AI模型,不斷更新AI模型研發(fā)能力,確保在端側(cè)AI時代保持技術(shù)領(lǐng)先。從我們的觀察來看,不論是行業(yè)還是消費者,今年對AI的期待都很高。那么如何憑借AI技術(shù)的積累,講好智能時代的新故事,并利用端側(cè)AI落地發(fā)展周期將用戶生態(tài)培養(yǎng)起來,已經(jīng)成為今年供應商的核心命題。
對于終端廠商而言,如何快速將終端產(chǎn)品、應用場景與本地智能結(jié)合起來,并不是一件容易的事。與終端設備關(guān)系緊密并熟悉應用場景的模組廠商,是將這些串聯(lián)起來的最好的橋梁。模組廠商將端側(cè)算力模組與模型技術(shù)融合,根據(jù)應用場景提供適配解決方案,將大幅縮短端側(cè)智能相關(guān)產(chǎn)品的落地周期。移遠通信的智能模組產(chǎn)品矩陣十分豐富,可滿足低、中、高不同算力需求。對于在計算能效上要求嚴苛的應用,移遠通信能提供12 TOPS算力的SG560D,滿足需要兼顧算力、成本和功耗的端側(cè)應用;主推的搭載高通QCS8550平臺的高性能AI算力模組SG885G,成功實現(xiàn)了DeepSeek-R1蒸餾模型的穩(wěn)定運行,生成Tokens的速度超過每秒40個,且隨著性能的不斷優(yōu)化,速度還在進一步提升。移遠通信產(chǎn)品總監(jiān)王韜透露,100 TOPS左右算力的產(chǎn)品也即將面世。“終端側(cè)場景豐富多樣,對算力和通信功能的需求各不相同,在移遠,我相信客戶總能找到適合的產(chǎn)品。”算力硬件構(gòu)筑起基礎(chǔ)底座,在模型層面,移遠通信端側(cè)AI大模型解決方案以“LLM(大語言模型)+ RAG(檢索增強生成)+ Agent(智能體)”技術(shù)三角為核心,通過對AI模型的深度優(yōu)化與增強,重新定義了 AI 端側(cè)設備的智能化邏輯。特別是隨著DeepSeek AI模型帶來的開源潮熱度持續(xù)上升,今年AI模型在多模態(tài)領(lǐng)域也“卷”了起來,具備多模態(tài)交互推理能力的多模態(tài)模型成為焦點。
王韜在采訪中分享了移遠通信在多模態(tài)模型上的布局,他表示,“在高端算力模組方面,移遠通信在端側(cè)離線多模態(tài)大模型的部署和運行已經(jīng)取得成果。針對低算力模組,可采用端云融合的方式來滿足多模態(tài)交互的應用場景。”隨著算力模組性能進一步提升,更多智能功能得以在本地實現(xiàn),這也意味著更多終端設備能向更高階的智能化躍升。小到PC、玩具、可穿戴設備,大到家電、智能汽車、具身智能機器人,移遠通信憑借全棧AI研發(fā)實力,針對不同終端應用持續(xù)優(yōu)化其AI方案,解決了多層次的軟硬件AI場景需求,助力終端設備智能化功能更早落地。隨著模組廠商持續(xù)優(yōu)化硬件平臺、端側(cè)算法模型,全力促進場景落地,端側(cè)智能應用有望在今年迎來爆發(fā)式增長,成為最值得期待的行業(yè)看點。
展望今年的端側(cè)AI發(fā)展,移遠通信產(chǎn)品總監(jiān)王韜表示,“端側(cè)AI市場雖然分散,但積少成多,我們認為這是一個巨大的增量市場。端側(cè)AI即將迎來爆發(fā),端側(cè)設備智能提升必將實現(xiàn)。”