2025 年初,DeepSeek 憑借其高效能、低成本的開源特性迅速引爆市場。
此前,以大模型為代表的 AI 在邊緣和端側推理應用存在諸多挑戰,比如邊緣側的計算能力與存儲容量難以滿足大模型的微調和推理需求,模型壓縮與輕量化可能導致精度損失從而影響業務結果等……而隨著算法技術的不斷進步,包括模型量化、剪枝、蒸餾等模型壓縮算法的發展,以及專為端側部署設計的軟硬件平臺的出現,AI 大模型在端側設備的部署變得更加高效便捷——DeepSeek-R1 正是其中的突破性選手。
具體而言,DeepSeek-R1 通過高效蒸餾技術,將大模型的推理能力遷移到更小、更高效的版本中。這一突破使其小尺寸版本在保持卓越性能的同時,顯著降低了模型體積和計算資源需求,成為端側部署的理想選擇。
當 AI 大模型從云端下沉至邊側,一場“端側 AI 革命”正悄然展開。在這場革命中,通信模組作為連接物理世界與數字世界的核心紐帶發揮著至關重要的作用,成為產業關注的焦點。2025 年,在 DeepSeek 浪潮的引領下,智聯網產業或將迎來“端側 AI 元年”。
近日,我們能看到包括美格智能、廣和通、移遠通信、芯訊通在內的多家物聯網模組企業紛紛發布了旗下 AI 模組適配 DeepSeek 的消息,筆者整理如下:
美格智能
1 月 26 日,美格智能在官微發布消息稱,其研發團隊結合 AIMO 智能體、高算力 AI 模組的異構計算能力,結合多款模型量化、部署、功耗優化 Know-how,正在加速開發 DeepSeek-R1 模型在端側落地應用及端云結合整體方案。
超低功耗:首先持續對 DeepSeek-R1 模型的推理延遲進行優化,保證模型在高算力模組軟硬件環境下的超低功耗運行。
開發工具鏈:不斷進行工具鏈打通,模組內嵌的 SNPE 引擎直接支持 DeepSeek-R1 模型的 ONNX/TFLite 格式,大模型適配周期將大幅縮短。
端云協同:結合動態卸載技術,根據任務復雜度自動分配端側與邊緣計算資源,保障實時性與能效平衡。為客戶提供端云協同模板,面向開發者提供動態任務分配框架,簡單配置即可實現“本地優先,云端兜底”。
同時,公司將結合美格智能自研的 AIMO 智能體及 DeepSeek-R1 模型的基礎能力,開發面向工業智能化、座艙智能體、智能無人機、機器人等領域的 AI Agent 應用。
受 DeepSeek 概念影響,1 月 24 日至 2 月 10 日,美格智能股價區間漲幅達 77.20%。
廣和通
2 月 10 日,廣和通在官微發布消息,稱其高算力 AI 模組及解決方案全面支持小尺寸的 DeepSeek-R1 模型,高效且靈活地構建深度學習體系,不僅保護數據隱私,更大大提升終端推理和運算能力。
面向更廣泛的行業端側 AI 應用,廣和通將積極推動 DeepSeek 等優質模型在高、中、低算力 AI 模組及解決方案部署,提供不同參數模型服務,進一步降低端側 AI 的門檻,并優化成本,幫助客戶快速增強終端 AI 推理能力,賦能更廣泛的物聯網設備實現 AI 化。
移遠通信
2 月 12 日,移遠通信在官微發布消息,宣布其搭載高通 QCS8550 平臺的邊緣計算模組 SG885G,成功實現了 DeepSeek-R1 蒸餾小模型的穩定運行。實測數據顯示,其生成 Tokens 的速度超過每秒 40 個 Tokens,且未來隨著性能的不斷優化,速度還將進一步提升,為智能終端設備帶來更強大的 AI 能力。此外,在成功實現 DeepSeek 模型端側運行的基礎上,移遠通信還完成了該模型的針對性微調,并應用于自身的大模型解決方案中,為客戶提供更精準、更高效的端側 AI 服務。
據悉,搭載 DeepSeek 模型的移遠邊緣計算模組和解決方案,不僅適用于消費類和工業類機器人領域,還可廣泛應用于智能座艙、機器視覺、個性化虛擬助理、平板電腦、老人監護、智能家居、AI 玩具及可穿戴設備等多元化場景。
芯訊通
2 月 12 日,芯訊通 SIMcom 官微發布消息稱,芯訊通高算力 AI 模組 SIM9650L 已實測跑通 DeepSeek R1 模型,AI 算力超過 14Tops,能夠高效地幫助客戶終端搭建深度學習體系。
目前,芯訊通正在開展相關技術研究接入豆包等其他大模型,積極探索更多深度應用。AI 大模型爆火背后,是產業智能化對價值創造的本質需求,芯訊通將以通信模組為支點,通過“模組+算法+場景”的深度融合,讓端側 AI 真正落地。
有方科技
2 月 13 日,面對“公司是否針對 DeepSeek 相關模型開展了模型適配及端側部署工作”的問題,有方科技在投資者關系平臺上答復表示,公司依托于自身物聯感知體系“云-管-端”架構建立的優勢,積極融合物聯網與人工智能技術,在 Deepseek 模型上,公司一方面正在云側基于模型融合公司運管服云平臺開發城域物聯感知模型,另一方面也正在端側開展模型與模組的適配工作,但目前還處于在研狀態,尚未產生收入。
值得強調的是,雖然不少模組企業因布局端側 AI,股價迎來大幅上漲,但尚且無法判斷相關概念股是否真正受益于 DeepSeek 的技術突破,還是僅僅在蹭熱點?許多產品都處于早期研發階段,尚未產生明確訂單,未來是否能產生收入及產生多少收入受市場需求和公司市場拓展進度影響,具有很強的不確定性,尚有賴于應用端和最終用戶的檢驗。
而智聯網模組企業以及整個產業鏈上下游要想進一步將拓展端側 AI 能力,還需要克服以下挑戰:
首先是計算資源受限問題。這包含三個維度:第一是算力限制,端側設備(如嵌入式系統、移動設備、工業設備等)通常受制于處理器性能,無法匹配云端數據中心的 GPU、TPU 等高性能計算單元;第二是存儲和內存限制,端側設備的存儲容量有限,無法容納大規模的 AI 模型和數據集;第三是能耗限制,端側設備通常依賴電池或低功耗架構,難以支持高功耗的 AI 推理任務。
如今,DeepSeek 為解決計算資源受限挑戰提出了突破性的思路。DeepSeek 是一個具有 6710 億參數的大型語言模型,其基于預訓練的開源模型(如 LLaMA)進行改進和微調,推出了多個精簡版本(參數從 15 億到 700 億不等),降低了對硬件資源的要求,使其能夠在資源受限的設備上運行。
未來,在 DeepSeek 的啟發的引領下,更多類似的模型或將被陸續推出,從而給端側 AI 帶來無窮的想象力。對此,模組企業需要持續優化平臺部署,大幅縮短新模型的落地周期,從而賦能終端側真正享受到 AI 帶來的受益。
然后是端云協同部署問題。如今,關于邊緣和云端哪個是理想工作負載位置的爭論,已經逐漸被現實的共生關系所取代——云端(Cloud)負責高性能計算、大數據存儲、深度學習訓練等任務;邊緣(Edge)靠近數據源,負責實時推理、數據預處理、流式計算等;端側(Device)處理本地任務,如智能手機、傳感器、IoT設備的輕量化推理……隨著跨云、邊緣和數據中心的高效數據處理和流動需求不斷增長,混合邊緣-云的應用趨勢將繼續提升。
對智聯網解決方案提供商而言,未來需要以協同化的架構,進一步合理劃分云、邊、端計算任務,確保在保證性能的同時優化能耗和數據同步效率。
最后是應用場景適配與生態建設問題。不同應用場景(智能家居、智能制造、自動駕駛等)對計算能力、功耗、隱私等有不同需求,對此,模組企業需要定制化產品和服務。
美格智能提及,未來將推出面向 AI 場景的訂閱服務,針對中小型的 B 端或 C 端客戶,推出“端側 AI 能力包”,與大模型廠商合作,針對 Token 輸入/輸出數量、不同類型模型調用、流量費用等領域,推出一體化端側 AI Turn-key 方案。
總體而言,雖然道路是波折的,但前途是光明的。根據 Market.us 的預測,從2022 年至2032 年,全球端側 AI 市場空間將從 152 億美元提升至 1436 億美元,年復合增長率達 25.9%。
而隨著端側 AI 的進一步深入落地,我們將看到除手機、PC、智能眼鏡、耳機等傳統設備外,家電、機器人、教育辦公設備、玩具等也將深度集成 AI 功能,形成“萬物皆可 AI 化”的生態。
回顧模組的發展歷程,標準通信模組從 1.0 時代的純通信能力,到 2.0 時代利用 Open CPU 技術替代外部 MCU,實現一些簡單的邏輯控制能力,到 3.0 時代的同時具備 4G/5G 高速通信能力以及內置智能化操作系統和豐富的外設接口。復雜系統的智能模組經歷了史無前例的快速發展,大大加速了傳統行業的信息化和智能化的改造進程。
而在模組不斷進化迭代的過程中,市場迎來過“春風”,也經歷過“寒冬”。Counterpoint 數據顯示,受需求減少影響,2023 年全球物聯網模組出貨量首次出現下滑,同比下降2%,但2024年隨著庫存水平正常化和智能電表、POS、汽車等領域需求增加,模組市場有望下半年恢復增長。伴隨 5G、AIoT 等技術應用,預計 2025 年市場將出現大幅增長。
如今,端側 AI 概念的爆發又為模組市場注入了新的動力,在此影響下,整個市場的“回暖”或許會比預期中來得更早一些。
參考資料:
美格智能AIMO智能體+DeepSeek-R1模型,AI應用的iPhone時刻來了,美格智能
移遠通信邊緣計算模組成功運行DeepSeek模型,以領先的工程能力加速端側AI落地,移遠通信
芯訊通高算力AI模組SIM9650L實測跑通DeepSeek R1模型,芯訊通
正在端側開展Deepseek模型與模組的適配工作,有方科技
端側AI元年爆發!廣和通AI模組及解決方案全面支持DeepSeek-R1蒸餾模型,廣和通
廣和通/美格/移遠/日海紛紛布局,一文盤點算力模組現狀、挑戰和前景,物聯網智庫
戴爾副總裁:五大趨勢將定義智能邊緣的發展,戴爾