隨著英偉達公司市值在上周短暫登頂全球之首,一個大變革的時代正在愈演愈烈。
縱觀股市發(fā)展歷史,我們可以發(fā)現(xiàn)一個有趣的規(guī)律:每當一家公司躍升為全球市值冠軍,往往預示著其所處行業(yè)將引領未來十年甚至更長時期的經濟增長。這些巨頭的崛起,猶如一座座時代的燈塔,照亮了產業(yè)變革的航道。
而此時此刻,隨著生成式人工智能(Generative AI)的日新月異,AI正悄然走向下一個前沿陣地——比特與原子的交匯點。
英偉達,作為最早洞察這一趨勢的科技巨擘,敏銳地提出了AI發(fā)展的新重心:從生成式AI轉向實體AI(Physical AI)。這意味著,AI系統(tǒng)將不再局限于虛擬世界的創(chuàng)造,而是要深入理解現(xiàn)實世界的物理法則與復雜環(huán)境,進而推動自動化服務機器人的加速普及。
英偉達近期還趁熱打鐵,發(fā)布了AI Enterprise-IGX平臺和Omniverse微服務,以提升AI在邊緣環(huán)境中的大規(guī)模部署能力,為實體AI的發(fā)展鋪平道路。
與此同時,蘋果公司在最新的WWDC大會上也拋出了重磅發(fā)布:Apple Intelligence。這個全新的AI架構最吸引眼球的,莫過于其邊緣和云端混合的組合模型,以及端到端加密的隱私計算技術。在這種設計下,每位iCloud用戶都能擁有獨一無二的個性化模型,實現(xiàn)基礎模型與用戶同步進化。蘋果正巧妙利用自身在移動終端的優(yōu)勢,彌補在大語言模型領域的后發(fā)劣勢。
實體AI這個概念,源自英國帝國理工學院研究人員的創(chuàng)見,并被投資機構Coatue納入其最新的AI四階段S曲線發(fā)展圖。
這四個階段分別是:AI基礎架構、邊緣AI、AI應用和實體AI。每個階段都呈現(xiàn)出獨特的投資機遇和挑戰(zhàn)。
AI基礎架構:已進入第二輪角逐。當前數(shù)據(jù)中心內與AI相關的服務器僅占9%,但終將增長至90%;AI耗電量僅2%,云平臺AI模型收入占比才3%。競賽方興未艾,但基礎架構已是AI投資最成熟的賽道。
邊緣AI:尚處概念炒作階段。Coatue將AI手機和AI PC劃歸此類。隨著擁有海量用戶的蘋果殺入AI市場,谷歌和蘋果的角力將更趨白熱化。
AI應用:百花齊放的早春時節(jié),投資風險不小。軟件巨頭憑借既有用戶基礎進場占優(yōu),初創(chuàng)公司則壓力山大。
實體AI:我們正處于一個獨特的時間節(jié)點。得益于強化學習、計算機視覺和大模型(LLM/VLM)的長足進步,諸多昔日不可能的工業(yè)應用場景,現(xiàn)已近在咫尺。譬如:以最少人工干預,實現(xiàn)新型材料的閉環(huán)預測、模擬、生產與測試;研發(fā)在偏遠沙漠布設太陽能板的機器人,效率比人工高1000倍;應用自主控制,大幅提升水泥、化工等高耗能工業(yè)流程的管理效率;利用自主工廠,將制造成本高企的產品生產線遷回國內。未來5-10年,人工智能必將徹底重塑我們的物理世界。
當前,AI基礎設施的競賽已如火如荼,而實體AI的角逐才剛剛起步。
要為用戶帶來流暢的智能體驗,必須實現(xiàn)軟硬兼施。在這個快速迭代的智能時代,傳統(tǒng)的應用開發(fā)模式面臨巨大挑戰(zhàn)。我們也許根本無需開發(fā)應用,只需通過各種硬件和自然對話交互,以端到端的方式為用戶解決問題。因為,這是一場遠超互聯(lián)網(wǎng)和移動時代的新工業(yè)革命。
今天,讓我們一起探尋比特與原子的交匯點,揭秘實體AI的機遇與挑戰(zhàn)。
什么是實體AI?
實體人工智能(Embodied AI)是人工智能技術的一個新興分支,旨在解決與物理世界直接交互的問題。不同于傳統(tǒng)的人工智能系統(tǒng),如金融推薦系統(tǒng)、聊天機器人或智能游戲,實體人工智能系統(tǒng)能夠通過傳感器感知周圍的環(huán)境,并通過執(zhí)行器對環(huán)境進行操作和改變。
實體人工智能的一個顯著特點是,它需要處理來自真實世界的海量異構數(shù)據(jù),這些數(shù)據(jù)往往具有不確定性和不完整性。同時,實體人工智能系統(tǒng)的行為結果也存在一定的不確定性,因為它們所處的環(huán)境是復雜多變的,并且往往需要與人類共享環(huán)境。因此,如何在不確定環(huán)境中做出智能決策,是實體人工智能面臨的一大挑戰(zhàn)。
以機器人領域為例,目前的機器人在“智能”程度上存在很大差異。
傳統(tǒng)的工業(yè)機器人主要執(zhí)行高度重復的任務,很少需要與環(huán)境和人類交互。而服務機器人則需要大量的傳感器來感知環(huán)境,如導航、抓取物體、識別人臉等,同時它們的行為結果也不那么確定。這些服務機器人是實體人工智能的典型代表,它們需要更高級的智能來應對復雜多變的現(xiàn)實世界。
但實體人工智能的應用遠不止機器人。
我們可以設想一個智慧城市的場景,通過在公共設施上安裝大量微型傳感器,來實時監(jiān)測城市的污染水平。人工智能算法可以融合這些傳感器數(shù)據(jù),精確預測污染的分布情況。同時,算法還可以主動控制傳感器的移動路徑,引導它們到達信息量最大的區(qū)域。
更進一步,系統(tǒng)還可以通過城市攝像頭識別移動污染源(如車輛),從公開渠道挖掘其他污染源的信息。最后,這個物理數(shù)據(jù)驅動的智慧系統(tǒng)可以對城市居民和管理部門提供兩方面的決策支持:一是向居民推薦避開高污染區(qū)域的路線,二是控制交通引導,合理疏散和分流人群。這個場景展現(xiàn)了實體人工智能融合物理世界數(shù)據(jù),實現(xiàn)智能感知、決策與控制的巨大潛力。
當前,我們正處于一個人工智能蓬勃發(fā)展的時代。得益于機器學習算法的進步,以及算力、數(shù)據(jù)的積累,許多以前看似不可能的任務正在被逐一攻克。
未來5到10年,人工智能有望在先進制造、智能電網(wǎng)、自動駕駛等領域得到大規(guī)模應用,徹底改變我們的物理世界。而實體人工智能作為連接虛擬與現(xiàn)實的橋梁,必將在這場智能革命中扮演關鍵角色。
在人工智能的浪潮中,邊緣智能、具身智能和空間智能如三股清流,漸漸匯聚成實體智能(Physical AI)的洪流。
這是一場從虛擬走向現(xiàn)實、從抽象走向具象的壯麗躍遷,預示著人工智能正全面滲透并重塑我們的物理世界。
邊緣智能力圖將AI算力從云端下放至邊緣設備,讓智能在數(shù)據(jù)源頭就能實時響應;具身智能則致力于將AI與機器人硬件深度融合,使其能感知、理解并操控三維空間;空間智能則探索如何用AI理解和優(yōu)化人類活動的空間布局。
三者雖各有千秋,但殊途同歸,無不試圖打破數(shù)字與物理世界的藩籬,讓AI融入現(xiàn)實。
這種趨同絕非偶然。當前AI的主戰(zhàn)場仍局限于線上數(shù)據(jù)和應用,而人類生活的主要空間依然在線下。邊緣、具身、空間只是實體智能的不同切入點和落地路徑,其共同目標都是服務并改變物理世界。正因如此,英偉達將實體智能視為繼生成式AI之后的下一個制高點,蘋果也在加緊布局邊云協(xié)同的“上下同欲”。
實體智能的崛起,意味著AI創(chuàng)新的重心正從算法回歸到場景,從實驗室走向產線車間、城市街道和人們的日常生活。
這對傳統(tǒng)軟件開發(fā)模式提出了挑戰(zhàn)。單純的云端AI恐難以應對實體世界的多樣性和復雜性,開發(fā)者需要在算法、硬件、場景之間找到微妙平衡。應用也將不再是孤立的軟件,而是與真實環(huán)境深度融合、持續(xù)互動的智能系統(tǒng)。
隨著實體智能的發(fā)展,未來將不再有單一的“軟件應用”,取而代之的是各種基于AI的智能服務。
工廠里的機器人、口袋中的手機、家中的智能音箱…這些智能設備將以不同形態(tài)和方式,與人類和環(huán)境展開實時互動,無縫滿足人們的各種需求。這是一場數(shù)字革命,但觸發(fā)點在物理;是一場工業(yè)革命,但生產力在智能。
事實上,許多企業(yè)已在探索實體智能的應用。與依靠算力的云端生成式AI之爭不同,擁有最佳使用場景的企業(yè)可能將勝出。
特斯拉更新了公司的生態(tài)圖,標題為“More Than Just Vehicles”,暗示他們不僅僅是造車的。特斯拉正通過其改進版本驅動Optimus機器人,馬斯克在最近一次財報電話會上表示,計劃今年底讓Optimus在Giga factory代替人類干活。
這張圖將AI Compute與軟件驅動系統(tǒng)置于中心,構建起智能制造、能源存儲、電動車、自動駕駛和人形機器人的全新生態(tài)網(wǎng)。很明顯,這次財報已暗示了特斯拉的轉型,從卷電動車的紅海轉向現(xiàn)實世界AI的新疆域。
英偉達有一個更宏大的計劃,在今年GTC大會的“One More Thing”環(huán)節(jié),他們宣布推出GR00T項目,一個通用智能體。其目標是為通用人形機器人構建基礎模型,使其能在不同實體間遷移。訓練過程類似OpenAI訓練GPT-4,通過在海量環(huán)境中訓練獲得通用性。英偉達將通過它以1000倍速運行物理模擬,生成無限復雜精細的虛擬世界。
OpenAI在實體AI領域也頻繁投資。今年1月,其投資的人工智能和機器人公司1X宣布推出第二代機器人NEO,這是一款雙足人形機器人,旨在執(zhí)行消費者家中的日常任務。最近,一家名為Physical Intelligence的新公司宣布成立,稱其目標是開發(fā)AI來為“當今的機器人和未來的物理驅動設備”提供動力。
據(jù)該公司網(wǎng)站介紹,Physical Intelligence正處于構建基礎模型和學習算法的早期階段。其團隊包括工程師、科學家、機器人專家和公司建設者,得到了OpenAI和紅杉資本等知名機構的投資。
值得注意的是,該公司的目標并非為倉庫或工廠中執(zhí)行重復性任務的機器人提供動力,而是構建一個可用于各種應用的通用人工智能模型。Physical Intelligence不會制造硬件,他們購買不同類型的機器人來訓練其軟件。
創(chuàng)建一家智能機器人公司需要漫長的時間,構建任何實體都需要更大的創(chuàng)造力、商業(yè)頭腦、時間,以及最重要的“精明的”資金。然而,我們有可能將Web3與AI結合,加速實體AI的到來,為這一過程注入新的活力。而DePIN(去中心化物理基礎設施網(wǎng)絡)正是連接Web3與實體經濟的橋梁。
在DePIN生態(tài)下,實體智能的商業(yè)模式創(chuàng)新有望迎來新的突破。初步的實體智能應用通常采用設備銷售、軟件授權等相對單一的盈利方式,難以適應物聯(lián)網(wǎng)環(huán)境下多元主體、多場景的復雜需求。而DePIN獨特的token經濟模型,為實體智能商業(yè)模式創(chuàng)新提供了新的思路和工具。
首先,DePIN通過token激勵機制,可以有效調動分散在全球各地的邊緣設備參與智能計算和數(shù)據(jù)共享。邊緣設備提供商可以將其閑置的計算、存儲資源注入DePIN網(wǎng)絡,并以此獲得token獎勵。這種激勵模式不僅可以顯著降低實體智能的部署成本,還能促進計算資源的彈性供給和按需使用。
其次,DePIN的token經濟有助于構建實體智能應用的多邊市場生態(tài)。在這個生態(tài)中,邊緣設備提供商、數(shù)據(jù)提供方、算法開發(fā)者、應用服務商等主體可以通過token實現(xiàn)價值的自由流動和交換。例如,一家智慧城市服務商可以通過DePIN購買邊緣設備提供的算力,利用數(shù)據(jù)提供方提供的城市物聯(lián)網(wǎng)數(shù)據(jù),整合算法開發(fā)者的智能模型,從而構建全新的實時城市管理方案。
再次,DePIN的token機制為實體智能應用提供了全新的盈利渠道。一方面,實體智能服務商可以直接向用戶收取token服務費,或者采用token+傳統(tǒng)支付的組合盈利模式。另一方面,服務商還可以通過質押token參與DePIN生態(tài)治理,分享整個網(wǎng)絡的增值收益。
最后,DePIN的token經濟還將助力實體智能在垂直行業(yè)的商業(yè)模式創(chuàng)新。以工業(yè)互聯(lián)網(wǎng)為例,DePIN可以成為連接工廠內外的token交換平臺。設備制造商、工業(yè)軟件服務商、第三方數(shù)據(jù)分析機構等,可以基于token實現(xiàn)互信協(xié)作,共同為工業(yè)客戶提供端到端的實體智能解決方案。
綜上,DePIN的token經濟為實體智能商業(yè)模式創(chuàng)新開辟了廣闊空間。通過token激勵資源共享、構建多邊生態(tài)、拓展盈利渠道、賦能行業(yè)變革等機制,DePIN將推動實體智能走向規(guī)模化應用和產業(yè)化發(fā)展。
實體智能的崛起,標志著人工智能正從虛擬世界走向現(xiàn)實,從數(shù)字空間走向物理空間。這是一場全方位的變革,將重塑我們生產和生活的方方面面。
按照投資機構Coatue的推測,我們將見證一個新物種的誕生:Humanoid。它的大腦是GPU、知識教育來自大模型、它的家就是數(shù)據(jù)中心,它的食物就是電力,而我們需要學習的是如何與Humanoid共存。