AIGC的風已經刮到了實時互動(RTE)領域,并且已經有企業乘風起勢。
提到RTE,亦或是實時音視頻(RTC),可能很多人感覺到陌生,但其實,在視頻會議、線上直播、網上課堂等場景中,正是RTC與RTE支撐起了低時延、高清晰、深度沉浸的互動體驗。
從2015年前后,短視頻、直播興起,才令人們對于實時音視頻有了更加具象的認知。隨后,疫情爆發之下“全民宅家”所催生的視頻會議、在線教育、電商直播也使得實時音視頻需求迅速爆發。
據36氪研究院發布的數據顯示,實時音視頻在國內360、華為、小米三大安卓應用市場的近10,000個App中的滲透率,2015年還不到1%,2021年已突破30%。業界認為,在未來幾年,實時音視頻技術在關鍵行業的滲透率可能將超過50%。
對于很多消費者而言,RTC、RTE作為默默耕耘在應用背后的重要技術,或許并沒有得到頗高的關注,但在產業端,這個能夠迸發出創新應用的領域卻是在持續成長中逐漸與越來越多的場景結合。
這也令筆者想起了此前與聲網相關負責人的一次訪談——“即便你過去沒有聽說過聲網,但你一定用過聲網的服務”。的確,作為最早一批入局實時音視頻領域的企業,聲網雖然在C端并不似生態繁榮的大廠那般名頭響亮,但其全球注冊應用在2022年9月就已超過 51.1 萬,在行業內的影響力可見一斑。
就在今天上午,RTE 2023第九屆實時互聯網大會在北京召開,這個由聲網從2015年搭建而成的交流平臺,也逐漸成為了RTC的行業聚會,而在今天上午的主論壇上,AIGC無疑成為了主旋律。
AIGC+RTE,玩出什么新花樣
從去年年底開始,ChatGPT異軍突起,甚至被黃仁勛稱為人工智能的“iPhone時刻”。時至今日,這場圍繞大模型、AIGC的狂歡還在持續,并且有更多相關的技術、行業參與其中,RTE其實并不是最早加入的,但應該算得上是極富創造力的。
首先來了解一下什么是RTE。
據悉,2020年,聲網在上市招股書中首次公開提出“RTE(Real-Time Engagement)”概念,此后這一概念逐漸被全行業認可和使用。此前,更多被業內所熟知的RTC更多是強調對語義信息進行高質量和高效率的傳遞,而RTE則是更聚焦用戶所需要的共享時空,即場景。
換言之,RTC是從信息傳遞的角度出發,而實時音視頻也僅僅提供語音溝通,能夠滿足單一的場景和通話標準。而隨著實時互動的創新場景涌現,加之人們對于通話質量的要求提升,低時延、高清晰的實時互動需求恰恰是RTE的專長。
而火爆的AIGC自然是不需要過多介紹了,從聊天機器人到AI助理,再到到虛擬女友,再到復刻親人形象,其已經多次展示了驚人的創造力。
那么,RTE又能夠與AI擦出哪些火花呢?
聲網創始人兼CEO趙斌在RTE大會上展示了聲網鳳鳴AI引擎優化線上課程噪聲的案例,以及利用AI算法提升實時視頻清晰度的案例,進一步介紹了AI對于RTE行業的顛覆式改造。此外,面向社交和泛娛樂場景的實時互動,AIGC相較傳統的AI對話機器人,還能夠提供更加接近于真人的情感價值和情緒價值。
趙斌還表示,AIGC對于RTE行業的另一個影響便是可以大幅提高應用開發效率。從編程、自動化測試再到文檔生產以及低代碼平臺進化,都將得到一定的促進。雖然很多影響和變化還都處于早期階段,但未來值得釋放的空間仍非常值得期待,還有很多想象仍未被實現。
例如,AIGC能否徹底顛覆低代碼形成的方式,以對話的形式指令機器來生成代碼,甚至不光是生成代碼,而是生成完整的應用,從而實現新一代的無代碼能力。
至于聲網,作為RTE賽道的開創者,其也率先推出了AIGC RTE能力模塊,可以和任何大模型平臺對接,將現有的文字交流的互動方式和溝通方式轉化成更加自然的語音對話,同時也保障了接近人與人對話的低時延體驗。
據介紹,目前聲網RTE x AIGC一站式解決方案,可以將 AI 對話端到端響應延時控制在1.9秒以內,并且支持API快速調用,提供開箱即用的場景化demo,最快3個小時即可實現方案驗證。
趙斌也表示,除了社交、直播、泛娛樂場景等,企業用戶近年來開始積極擁抱實時互動所帶來的一系列變化,開始基于RTE進行效率優化。企業也意識到如今的實時互動能力已經遠遠超出了企業內部視頻會議的需求,而實時互動平臺也不僅僅是視頻會議平臺,其所提供的無所不答的實時網絡以及無所不及的音視頻能力,正在成為企業數字化轉型的一個重要支撐。
對于幾萬、甚至幾十萬人的大企業而言,往往需要構建全域一張網、全業務一張網、全設備一網通、全業務多形態連接的基礎能力。聲網也可以配合企業構建音視頻實時互動平臺,用統一中臺的方式,改造企業內部過去做一個應用就要重新建一套系統、重新部署網絡的低效、重復建設模式,從而極大地提高企業在業務上的靈活度和效率。
值得注意的是,在演講的最后,趙斌也帶了one more thing——聲網在RTE行業里面首次實現了廣播級的4K超高清實時互動體驗。
5G能與實時音視頻擦出什么火花?
雖然RTE 2023大會的主論壇主要聚焦在了AIGC與RTE的結合,但其實圍繞實時互動的通信技術升級也是不容忽視的重要底座。過去,業內一直在期待5G能夠幫助RTE領域實現4G所未能達到的體驗。
一方面,5G的超大帶寬、超低時延等特征,可大幅降低音視頻信息的延遲和緩沖時間,提高端到端毫秒級傳輸時延的滿足率,為RTC的數據傳輸奠定了堅實的基礎。另一方面,5G的商用之于不斷涌現的實時音視頻場景而言也是恰逢其時。
例如,在智慧醫療領域,無論是5G遠程會診,還是遠程手術示教、遠程教學等場景,都需要低時延、高清晰的實時音視頻系統。
此外,以聲網的超低延時平行駕駛和平行控制方案為例,該方案面向以無人車、機器人為代表的智能設備遠程運維、人工接管和遠程控制場景。針對于同城遠程控制,聲網解決方案通過標記優先級優化路由調度策略和同節點轉化方式,保障該場景下的延時傳輸質量。
同時還結合了多運營商物聯網卡場景下,通過Multipath多路徑融合的技術,保證網絡質量的可用性和弱網對抗能力。據悉,實測數據顯示,從無人駕駛車輛攝像頭畫面采集,到遠程控制臺顯示,聲網能做實時音視頻端到端時延最低百毫秒內,5G公網平均160ms;可靠信令可以做到端到端25ms之內,5G公網平均50ms,可以保障低速自動駕駛車輛在30公里時速下,擁有相對可靠、安全和高效沉浸式的體驗,來完成所有的遠程作業。
未來,隨著AIGC的進一步融合,加之5G提供更加穩定、高可靠的通道,RTE勢必將帶來更多創新應用,讓我們拭目以待。
參考資料:1.《全球音視頻社交市場規模達1813億美元,60%以上用聲網》,36氪產業創新2.《加速邁入“真實時”物聯網 RTC成智能設備“硬指標”》,砍柴網3.《聲網CEO趙斌:生成式 AI 技術將顛覆式改造社交和泛娛樂行業|鈦媒體焦點》,鈦媒體APP