AIoT,即人工智能物聯(lián)網(wǎng),是人工智能(AI)與物聯(lián)網(wǎng)(IoT)在實(shí)際場(chǎng)景落地中相互融合的產(chǎn)物,作為一種新的物聯(lián)網(wǎng)應(yīng)用形態(tài),是通往 “萬(wàn)物智聯(lián)”、“人機(jī)深度”的必經(jīng)之路。
當(dāng)下,AIoT正被廣泛應(yīng)用于汽車(chē)、零售、金融、交通等各行各業(yè),包括目前熱炒的元宇宙也離不開(kāi)AIoT技術(shù)的支撐,被稱為是“連接實(shí)體與虛擬世界的橋梁”。
中金公司預(yù)計(jì),2022年人工智能與物聯(lián)網(wǎng)的結(jié)合有望全面落地助力智慧城市、智能工廠、智能交通、智慧礦山等有望加速落地,推動(dòng)ICT新基建規(guī)模落地。 但在這一輪AIoT的繁榮浪潮背后,對(duì)于其發(fā)展前景的質(zhì)疑聲也不絕于耳。尤其是在AI產(chǎn)業(yè)化方面,依然存在諸多瓶頸。
近日,英特爾物聯(lián)網(wǎng)視頻事業(yè)部全球首席技術(shù)官、物聯(lián)網(wǎng)事業(yè)部中國(guó)區(qū)首席技術(shù)官?gòu)堄畈┦拷邮堋犊苿?chuàng)板日?qǐng)?bào)》采訪,暢談了對(duì)AIoT以及人工智能發(fā)展的思考。
張宇認(rèn)為,人工智能與物聯(lián)網(wǎng)的結(jié)合需要經(jīng)過(guò)三個(gè)階段,AIoT發(fā)展暫時(shí)還處于第一階段,只有當(dāng)機(jī)器能根據(jù)人類(lèi)的需要,進(jìn)行自主學(xué)習(xí),才能實(shí)現(xiàn)真正的AIoT。
在他看來(lái),AI是一種技術(shù),但從最終用戶的角度來(lái)看,能夠體驗(yàn)到的是服務(wù)。所有的服務(wù)都不是依靠單一的技術(shù)來(lái)支撐的,而是一系列技術(shù)的結(jié)合,以及一系列平臺(tái)的支撐。
對(duì)于AIoT的應(yīng)用場(chǎng)景,他認(rèn)為2B與2C存在區(qū)別,2B對(duì)準(zhǔn)確度的要求很高,所使用的參數(shù)會(huì)更多。在2B方面,AI在智能制造領(lǐng)域應(yīng)用前景廣泛,一方面幫助企業(yè)提高生產(chǎn)效率,另一方面也為碳中和、碳達(dá)峰在做相應(yīng)的貢獻(xiàn)。
談及最近熱門(mén)的元宇宙,他認(rèn)為,其實(shí)AR/VR只是元宇宙的入口,但AR/VR背后所展現(xiàn)的內(nèi)容,實(shí)際上也需要AI技術(shù)的支撐。通過(guò)AI技術(shù)來(lái)感知用戶需要什么樣的信息,然后把這些信息進(jìn)行匯總、處理以及分析,最終讓結(jié)果呈現(xiàn)在AR/VR的設(shè)備之上。
以下為《科創(chuàng)板日?qǐng)?bào)》整理的專訪實(shí)錄:
《科創(chuàng)板日?qǐng)?bào)》:您如何看待人工智能與物聯(lián)網(wǎng)的結(jié)合?
張宇:我覺(jué)得AI與IoT的結(jié)合分為三個(gè)階段:
第一個(gè)階段是AI技術(shù)在邊緣側(cè)、在推理階段率先應(yīng)用。在這個(gè)階段還需要大量的數(shù)據(jù)中心能力,來(lái)幫助我們訓(xùn)練人工智能的網(wǎng)絡(luò)模型,把推理結(jié)果推送到前端進(jìn)行使用。
第二個(gè)階段是邊緣訓(xùn)練階段。如果始終利用數(shù)據(jù)中心進(jìn)行模型訓(xùn)練,不可避免地會(huì)造成訓(xùn)練時(shí)間比較長(zhǎng),模型更新頻率比較慢。
隨著物聯(lián)網(wǎng)的發(fā)展,以及數(shù)字化轉(zhuǎn)型的推進(jìn),及時(shí)地、在更短的時(shí)間得到一個(gè)網(wǎng)絡(luò)模型更新的需求,會(huì)越來(lái)越強(qiáng)。所以我們認(rèn)為,日后訓(xùn)練工作會(huì)慢慢從數(shù)據(jù)中心遷移到邊緣。在邊緣可以利用動(dòng)態(tài)采集到的新數(shù)據(jù),來(lái)進(jìn)行模型的二次更新,利用更新的結(jié)果來(lái)指導(dǎo)下一步的操作。
第三個(gè)階段是自主學(xué)習(xí)的階段。現(xiàn)在人工智能存在很多的局限。之前跟很多專家交流的時(shí)候,我經(jīng)常會(huì)開(kāi)一個(gè)玩笑:從人工智能的字面上來(lái)看,既有“人工”的部分也有“智能”的部分。這也很好地體現(xiàn)出目前人工智能的使用模式——大概有50%是人工的,另外50%是智能的、利用機(jī)器所產(chǎn)生的。
《科創(chuàng)板日?qǐng)?bào)》:當(dāng)下,人工智能還是脫離不了人的支持,這會(huì)帶來(lái)哪些阻礙?
張宇:如今人工智能使用過(guò)程當(dāng)中,人仍然扮演著非常重要的角色。雖然我們可以利用龐大的算力來(lái)訓(xùn)練模型,但是模型結(jié)構(gòu)還是要由人來(lái)訓(xùn)練和設(shè)計(jì)。這就導(dǎo)致,AI模型在設(shè)計(jì)過(guò)程之中,已經(jīng)加入了很多人的意志。
而且這個(gè)模型的結(jié)構(gòu)一旦定了,其應(yīng)用場(chǎng)景也會(huì)比較固定。比如,某一個(gè)模型可能適合做視頻處理,那么同樣的模型就不太適合做自然語(yǔ)言處理。因?yàn)樵缭谌诉M(jìn)行模型設(shè)計(jì)時(shí),限制就已經(jīng)造成了。
所以,我們需要進(jìn)入第三個(gè)階段,這實(shí)際上是一個(gè)自主學(xué)習(xí)、自主訓(xùn)練的過(guò)程,稱之為Auto Machine learning。簡(jiǎn)單來(lái)說(shuō),是機(jī)器根據(jù)人類(lèi)的需要,自主使用相應(yīng)的數(shù)據(jù)來(lái)設(shè)計(jì)和訓(xùn)練模型,再把這個(gè)模型運(yùn)用到最終的推理過(guò)程中。
從今后的發(fā)展來(lái)看,尤其在數(shù)字化轉(zhuǎn)型中,越來(lái)越需要這種能夠感知人類(lèi)意圖的機(jī)器。它們可以根據(jù)使用者、最終用戶的意圖來(lái)主動(dòng)地自我調(diào)配,選擇適宜的網(wǎng)絡(luò)模型、數(shù)據(jù)結(jié)構(gòu),從而得到最適宜處理當(dāng)前場(chǎng)景的模型,并把模型發(fā)送到前端來(lái)進(jìn)行相應(yīng)的工作。
《科創(chuàng)板日?qǐng)?bào)》:當(dāng)下我們處于AIoT發(fā)展的哪個(gè)階段?
張宇:暫時(shí)還處于第一階段,對(duì)第二階段還在探索中。因?yàn)樗懔蛿?shù)據(jù)是兩大挑戰(zhàn)。比如在物聯(lián)網(wǎng)的邊緣端,如何來(lái)標(biāo)注數(shù)據(jù),是亟待解決的。
《科創(chuàng)板日?qǐng)?bào)》:能否具體談?wù)凙IoT落地的挑戰(zhàn)?
張宇:首先隨著AI應(yīng)用越來(lái)越多,對(duì)于AI的效果以及即時(shí)性要求也越來(lái)越強(qiáng)。如何保證大量的AI數(shù)據(jù)能夠及時(shí)處理,是一大問(wèn)題。現(xiàn)在有一些解決辦法,比如邊緣計(jì)算正越來(lái)越興起,把AI的處理工作放在邊緣來(lái)進(jìn)行操作,從而更好地響應(yīng)用戶的需求。
第二,現(xiàn)在有越來(lái)越多AI的不同框架、不同的計(jì)算平臺(tái)以及不同的應(yīng)用場(chǎng)景。在這種碎片化的場(chǎng)景,開(kāi)發(fā)者如何擁有一個(gè)更好的開(kāi)發(fā)工具,能利用這個(gè)工具找到最適宜的使用場(chǎng)景的關(guān)鍵API也好、適宜的硬件平臺(tái)也好,可以讓想法快速落地。這些開(kāi)發(fā)工具也是一個(gè)很大的挑戰(zhàn)。
我們看到百度推出了PaddlePaddle,英特爾推出了OpenVINO,通過(guò)這樣一些工具的結(jié)合,能夠讓開(kāi)發(fā)者從構(gòu)建、優(yōu)化到最后的部署都有一整套的開(kāi)發(fā)工具,幫助其更快實(shí)現(xiàn)想法的落地。
三是生態(tài)方面的挑戰(zhàn)。AI是一種技術(shù),但從最終用戶的角度來(lái)看,能夠體驗(yàn)到的是服務(wù)。所有的服務(wù)都不是依靠單一的技術(shù)來(lái)支撐的,而是一系列技術(shù)的結(jié)合,以及一系列平臺(tái)的支撐。
所以就需要在整個(gè)AIoT產(chǎn)業(yè)鏈的各個(gè)環(huán)節(jié),包括開(kāi)發(fā)者、服務(wù)提供商、芯片提供商以及硬件的OEM、ODM,以及軟件的ISV等等,大家一起合作,來(lái)構(gòu)建一個(gè)完整的服務(wù)平臺(tái)。通過(guò)這樣一個(gè)服務(wù)平臺(tái),使得最終用戶切身感受到基于AI的這種應(yīng)景、實(shí)時(shí)的服務(wù)。但是,如何構(gòu)建這樣一個(gè)產(chǎn)業(yè)鏈,打通產(chǎn)業(yè)鏈的各個(gè)環(huán)節(jié),這存在很大的挑戰(zhàn)。
《科創(chuàng)板日?qǐng)?bào)》:目前AI芯片初創(chuàng)公司的產(chǎn)品落地難點(diǎn),是否也在生態(tài)上?
張宇:一方面由于AI芯片的研發(fā)投入很大,比如芯片流片的成本很高;另一方面在于生態(tài)系統(tǒng)。因?yàn)樾酒庥杏布恍校熊浖€需要與應(yīng)用結(jié)合起來(lái)。AI芯片落地不可能只依靠一家公司來(lái)完成,需要生態(tài)圈一起合力。
比如做芯片的企業(yè),需要軟件伙伴來(lái)幫其做軟件解決方案、軟件工具,從而配合硬件一起推給用戶,這是產(chǎn)業(yè)鏈協(xié)同來(lái)完成的,光靠一家很難做成。
《科創(chuàng)板日?qǐng)?bào)》:你看到的AIoT當(dāng)下有哪些應(yīng)用場(chǎng)景?
張宇:其實(shí)這方面的應(yīng)用很多,總的來(lái)說(shuō)可以分為兩大類(lèi),一類(lèi)是2B的應(yīng)用,一類(lèi)是2C的應(yīng)用。
在2C的應(yīng)用方面,像手機(jī)上的美顏,或者大家在購(gòu)物的時(shí)候,電商平臺(tái)會(huì)給你主動(dòng)推送可能需要、也可能不需要的商品,其實(shí)這些都是人工智能技術(shù)的應(yīng)用。
包括最近熱門(mén)的元宇宙,其實(shí)AR/VR只是元宇宙的入口,但AR/VR背后所展現(xiàn)的內(nèi)容,實(shí)際上也需要AI技術(shù)的支撐。通過(guò)AI技術(shù)來(lái)感知用戶需要什么樣的信息,然后把這些信息進(jìn)行匯總、處理以及分析,最終讓結(jié)果呈現(xiàn)在AR/VR的設(shè)備之上。
在2B方面,我們看到AI在智能制造領(lǐng)域得到了越來(lái)越廣泛的應(yīng)用。比如在邊緣端,可以進(jìn)行AI缺陷監(jiān)測(cè),及時(shí)在生產(chǎn)線上發(fā)現(xiàn)有瑕疵的半成品,并第一時(shí)間剔除出來(lái)。這樣,一方面幫助企業(yè)提高生產(chǎn)效率,另一方面也為碳中和、碳達(dá)峰在做相應(yīng)的貢獻(xiàn),這些都是AI在2B的場(chǎng)景里的具體應(yīng)用。
《科創(chuàng)板日?qǐng)?bào)》:2B和2C在要求上有哪些不同?
張宇:2B與2C最大的區(qū)別在于,2B對(duì)準(zhǔn)確度的要求很高。舉個(gè)例子,個(gè)人手機(jī)上使用的智能美顏功能,即使美顏出錯(cuò)了也無(wú)傷大雅。而2B業(yè)務(wù)如果出了錯(cuò),會(huì)導(dǎo)致成本消耗、產(chǎn)品的損失。此外,B端的應(yīng)用場(chǎng)景也更復(fù)雜。
比如, 2021年我們?cè)趭W迪的一家德國(guó)工廠落地人工智能。那家工廠里有2500臺(tái)機(jī)器人,其中有1000臺(tái)是焊接機(jī)器人,均用于奧迪的汽車(chē)制造。
一輛汽車(chē)有多達(dá)5000個(gè)焊點(diǎn)。奧迪通過(guò)焊接機(jī)器人來(lái)分析每一個(gè)焊點(diǎn)的質(zhì)量,包括通過(guò)的電流情況、焊槍的位置等等。把這些信息綜合起來(lái),判斷當(dāng)前焊點(diǎn)的質(zhì)量是好、還是不好,這里是利用了一整套人工智能的算法來(lái)完成的。
可以想象,如果5000個(gè)焊點(diǎn)里只要有一個(gè)出錯(cuò),那么這輛車(chē)就廢了。所以B端要求跟C端是不同的,而且算法更難,所使用的參數(shù)會(huì)更多。
《科創(chuàng)板日?qǐng)?bào)》:人工智能的概念最早在五、六十年代就已提出,目前經(jīng)過(guò)了三輪浪潮的發(fā)展,您認(rèn)為影響其發(fā)展的要素有哪些?
張宇:我們今天雖然談的更多的是AI本身,但是AI實(shí)現(xiàn)的背后離不開(kāi)計(jì)算,也離不開(kāi)數(shù)據(jù),而數(shù)據(jù)的獲取離不開(kāi)數(shù)據(jù)的傳輸和數(shù)據(jù)的存儲(chǔ)。
從AI的發(fā)展來(lái)看,目前這一輪人工智能高潮的起點(diǎn)是2012年。上一輪人工智能的高潮是上世紀(jì)90年代。如果我們把上世紀(jì)90年代的技術(shù)和這一輪的技術(shù)做對(duì)比的話,可以看到,不管計(jì)算也好,通訊也好,存儲(chǔ)也好,三者的能力超過(guò)百萬(wàn)倍以上的提升。
所以,卷積神經(jīng)網(wǎng)絡(luò)是推動(dòng)人工智能發(fā)展最關(guān)鍵的要素嗎?我認(rèn)為并不是。
因?yàn)樵谏鲜兰o(jì)90年代,卷積神經(jīng)網(wǎng)絡(luò)就已經(jīng)出現(xiàn)。當(dāng)時(shí),人工智能三巨頭之一LeCun,在貝爾實(shí)驗(yàn)室工作的時(shí)候,設(shè)計(jì)了卷積神經(jīng)網(wǎng)絡(luò)來(lái)做OCR的處理。這并不是一個(gè)新的技術(shù)。和上世紀(jì)90年代相比,真正推動(dòng)本輪人工智能高速發(fā)展的,由于這些底層基礎(chǔ)架構(gòu)、數(shù)據(jù)能力方面的提升。
當(dāng)然,英特爾也在其中扮演了一個(gè)很重要的角色。在2021年的下半年剛剛頒布的全球超級(jí)計(jì)算機(jī)500強(qiáng)的榜單當(dāng)中,有80%以上的超級(jí)計(jì)算機(jī)使用的是英特爾的產(chǎn)品。我們希望幫助用戶搭建一個(gè)端到端、帶有AI能力的訓(xùn)練和推理的平臺(tái),能夠涵蓋數(shù)據(jù)從采集、計(jì)算、存儲(chǔ)、傳輸?shù)乃辛鞒蹋瑏?lái)推動(dòng)人工智能的應(yīng)用更快落地。