當(dāng)前,不管是人工智能技術(shù)的研發(fā)以及行業(yè)應(yīng)用的發(fā)展,“數(shù)據(jù)”都是一個(gè)不可或缺、位于重中之重的因素。作為人工智能基石的數(shù)據(jù),發(fā)揮出越來越重要的作用,影響著人工智能場(chǎng)景應(yīng)用的最終效果。現(xiàn)階段,在各個(gè)行業(yè)細(xì)分應(yīng)用場(chǎng)景的需求下,人工智能對(duì)數(shù)據(jù)的還原度、準(zhǔn)確度提出了更高要求。
從細(xì)分結(jié)構(gòu)來看,隨著AI技術(shù)的不斷成熟,更多的場(chǎng)景和行業(yè)開始嵌入使用AI技術(shù),比如教育、法律、智能駕駛、銀行金融等,這些AI行業(yè)應(yīng)用場(chǎng)景逐漸趨于長尾和碎片化,產(chǎn)生了大量細(xì)分專業(yè)化的數(shù)據(jù)需求。對(duì)于人工智能應(yīng)用來說,AI數(shù)據(jù)的精準(zhǔn)度失之毫厘則差之千里,而在人工智能應(yīng)用落地的過程中,AI數(shù)據(jù)精準(zhǔn)度的差異會(huì)愈發(fā)的明顯。在這里以國內(nèi)頭部AI數(shù)據(jù)采集標(biāo)注服務(wù)商云測(cè)數(shù)據(jù)為例,看看高質(zhì)量、場(chǎng)景化、精準(zhǔn)化AI數(shù)據(jù)怎樣幫助人工智能加速商業(yè)化、落地化、產(chǎn)業(yè)化進(jìn)程。
以智能駕駛汽車領(lǐng)域?yàn)槔?AI算法訓(xùn)練數(shù)據(jù)的“數(shù)量”與“質(zhì)量”非常重要——現(xiàn)實(shí)交通場(chǎng)景復(fù)雜、安全威脅多,非常重視數(shù)據(jù)分析的效率和敏捷,尤其是國內(nèi)路況的復(fù)雜性和相關(guān)智能應(yīng)用豐富的使用場(chǎng)景,更需要高質(zhì)、更精準(zhǔn)的數(shù)據(jù)來進(jìn)行算法訓(xùn)練。
目前云測(cè)數(shù)據(jù)為智能駕駛企業(yè)提供的提供的解決方案分三部分。一是基礎(chǔ)數(shù)據(jù)集,二是定制化數(shù)據(jù)采集和標(biāo)注服務(wù),三是包括數(shù)據(jù)采集標(biāo)注、數(shù)據(jù)管理的全方位數(shù)據(jù)工具鏈。
“三個(gè)部分對(duì)應(yīng)不同層階段的自動(dòng)駕駛落地需求。”云測(cè)數(shù)據(jù)總經(jīng)理賈宇航在接受媒體采訪時(shí)介紹,“第一個(gè)階段解決場(chǎng)景識(shí)別等基礎(chǔ)問題的通用數(shù)據(jù),例如車輛識(shí)別、車道線識(shí)別,這個(gè)階段涉及多種傳感器,需要大量布局;第二階段基于選定的場(chǎng)景,根據(jù)深度神經(jīng)網(wǎng)絡(luò)引入特定的數(shù)據(jù),云測(cè)數(shù)據(jù)場(chǎng)景實(shí)驗(yàn)室和標(biāo)注基地有實(shí)力滿足相應(yīng)數(shù)據(jù)的精度和規(guī)模;第三階段形成數(shù)據(jù)閉環(huán),云測(cè)數(shù)據(jù)可提供一整套成熟工具幫助完成數(shù)據(jù)采集、標(biāo)注、管理一系列流程,幫助企業(yè)完成自身迭代。”
據(jù)了解,云測(cè)數(shù)據(jù)采集服務(wù)覆蓋智能駕駛主流應(yīng)用場(chǎng)景,擁有DMS與ADAS場(chǎng)景搭建采集經(jīng)驗(yàn),比如支持駕駛員信息備采、多模及車載語音采集等眾多類型。憑借高質(zhì)量的數(shù)據(jù)交付實(shí)力,云測(cè)數(shù)據(jù)已和業(yè)內(nèi)包括自主、合資車企,大型Tier1、Tier2,以及無人出租車、自動(dòng)駕駛公司等眾多企業(yè),建立了持久良好的合作關(guān)系。
根據(jù)iResearch發(fā)布的《2020年中國AI基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)發(fā)展報(bào)告》:一個(gè)新研發(fā)的計(jì)算機(jī)視覺算法需要上萬張到數(shù)十萬張不等的標(biāo)注圖片訓(xùn)練;一個(gè)用于智慧城市的算法應(yīng)用,每年都有數(shù)十萬張圖片的穩(wěn)定需求;語音方面,頭部公司累計(jì)應(yīng)用的標(biāo)注數(shù)據(jù)集已達(dá)百萬小時(shí)以上,每年需求仍以20%-30%的增速上升,不僅如此,隨著IoT設(shè)備的普及,語音交互場(chǎng)景越來越豐富,每年都有更多的新增場(chǎng)景和新需求方出現(xiàn),對(duì)于標(biāo)注數(shù)據(jù)的需求也是逐步增長。
隨著人工智能落地需求的場(chǎng)景和專業(yè)化程度的增加,AI訓(xùn)練數(shù)據(jù)本身的復(fù)雜度和種類也將不斷提升,人工智能需要的將是定制化、專業(yè)化、精細(xì)化的AI場(chǎng)景訓(xùn)練數(shù)據(jù)產(chǎn)品服務(wù),具有相關(guān)工具、資源、能力的訓(xùn)練數(shù)據(jù)服務(wù)商將發(fā)揮極大的競(jìng)爭(zhēng)優(yōu)勢(shì),成為發(fā)揮AI數(shù)據(jù)價(jià)值的“源泉之地”