今日,原美團(tuán)聯(lián)合創(chuàng)始人王慧文發(fā)文稱,將打造中國的OpenAI。并且,王慧文透露還將成立北京光年之外科技有限公司,其個(gè)人出資 5000 萬美元,估值 2 億美元,并表示,“個(gè)人不占股份,資金占股 25%,75% 的股份用于邀請頂級(jí)研發(fā)人才,下輪融資已有頂級(jí) VC 認(rèn)購 2.3 億美元?!?/p>
據(jù)天眼查上的信息顯示,北京光年之外科技有限公司成立于2018年7月,是一家以從事科技推廣和應(yīng)用服務(wù)業(yè)為主的企業(yè),注冊資本100萬人民幣,法定代表人為王慧文,其持股比例為100%。
王慧文曾經(jīng)在當(dāng)年的退休郵件中表示,“感謝偉大的時(shí)代,我生于1978年,是改革開放的同齡人;在我開始厭學(xué)的時(shí)候,大學(xué)宿舍通網(wǎng),因此趕上了互聯(lián)網(wǎng)最精彩的20年;中國作為全球最大的單一市場,對創(chuàng)業(yè)者來說更是得天獨(dú)厚。 我運(yùn)氣實(shí)在太好,不宜繼續(xù)貪天之功,知止不殆。”
作為早期中國互聯(lián)網(wǎng)行業(yè)的代表人物,王慧文先后創(chuàng)立了校內(nèi)網(wǎng)、來電網(wǎng)、淘房網(wǎng),而與王興聯(lián)手創(chuàng)立的美團(tuán),應(yīng)該是其創(chuàng)業(yè)史上最成功的一次。對于王慧文來說,美團(tuán)聯(lián)合創(chuàng)始人的身份讓他早已財(cái)富自由,并于2020年宣布退休,減持美團(tuán)股票200萬股,成功套現(xiàn)2.74億港元,而ChatGPT的爆火讓再次點(diǎn)燃了他的創(chuàng)業(yè)激情。
三天前,就曾有一張王慧文的朋友圈截圖在網(wǎng)上流傳,稱要組隊(duì)入局人工智能,有相關(guān)人士進(jìn)一步確認(rèn)該截圖屬實(shí)。當(dāng)時(shí),王慧文在朋友圈表示:“5000萬美元,帶資入組,不在意崗位、薪資和title,求組隊(duì)?!蓖瑫r(shí),他還在即刻APP上表示,目前不懂AI技術(shù),正在努力學(xué)習(xí)。
由此可見,當(dāng)前因ChatGPT而掀起的新一輪人工智能熱潮,已經(jīng)傳到了互聯(lián)網(wǎng)的創(chuàng)始人圈。
比爾·蓋茨在接受媒體采訪時(shí)表示,ChatGPT可以對用戶查詢做出驚人的類似人類的反應(yīng),其重要性不亞于互聯(lián)網(wǎng)的發(fā)明。
最近,英偉達(dá)CEO黃仁勛也在參加談話時(shí)表示,ChatGPT的出現(xiàn)對于AI行業(yè)來說,相當(dāng)于(當(dāng)年在)手機(jī)領(lǐng)域(出現(xiàn))的iPhone,是計(jì)算機(jī)行業(yè)最偉大的事情之一,具有里程碑意義?,F(xiàn)在大家能把所有關(guān)于移動(dòng)計(jì)算的構(gòu)想,匯集到一個(gè)產(chǎn)品中。比如,通過API接口,可以把ChatGPT連接到數(shù)據(jù)表、Powerpoint、繪圖程序,照片編輯程序等。
上周,搜狐創(chuàng)始人張朝陽開啟了《星空下的對話》節(jié)目,邀請到360創(chuàng)始人周鴻祎進(jìn)行了深度對話,其中就談及了對于ChatGPT“出圈”的看法。
在周鴻祎看來,“ChatGPT可能代表著人工智能歷史上一場真正革命的開始,雖然現(xiàn)在還不完美有很多缺點(diǎn),但未來有無限潛力,有無限的應(yīng)用場景”,而張朝陽則表示,“ChatGPT的產(chǎn)生是從量變到質(zhì)變的長期積累過程,20年來,人們在網(wǎng)上積累了大量的信息,關(guān)于知識(shí)圖譜的發(fā)展以及擬合的方式,以及算力和神經(jīng)網(wǎng)絡(luò)的擬合方式和計(jì)算、夾角計(jì)算,導(dǎo)致人類對網(wǎng)上信息充分的使用和擬合已經(jīng)變得可以達(dá)到智能的狀態(tài),這是最原始的AI使用?!?/p>
不過,面對當(dāng)前ChatGPT的風(fēng)口是否要入局,張朝陽表示仍需要謹(jǐn)慎,“ChatGPT積累了許多年,涉及算力要有多少服務(wù)器,知識(shí)庫、標(biāo)注等等很多問題,若沒有這些能力的公司跟風(fēng)入局,會(huì)消耗掉許多資源。但人工智能AI以及有搜索能力的公司,還是需要有這樣一個(gè)準(zhǔn)備?!敝茗櫟t分析,要看其過去十年有沒有在服務(wù)器算力上投入,有沒有做人工智能的團(tuán)隊(duì),有沒有大數(shù)據(jù)的存儲(chǔ),但“有泡沫總不是壞事,會(huì)有更多優(yōu)秀的人才,會(huì)有更多的資金涌入。”
對于人工智能在自然語言處理領(lǐng)域的發(fā)展來說,雖然近10年來技術(shù)上有了突飛猛進(jìn)的發(fā)展,但對于技術(shù)圈之外的普通人來說,可能印象最深的還是各種語音助手產(chǎn)品,但是,相信每個(gè)體驗(yàn)過的人都或多或少經(jīng)歷過它們的“智障”時(shí)刻。而ChatGPT的橫空出世,可以說是首次打開了自然語言處理技術(shù)大規(guī)模商業(yè)化落地的大門,標(biāo)志著自然語言理解技術(shù)邁上了新臺(tái)階,其理解能力、語言組織能力、持續(xù)學(xué)習(xí)能力更強(qiáng),也標(biāo)志著AIGC在語言領(lǐng)域取得了新進(jìn)展,使得生成內(nèi)容的范圍、有效性、準(zhǔn)確度大幅提升。
近期,百度、京東、科大訊飛等國內(nèi)互聯(lián)網(wǎng)公司紛紛表示自家在ChatGPT上已有布局和相關(guān)產(chǎn)品將要推出,搶占“中國版ChatGPT”名號(hào)的戰(zhàn)爭已經(jīng)徹底打響,但花落誰家還尚未可知。不過,拋開炒作的因素不談,對于人工智能發(fā)展的三大要素(數(shù)據(jù)、算法、算力)來說,國內(nèi)企業(yè)的確都有良好的基礎(chǔ)。
在算法方面,ChatGPT的技術(shù)底座是大規(guī)模語言模型(LLM),本質(zhì)上仍是以深度學(xué)習(xí)為代表的技術(shù)長期發(fā)展和積累的結(jié)果,并未出現(xiàn)算法的革命性突破。發(fā)布于2020年的GPT-3是具有1750億個(gè)參數(shù)的大模型,ChatGPT正是再此基礎(chǔ)上進(jìn)行改進(jìn)的。對于大型語言模型來說,國內(nèi)的幾大互聯(lián)網(wǎng)公司也都有各自的大模型問世,相比國外的一流模型來說,業(yè)界的共識(shí)是有兩年左右的差距,但完全有趕超的可能。
在算力方面,人工智能模型的訓(xùn)練和使用需要強(qiáng)大的算力,這就需要大量高性能的GPU來支撐。據(jù)《2021—2022全球計(jì)算力指數(shù)評(píng)估報(bào)告》顯示,美國計(jì)算力指數(shù)得分為77分,中國為70分,分列世界前兩位,中國算力水平與美國處于同一等級(jí),差距并不大。
在數(shù)據(jù)方面,據(jù)了解,ChatGPT的訓(xùn)練使用了大約45TB數(shù)據(jù),其中包含多達(dá)近1萬億個(gè)單詞的文本內(nèi)容。在當(dāng)前人工智能的發(fā)展階段來說,大模型依舊是發(fā)展的主流,對于數(shù)據(jù)量的要求始終居高不下。而從大數(shù)據(jù)資源看,中國擁有全世界最大規(guī)模的網(wǎng)民數(shù)量,有豐富的應(yīng)用場景,在數(shù)據(jù)積累方面優(yōu)勢明顯。不過,一位北大教授曾分享過一組數(shù)據(jù),表明了中文數(shù)據(jù)的質(zhì)量現(xiàn)狀:截至2021年,雖然簡體中文互聯(lián)網(wǎng)用戶和英文互聯(lián)網(wǎng)用戶規(guī)模相當(dāng),但在全球排名前1000萬個(gè)網(wǎng)站中,英文內(nèi)容占比60.4%,中文內(nèi)容占比僅為1.4%。這是ChatGPT的英文水平明顯高于中文的原因,也是在模型的訓(xùn)練階段被“喂”了更多英文語料的必然結(jié)果,不過這同樣也可以成為中國企業(yè)發(fā)展ChatGPT應(yīng)用的競爭切入點(diǎn)。
2月8日,為了對抗OpenAI和微軟的新版Bing,谷歌在發(fā)布會(huì)上正式發(fā)布了對標(biāo)的Bard,此前,在谷歌搜索引擎大規(guī)模語言模型的加持下,用戶對Bard充滿了期待。然而,由于Bard在回答時(shí)出現(xiàn)了事實(shí)性錯(cuò)誤,導(dǎo)致當(dāng)天谷歌市值暴跌近1000億美元。
然而,根據(jù)機(jī)器之心今日發(fā)布的測評(píng),微軟的新版Bing也在回答中出現(xiàn)了各種錯(cuò)誤,包括名人身份信息、財(cái)報(bào)數(shù)字、營業(yè)時(shí)間等。例如,新版Bing給出Gap公司全年的銷售指引為“預(yù)計(jì)銷售凈增長率為低雙位數(shù)”,而實(shí)際是四季度“可能呈中間個(gè)位數(shù)下降”,一詞之差,對用戶的投資行為將產(chǎn)生嚴(yán)重的誤導(dǎo)。此外,Bing甚至還無中生有,給出了更多的全年財(cái)務(wù)指引“營業(yè)毛利為7%,攤薄每股收益為1.6美元到1.75美元之間”,而這些數(shù)據(jù)在Gap的三季度財(cái)報(bào)中統(tǒng)統(tǒng)沒有提到。
由此可見,雖然當(dāng)前全世界都在驚訝于ChatGPT等大型語言模型展現(xiàn)出來的能力,但還有諸多的問題亟待解決。如果僅僅將其用于閑聊,產(chǎn)生的變革和顛覆性價(jià)值會(huì)降低很多,只有當(dāng)此類模型把回答中的事實(shí)性錯(cuò)誤降到一個(gè)非常低的水平,才會(huì)真正顯現(xiàn)出更大的價(jià)值。如果放任這些虛假信息的存在,那么史上最快達(dá)到1億用戶所帶來的這把火也會(huì)很快熄滅。
這對于國內(nèi)企業(yè)來說當(dāng)然也很難,需要人力、資本、經(jīng)驗(yàn)、耐心等各個(gè)維度的大量投入。OpenAl花了9個(gè)月才建立起大模型訓(xùn)練的pipeline,并用幾年時(shí)間和天量資金積攢下來的大模型訓(xùn)練經(jīng)驗(yàn),絕非是一朝一夕就能復(fù)刻的。
寫在最后
可能很多人不知道的是,“人工智能”一詞早在1956年的達(dá)特茅斯會(huì)議上就已經(jīng)被提出,而在最近十年才真正有了幾次里程碑式的突破。ChatGPT的出現(xiàn)只是在通往強(qiáng)人工智能和通用人工智能的路上撕開了一個(gè)小口子,未來可能還會(huì)出現(xiàn)能力更強(qiáng)的工具。面對此次ChatGPT帶來的這波浪潮,與其擔(dān)心會(huì)被取代,不如一起讓AI變得更好。
參考資料:1.《別只罵谷歌Bard了,ChatGPT加持的微軟New Bing也錯(cuò)誤頻出》,機(jī)器之心