昨天凌晨,OpenAI突然發布的GPT-4讓所有人感受到了它強大的能力:不僅支持多模態,邏輯推理能力也大大提升,部分標準化考試的成績甚至超過了90%的人類......
在這種情況下,估計昨天百度的員工“特別忙”,因為從2月份開始,百度就開始對“文心一言”進行大規模預熱,今天百度發布的“文心一言”將不可避免的會被拿來和GPT-4進行對比,網上更是充斥著“壓力給到了百度這邊”等類似話題,大家都迫切想要看到“中國版ChatGPT”的表現到底如何。
但,該來的總是會來的。
今天下午2點,百度在北京總部舉行了新聞發布會,主題圍繞“文心一言”。李彥宏表示,作為國內大型企業中首家發布“類ChatGPT”產品的企業,百度之所以選擇最先發布,是因為市場有需求,百度包括搜索、智能云以及小度音響等在內的產品,以及眾多的合作伙伴,都等待著用這項技術,因此百度需要盡早的發布這項技術。
具體來說,文心一言具有文學創作、商業文案創作、多模態生成、數理邏輯推算、中文理解等能力這五大特色功能。
文學創作
在現場,李彥宏通過通過6輪有關三體的對話演示,體現出了文心一言所具有的總結能力、推理能力等,很多事實性內容對于大模型來說很容易出錯,而百度的文心一言通過采用了5500億知識圖譜的事實的訓練數據,來保證事實性問題回答準確。
商業文案創作
在商業文案創作方面,文心一言表現出的能力符合預期,還為生成的5個公司名稱進行了一一解釋。
數理邏輯推算
在“雞兔同籠”這一中國古代典型數學題的演示過程中,文心一言展現出了自身具備的數理推理能力,不僅可以給出答案,同時也給出了解題步驟,甚至在題目有問題的時候還對用戶進行了提示。
有意思的是,我們也將相同的問題向ChatGPT進行了提問,第一個問題雖然看似推理的很有邏輯,但ChatGPT并沒有給出正確的答案,第二個問題則得出了和文心一言相同的結果。
中文理解
據李彥宏表示,文心一言使用了大量中文數據集來進行訓練,在現場展示的有關“洛陽紙貴”的一系列問題中,藏頭詩的能力讓人印象深刻。此外,在談到文心一言能不能處理英文的問題時,李彥宏表示可以處理,但他也承認文心一言對英文的理解和處理能力現在還沒有中文這么好,部分原因是因為在訓練數據樣本還不夠大。
同樣的,為了更直觀的進行對比,我們還是用ChatGPT來生成了藏頭詩,兩次回復的結果都表明ChatGPT似乎沒有理解藏頭詩的含義,在這一環節,文心一言可以說是遠超ChatGPT的表現。
多模態生成
在多模態生成方面,文生圖能力大家已經司空見慣,但令人沒有想到的是,文心一言具備了用語音進行回復的功能,甚至還可以將回復的文字內容直接生成視頻。據李彥宏表示,目前每天已有幾萬個通過此功能生成的視頻在百家號里分發。不過,這項功能暫時還沒有對外開放。
據悉,文心一言是一種生成式大模型,這是一種技術棧的變化,對于算力的要求很高,可以說是一種“暴力美學”,通過芯片層、框架層、模型層、應用層這四層架構之間的相互協同,優化后可以使得成本降低,效率提高。在未來,很多人的工作性質也會因為更多大模型的出現而發生不可逆轉的改變。同時,李彥宏表示,大模型也給產業帶來了新型云計算、行業模型精調、應用開發這三大新的機會。
據李彥宏介紹,文心一言大模型的訓練數據包括萬億級網頁數據、數十億的搜索數據和圖片數據、百億級的語音日均調用數據,以及5500億事實的知識圖譜等。
從底層來看,文心一言使用了六大技術模塊,包括知識增強、檢索增強、對話增強、有監督精調、人類反饋的強化學習、提示。其中,百度有特色的在于知識增強、檢索增強、對話增強:在知識增強方面,知識圖譜為知識內化和知識外用提供了支持;在檢索增強方面,百度搜索引擎每天有數以億級的使用量,通過使用基于語義理解和匹配的新一代檢索架構,可以和生成模型進行聯合優化,使得生成的效果更好;在對話增強方面,記憶機制、上下文理解和對話規劃也都很重要。
同時,百度研發多年的飛槳也從開發訓練和推理部署兩個方面來支撐文心一言效果更好、效率更高、性能更強。
從今日起,首批用戶即可通過邀請測試碼,在文心一言官網體驗產品,后續將陸續開放給更多用戶。此外,百度智能云即將面向企業客戶開放文心一言API接口調用服務。3月16日起,正式開放預約,搜索“百度智能云”進入官網,可申請加入文心一言云服務測試。
說起文心一言,最早應該可以追溯到2010年百度成立的“自然語言處理部”,到了2019年時,百度發布的通用大模型“文心大模型ERNIE”則是現在文心一言的底座,經過了多年的發展,“文心”家族也早已經發展壯大起來。
文心能力全景圖
不過,相比于2010-2019年的超長時間跨度,在ChatGPT發布后的巨大影響力之下,留給文心一言的時間卻沒有那么多,從密集發布的造勢新聞中,也可以看出百度所面臨的巨大壓力:
2月7日,百度官宣“文心一言”項目時,英文名是“ERNIE Bot”,三月份完成內測,面向公眾開放。百度CTO王海峰任項目總指揮,其他帶隊高管還包括:百度集團副總裁吳甜、百度技術委員會主席吳華等人。
2月13日,百度消息,文心一言3月和大家正式見面。
2月17日,在2023 AI+工業互聯網高峰論壇上,百度智能云宣布“文心一言”將通過百度智能云對外提供服務,率先在內容和信息相關的行業和場景落地。百度集團執行副總裁、百度智能云事業群總裁沈抖表示,“文心一言”是基于百度智能云技術打造出來的大模型,它將根本性地改變云市場的游戲規則,云服務將從數字時代躍遷到智能時代。
2月22日,李彥宏在發給百度全員的財報信中重點介紹了百度將在三月份推出的生成式AI產品文心一言,宣布計劃將多項主流業務與文心一言整合,將幫助百度增加用戶粘性。
2月28日,百度官方宣布:百度計劃于3月16日14時在北京總部召開新聞發布會,主題圍繞文心一言,甚至發布會的邀請函也出自文心一言之手。
從2月份開始預熱起,至今已有650家伙伴加入了文心一言生態,李彥宏表示,這是任何一個企業都不能錯過的機會,會釋放出指數級的商業需求,AI市場也將迎來爆發性的需求增長。
在國內一眾宣稱正在開發“類ChatGPT”的科技公司中,或許只有阿里、騰訊、百度等大廠對大語言模型進行了大規模且長期的投入,百度則是三家中對于人工智能傾注心血和時間最多的一家。目前,百度在人工智能領域已經深耕十余年,擁有產業級知識增強文心大模型ERNIE ,具備跨模態、跨語言的深度語義理解與生成能力,在搜索問答、云計算、內容創作生成、智能辦公等眾多領域都有應用。同時,百度搜索引擎更是在我國占據了絕對優勢,海量的中文語料更是它區別于其他企業的“底氣”。
可以說,從技術實力和應用場景上來看,百度是目前最有希望在大模型上追趕OpenAI的中國公司。不過,從發布會過程中百度股價的實時變化來看,市場已經表達出了它的態度。
寫在最后
這一次,百度的確有些運氣不好,昨天突然發布的GPT-4,讓大部分人對今天發布的文心一言已經有了自己的判斷,但對于百度來說,其實未來的機會依然很大。
首先,在中文領域,OpenAI等國外企業所掌握的數據明顯少于百度,再加上數據安全和法律法規等限制因素,類似戰勝谷歌的戰役可能會再次上演;其次,大模型雖然表現出了驚人的能力,但商業模式的探索才僅僅是個開始,未來還有極大的不確定性,此次的發布會更是搶先占據了國內用戶的心智,有利于文心一言生態的快速建立。
在文心一言發布會的最后,大屏幕上顯示出“AI的終極理想是為人類帶來更多自由和可能”,對于真正的終點來說,現在才只是走過了起跑線而已。