谷歌,是真的破釜沉舟了。
傳說中合并了 AlphaGo 和類 GPT-4 大模型的 Gemini,終于要來了嗎?
一個是用強化學習擊敗人類圍棋冠軍、創造歷史的 AI 系統,一個是目前霸榜幾乎所有大模型榜單、一騎絕塵的最強多模態大模型,兩個 AI 一合體,簡直要無敵了!
谷歌 DeepMind CEO Hassabis 近日對外媒 Wired 表示,Gemini 還在開發中,還需要幾個月,而谷歌 DeepMind 已經準備砸進數千萬美元,甚至數億。
此前,Sam Altman 曾透露,創建 GPT-4 的成本超過了 1 億美元。谷歌 DeepMind,當然也不能輸。
Gemini 會將 AlphaGo 與 GPT-4 等大模型的語言功能合并,系統解決問題和規劃的能力將大大增強。
Gemini 是一個大語言模型,類似于 GPT-4
預計花費數千萬到數億美元,與開發 GPT-4 的成本相當
除了 AlphaGo,還會有別的創新
Gemini 會整合使用了強化學習和樹搜索的 AlphaGO。
強化學習允許 AI 通過從反復嘗試和反饋中學習,解決挑戰性難題
樹搜索方法有助于探索和記住場景中可能的移動,比如在游戲場景中
DeepMind 在強化學習方面的豐富經驗,會為 Gemini 帶來嶄新功能。
其他領域技術(如機器人和神經科學)也會整合到 Gemini 中
下一個算法,要超越 ChatGPT
根據 OpenAI CEO Sam Altman 的說法,GPT-5 距離發布尚有時日,至少 6 個月內不會開始訓練。而 Gemini 的發布時間尚未確定,可能在幾個月之內。
尚在開發中的 Gemini,也是一個處理文本的大語言模型,性質上和 GPT-4 類似。
但谷歌 DeepMind CEO Demis Hassabis 表示,Gemini 會結合進 AlphaGo 中使用的技術,這將賦予系統全新的規劃、解決問題的能力。
2016 年,AlphaGo 擊敗圍棋世界冠軍李世石的那一幕,如今依然歷歷在目。
Hassabis 表示,「可以這么說,Gemini 把 AlphaGo 系統的一些優勢,和大語言模型驚人的語言能力結合在一起了。并且,我們還有一些其他有趣的創新?!?/p>
據說,Gemini 具有以前模型中沒有的多模態功能,在集成工具和 API 方面非常高效。而且,Gemini 將提供多種規模,旨在支持未來內存和規劃上的創新。
在三月份,曾經有這樣一個說法:Gemini 會像 GPT-4 一樣,具有一萬億個參數。而且,據說 Gemini 將使用數以萬計的谷歌 TPU AI 芯片進行訓練。
在上個月的谷歌開發者 I / O 大會上,谷歌就曾提到,從一開始,Gemini 的目標就是多模態、高效集成工具、API。
而當時谷歌的預告是:「雖然還在早期,但我們已經在 Gemini 中,看到了在之前的模型中從未見過的多模態能力,這讓人印象太深刻了。」
AlphaGo 背后的技術,就是強化學習,這是 DeepMind 首創的技術。
RL 代理隨著時間的推移與環境交互,通過反復試驗來學習策略,從而最大限度地提高長期累積獎勵
通過強化學習,AI 能夠通過反復嘗試和接受反饋來調整自己的表現,因而學會處理很棘手的問題,比如在圍棋或電子游戲中選擇如何采取下一步行動。
另外,AlphaGo 還使用了蒙特卡洛樹搜索(MCTS)方法,來探索和記住棋盤上所有可能的動作。
這已經不是 Hassabis 第一次攪動起科技巨頭的大規模人工智能淘金熱了。
2014 年,DeepMind 使用強化學習,讓 AI 學會了玩簡單的視頻游戲,這一成果驚為天人,直接讓 DeepMind 被谷歌收購。
谷歌的注果然押對了。
接下來幾年,DeepMind 隔一段時間就產出一個驚艷全世界的成果。
深度學習和強化學習正在解決許多經典的人工智能問題,例如邏輯、推理和知識表示
2016 年,石破天驚的 AlphaGo,直接點燃了深度學習和第一輪 AI 產業的熱潮。
2017 年,AlphaGo Zero 沒有使用人類數據,就迅速超越了 AlphaGo。
AlphaGo Zero
2020 年,AlphaFold 對于蛋白質結構的預測與實驗室技術相當,基本解決了蛋白質的折疊問題。
今年 6 月,AlphaDev 創造全新的排序算法,或將徹底改變計算機科學的效率和成果。
相比 OpenAI 更通用的路線,DeepMind 多年來深耕垂直領域。
語言模型的下一個重大飛躍在哪里?Gemini 或許指引了下一代語言模型的方向。
背水一戰
很明顯,Gemini 是谷歌的背水一戰。
谷歌開創的許多技術,比如 Transformer 架構,讓最近的 AI 洪流成為可能。
因為對于技術的開發和部署太過謹慎,在 ChatGPT 和其他生成式 AI 構成的競爭面前,它反而顯得暫時落后。
為了對打 ChatGPT,谷歌連續拋出多個動作,比如推出 Bard,并且將生成式 AI 集成到搜索引擎和其他產品中。
為了集中力量辦大事,在 4 月,谷歌干脆把 Hassabis 的 DeepMind 和谷歌的主要人工智能實驗室谷歌大腦合并,合體為谷歌 DeepMind。
對于合體后的全新團隊,Haasabis 顯然非常自信。他表示,全新的團隊匯集了兩股對最近的人工智能進步至關重要的力量。
「如果你看看我們在人工領域的位置,你會相信,未來 80% 或 90% 的創新,就會來自其中一個團隊。在過去十年里,兩個團隊都做出了極其出色的成果。」
新的想法
訓練像 OpenAI 的 GPT-4 這樣的大型語言模型,需要將來自書籍、網頁和其他來源的大量精選數據集的輸入「Transformer」中。
Transformer 使用訓練數據中的模式來熟練預測后續文本中應該出現的每一個字母和單詞。
這種看似簡單的機制,卻在回答問題和生成文本或代碼方面非常強大。
但這個看似簡單的技術原理也被很多行業大佬或者人工智能專家們詬病。
馬斯克:目前 AI 技術的本質就是統計學
LeCun:現在的 AI 的智能水平還不如狗
OpenAI 在 GPT 系列模型上的突破,就是在 Transformer 的核心技術之上,很激進地采用了 RLHF 來強化模型的能力。
而 DeepMind 在強化學習方面同樣有非常豐富的經驗。
這就讓人有非常充足的理由期待 Gemini 在未來可能會展現出來的創新能力。
更加關鍵的是,Hassabis 和他的團隊也會試圖用人工智能其他領域的核心技術來增強大型語言模型的能力。
DeepMind 的技術積累非常廣泛。
從機器人技術到到神經科學,他們武器庫里有各種各樣的裝備可供他們挑選。
比如像 LeCun 這樣的 AI 大佬就表示,Transformer 將語言模型的能力過度限制在了文本的范圍之內。
像人類和動物?樣,從世界的物理經驗中學習可能才是發展人工智能的最優解。
也許在 Gemini 身上,人工智能將展示出其他方向的潛力。
不確定的未來
Hassabis 的任務是加速谷歌的人工智能技術的發展,同時管理未知和潛在的嚴重的風險險。
大語言模型的飛速進步讓許多人工智能專家開始擔心這項技術是否會打開潘多拉的魔盒,讓人類社會付出無法接受的代價。
Hassabis 表示,人工智能可能給人類社會帶來的收益不可估量。
人類必須要持續發展這項技術。
強制暫停發展 AI 技術完全沒有可操作性。
但是這并不意味著 Hassabis 和他領導的 DeepMind 會不計后果地推進技術的發展。
畢竟,谷歌和 DeepMind 之所以把 AI 技術的領袖位置拱手讓給 OpenAI。
很大一部分原因就是對待 AI 發展采用了「過于負責任」的態度。