“如果人類的水平達不到80分,就會被AI淘汰。”
在中國AIGC產業峰會現場,昆侖萬維CEO方漢拋出這樣一個大膽預測。
在他看來,目前AIGC對存量知識的理解與表達已經達到80分的水平,行業從業者將隨之形成兩極分化的局面:
一部分人成為上游管理員,一部分成為底層AIGC操作員,兩者的工作產量都會極大提升。
剩下的達不到80分的腰部從業者,大概率被淘汰。
方漢畢業于中國科學技術大學近代物理系,擁有29年互聯網從業經驗,從1994年開始參與和倡導開源運動,是國內最早的網絡安全專家,負責研發了國內市場占有率最高的網頁游戲《三國風云》。
2008年3月,他協助周亞輝先生創立昆侖萬維,后者于2015年A股上市。
在本次大會上,他對昆侖萬維介入到類ChatGPT大模型開發的契機、AIGC對內容從業者的影響、三種AIGC商業路徑、以及開源和預訓練大模型在其中的重要性進行了一一分享。
為了完整體現他的思考,在不改變原意的基礎上,量子位對其演講內容進行了編輯整理。
AIGC原本含義比較狹窄,主要指文本、圖像以及視頻還有音樂等人類可以消費的娛樂內容的生成。ChatGPT的出現把AIGC的范疇給泛化了。
對存量知識的理解與表達,AIGC將以低廉的成本做到80分的水準。
由于兩極分化,AIGC領域的腰部工作者要么力爭上游做頭部管理員,要不就老老實實成為AIGC操作員。
在AIGC領域,文生圖在同一個賽道出現了三種完全不同的商業模式,互為補充:
(1)Stability.AI打造的開源生態;
(2)Midjourney打造的SaaS或者Model Service生態;
(3)Adobe Firefly打造的傳統生態工具,將所有AIGC功能集成到工具里。
只有開源模式可以滿足用戶的長尾需求;只有開源模式才可以滿足中小企業的增長需求。
需要注意的是,我們不能只盯著目前AIGC進展,認為預訓練大模型已經突破傳統AIGC范疇進入AGI領域。實際上,各種AIGC工具能力仍然受到預訓練大模型限制,尤其GPT-4大模型出現后這個現象更加突出。
以下為方漢演講全文:
AIGC這個名字剛提出來的時候,在美國叫生成式AI。
國內UGC、PGC的概念深入人心,所以造了一個詞叫“AIGC”。
AIGC原本含義比較狹窄,主要指文本、圖像以及視頻還有音樂等人類可以消費的娛樂內容的生成。
ChatGPT的出現把AIGC的范疇給泛化了,ChatGPT屬于AGI(通用人工智能)范疇。
今天我的分享更多偏向原有含義,即人類娛樂內容的生成。
首先,我簡單介紹一下昆侖萬維介入到類ChatGPT大模型開發的契機。
昆侖萬維2015年A股上市,當時是以網游題材上市的,上市后在海外進行多元化發展,有瀏覽器、社交產品、游戲業務。
昆侖萬維是內容廠商,對于所有內容生成方面的科技進步都非常敏感。
早在2020年6月份GPT-3剛剛出現的時候,管理層和技術領導者都去進行嘗試。
當時我們判斷這是內容生成領域一個里程碑,沒想到兩年后變成通用人工智能突破口。
也是從那時我們就已經決定要跟進這件事情,因為我們在內容生成領域絕對不允許落后。
具體而言,昆侖萬維開始布局AIGC和大模型領域,與奇點智源合作開始進行大模型訓練工作。
目前為止除了通用大模型訓練之外,昆侖萬維在音樂生成領域也處于國內和國際前沿地位。
我們的愿景是推進開源AIGC算法和模型社區的發展壯大。
昆侖萬維作為中國領先互聯網出海企業、技術驅動全球互聯網公司,致力于前沿技術追蹤和研發,有相當的技術積累和人才儲備。
我們的技術團隊持續進行算法技術創新,積極推進模型算法開源以及社區發展壯大,基于全球每月平均4億活躍用戶以及豐富行業經驗,助力AIGC應用和生態的快速落地以及成長。
以下分享AIGC在具體商業模式落地方面的思考。
我們觀察到一個有趣的現象,對于UGC(用戶生成內容)的平臺如小紅書、知乎、抖音、快手等,用戶創造內容的門檻每降低一倍,用戶創造內容的數量就會增加十倍。
舉個例子,在手機攝像頭出現之前,人類拍攝視頻一定是靠專業的攝像機和數碼相機。
手機出現之后,攝像的門檻變低,視頻內容數量出現了大爆發。
這促成了快手和抖音的發展,進而中國UGC領域產生了巨大突破。
C端工具的商業邏輯其實是社區,B端工具的商業邏輯是功能完備性。
C端工具用快手、抖音拍視頻,目的絕不是為了做工具,而是讓用戶做出來內容通過社區分發,這是C端工具邏輯。
B端工具的商業邏輯就像Adobe的PhotoShop全家桶、微軟Office全家桶,以功能完備性來獲得用戶的青睞。
可見,隨著AIGC技術的進展,它們將對內容生產者產生巨大影響。
不得不承認,現在AIGC對存量知識的理解與表達還遠遠沒有到100分水準,但以低廉的成本做到80分沒有任何問題。
如果人類自己的水平也只是80分,我們的工作一定會被AIGC替代,而80分以上的人將去管理AIGC操作員,完成曾經需要腰部作者完成的工作。
因此未來,頭部工作者產量極大提升,作為AIGC操作員的底部工作者的生產能力也會得到極大提升。
很不幸,腰部工作者大概率會被淘汰。
那么,我們要么力爭上游做頭部工作者,要么就老老實實當AIGC操作員。
在AIGC領域,文生圖在同一個賽道出現了三種完全不同的商業模式。
第一種:Stability.AI打造的開源生態;
第二種:Midjourney打造的SaaS或者Model Service生態;
第三種:Adobe Firefly打造的傳統生態工具,將所有AIGC功能集成到工具里。
這三種商業路徑,不止是在文生圖,在文生圖像、文生音樂還是小說創作領域都會長期存在,且三種模式互為補充。
最終的C端用戶會傾向于使用Midjourney完成工作,如現在的電商從業者,大量使用Midjourney來進行電商廣告素材創作。
Adobe Firefly則契合一些傳統的大B企業的需求,B端用戶會使用Adobe Firefly來作為自己的創作工具。
Stability.AI是一種開源模式,特別適合在這個領域進行創業的廣大中小企業。
通過開源模式來進行自己的改裝與改進,來滿足長尾需求,這是另外兩個模式無法提供的功能。
開源大模型是商業閉源大模型的有力補充和替代。
大家可以把ChatGPT想成早期Windows,Windows的存在是整個電腦商業軟件的一個基石,也是絕大多數人的生產工具。
Linux通過30年的努力變成Windows的替代,開源大模型也一定會出現。
因為只有開源模式可以滿足用戶的長尾需求。
還是以Linux為例,全世界所有的云廠商、大型互聯網企業都以Linux為自己的服務底座。
要滿足自己的長尾需求,只有一個選擇,就是用Linux進行改裝。
所以,我們也說,只有開源模式才可以滿足中小企業的增長需求。
做一個具體的分析,Stable Diffusion的出現比OpenAI DALL·E 2晚了整整6個月,在性能、質量上都低于DALL·E 2和Midjourney,但依然有眾多用戶。
因為它是開源的,進步速度是難以想象的快。
Stable Diffusion催生ControlNet、T2I-Adapter、Composer,以及LoRA訓練技巧。
在它上面進行二次開發的人數眾多,新特性也在不斷地涌現。
ControlNet是目前為止在文生圖領域唯一解決一致性問題的途徑,極大地降低了用戶的創作成本,提高了創作的可玩性。
ControlNet開源僅2周,它的Star數就超過了1萬。
與此同時,開源社區也極大地降低了用戶的使用門檻。
例如HuggingFace提供了大量的模型托管以及通用的模型訓練來框架diffusers,stablediffusion-webui開發了完善的一套Demo平臺,Civitai貢獻了海量風格化LoRA權重,整個社區也蓬勃發展起來了。
需要注意的是,我們不能只盯著目前AIGC進展,認為預訓練大模型已經突破傳統AIGC范疇進入AGI領域。
實際上,各種AIGC工具能力仍然受到預訓練大模型限制,尤其GPT-4大模型出現后這個現象更加突出。
AIGC領域的企業對于大模型本身的需求仍然非常大,也是持續的。
目前,還存在這樣幾個大問題。
首先,AIGC發展起來之后是否會導致優質內容的稀缺?
因為AI生成的內容會大量污染原創的內容。
其次,如何解決大模型底座導致的偏見?
比如OpenAI、ChatGPT生成的內容就存在偏見,這個問題值得關注。
最后,版權、信息偽造問題。
Adobe Firefly提出了一個新的模式,它訓練的所有內容與作者達成協議,通過對model收費給內容作者分成。
從監管到行業自律,我們可做的事情非常多,而且迫在眉睫。
關于未來AIGC的展望(僅指娛樂內容AIGC)——
第一,AIGC對整個社會最大的意義是低成本終極解決方案,這一點毋庸置疑,所有人類都有消費內容產生多巴胺的權力;
第二,AIGC將涌現新的范式,徹底改變藝術創作生產方式;
最后,AIGC導致內容生成的極大發展,會使得VR和元宇宙變得更加可行。