近日,社交媒體公司 Snap 旗下的 Snap Research 部門宣布,他們研發出了一種新的技術,可以讓 AI 生成圖像的速度大幅提升,從原來的幾分鐘甚至幾小時縮短到不到兩秒。
這種新的技術被稱為 SnapFusion,它可以根據用戶輸入的文字提示,快速生成清晰的圖像。Snap 公司表示,這是目前學術界公布的最快的速度。該公司在博客文章中介紹了這項技術的原理和優勢:
Snap Research 通過優化網絡結構和去噪過程,使得模型非常高效,同時保持了圖像質量。因此,現在可以運行模型來根據文字提示生成圖像,并在移動設備上幾秒鐘內得到結果,而不是像其他研究那樣需要等待很長時間。
Snap Research 還發布了一篇論文(PDF 格式),詳細介紹了 SnapFusion 技術,并展示了一些由該技術生成的藝術作品。論文中指出:
具體來說,我們提出了一個高效的 UNet,通過識別原始模型的冗余,并通過數據蒸餾減少圖像解碼器的計算。此外,我們通過探索訓練策略和引入無分類器指導的正則化,增強了步驟蒸餾。
不過,這項新技術還需要一段時間才能面向廣大用戶開放。但是 Snap 公司表示,它“有潛力在未來為移動設備上的高質量 AI 生成圖像體驗提供強大的動力”。IT之家猜測,這項新技術很可能會添加到 Snapchat 移動應用程序的未來更新中。