亚洲v欧美v另类v综合v日韩v,好看的黄色片,这里只有精品免费视频,特级做a爱片久久久久久

<menu id="moooo"><td id="moooo"></td></menu>

<dd id="moooo"><th id="moooo"></th></dd>

<acronym id="moooo"><wbr id="moooo"></wbr></acronym>

<cite id="moooo"></cite>

<source id="moooo"></source>

“AI 孫燕姿”爆火后，Meta 發布通用語音生成 AI：支持多種語音功能

作者 | InfoQ2023-06-21

Meta 發布語音生成 AI 模型 Voicebox

近日，Meta AI 宣布在生成式 AI 語音模型領域取得了突破：開發出了首個可泛化至多種語音生成任務的模型 Voicebox，無需專門訓練即可達成頂尖性能表現。Meta AI 研究人員分享了多段音頻樣本和一篇研究論文，其中詳細介紹了他們采用的方法和取得的成果。

與圖像及文本類生成系統一樣，Voicebox 能夠創建多種樣式的輸出，包括從零開始創建輸出、修改給定樣本等。但與以往不同的是，Voicebox 并非簡單創建圖片或一段文字，而是直接生成高質量的音頻片段。該模型能夠為括英語、法語、西班牙語、德語、波蘭語和葡萄牙語在內的六種語言合成語音，同時執行噪聲去除、內容編輯、風格轉換和多樣化樣本生成等任務。

在 Voicebox 出現之前，生成式 AI 語音模型需要配合精心準備的訓練數據，就各項任務接受特定訓練。Voicebox 使用一種新的方法，可直接從原始音頻和隨附的轉錄結果中學習。與只能根據給定音頻片段續寫結尾的自回歸模型不同，Voicebox 能夠修改給定樣本中的任意部分。

據了解，Voicebox 能夠出色執行各種任務，具體包括：

結合上下文的文本到語音合成：使用長度僅為兩秒的輸入音頻樣本，Voicebox 即可匹配樣本的音頻風格并據此進行文本到語音生成。后續項目有望為無法說話的人士提供語音支持，或者為游戲 NPC 及虛擬助手快速生成對話語音。
跨語言風格轉換：給定一段語音樣本，外加一段英語、法語、德語、西班牙語、波蘭語或葡萄牙語的文本，Voicebox 即可生成對應的朗讀音頻。這種能力訟人興奮，未來可以幫助使用不同母語的人們通過自然且真實的方式開展交流。
語音降噪與編輯：Voicebox 的上下文學習為其賦予了強大的語音生成能力，可無縫編輯音頻中的片段。它能重新合成被暫時噪聲干擾的語音部分，或者替換掉說錯的詞，而無需重新錄制整段語音。用戶可以找到語音中被噪聲(如狗叫聲)干擾的原始片段，剪切出來并指示模型重新生成。有朝一日，這種能力還可用于清洗和編輯音頻，且使用過程與目前流行的圖像編輯工具一樣輕松便捷。
多樣化語音采樣：利用多樣化的真實數據完成學習后，Voicebox 將可生成與人們的現實對話高度吻合的以上六種語言對話音頻。未來，此功能可用于生成合成數據，協助提升語音助手模型的訓練效果。研究結果表明，基于 Voicebox 生成的合成語音訓練出的語音識別模型，在性能上幾乎與使用真實語音的模型相當，錯誤率降低了 1%;與以往同類文本到語音模型相比，合成語音數據訓練結果的錯誤率更是大幅降低 45%至 70%。

Voicebox 的誕生，標志著生成式 AI 研究又向前邁出了重要一步。在文本、圖像和視頻生成等方面，具備任務泛化能力的可擴展生成式 AI 模型已經激發了人們對于跨任務潛在應用的濃厚興趣。Meta AI 希望音頻領域未來也能掀起同樣的潮流，同時繼續保持深耕和探索，關注其他研究人員如何在 Voicebox 的基礎之上尋求新的突破。

Voicebox 背后的 Flow Matching 技術

現有語音合成工具的主要局限之一，在于只能就專門的任務配合準備好的數據接受訓練。這些單調而干凈的輸入數據相對有限且難以收集，因此也導致輸出結果變得同樣單調。

Meta AI 的研究人員基于“流匹配”(Flow Matching)技術構建了 Voicebox，這項技術是 Meta 在非自回歸生成模型領域的最新進展，能夠掌握文本到語音之間高度不確定的映射。非確定性映射非常重要，它使得 Voicebox 能夠從不同的語音數據中學習，且無需對各種變化要素做詳盡標注。也就是說，Voicebox 能夠在多樣性更強、規模更大的數據之上進行訓練。

與當前最先進的英語模型 VALL-E 相比，Voicebox 在可懂度(即單詞錯誤率，前者為 5.9%，Voicebox 為 1.9%)和音頻相似度(0.580 對 0.681)方面均更加強大，且速度要快 20 倍。在跨語言風格遷移方面，Voicebox 也優于領先模型 YourTTS，能夠將平均單詞錯誤率從 10.9%降低至 5.2%，并將音頻相似度從 0.335 提高至 0.481。

Voicebox取得新的先進結果，在單詞錯誤率方面優于Vall-E和YourTTS。

Voicebox還分別在英語和多語言基準測試中的音頻風格相似性方面，達成了新的頂尖成績。

研究人員使用超過 5 萬小時的語音錄音，和來自英語、法語、西班牙語、德語、波蘭語和葡萄牙語的公共有聲讀物轉錄對 Voicebox 進行訓練。經過訓練后，Voicebox 能夠在給定前后語音和片段轉錄數據時預測出語音片段。它還能學會根據上下文補全語音，從而被應用于其他語音生成任務，包括在無需重建整個輸入的前提下生成音頻的中間部分。

“AI 孫燕姿”爆火后，再看語音生成濫用風險

Voicebox 擁有眾多令人興奮的用例，但 Meta 也承認其存在潛在的濫用風險，所以 Meta AI 的研究人員決定暫不公開 Voicebox 模型或代碼。Meta 在社交平臺上公開表示：“與其他強大的人工智能創新技術一樣，我們認為這項技術也可能會被濫用，造成意外傷害。”

事實上，語音生成引發的濫用風險并不少見。以華語樂壇最近爆火的“AI 孫燕姿”為例，AI 讓孫燕姿翻紅的同時，也讓背后的風險顯露出來。一方面，AI 合成聲音可能涉及侵權問題，另一方面，也可能帶來一系列倫理和法律的風險。

我國《民法典》第 1023 條第二款規定，對自然人聲音的保護，參照適用肖像權保護的有關規定。第 1019 條第一款規定，任何組織或者個人不得以丑化、污損，或者利用信息技術手段偽造等方式侵害他人的肖像權。未經肖像權人同意，不得制作、使用、公開肖像權人的肖像。由此可見，比照對肖像的人格權保護，未經權利人的同意，也不得制作、使用、公開利用權利人的聲音。

此外，語音生成也會成為電信詐騙的利器。前段時間，美國和加拿大各地使用 AI 合成語音進行電信詐騙的案例多發，不少老年上當受騙。加拿大警方稱，最近加拿大各地都有不少類似案件發生，涉案金額已達數百萬加元。有受害者表示，犯罪分子使用的聲音和她兒子的聲音簡直一模一樣。在美國，類似的詐騙案件近期也呈上升趨勢。

作為首個能夠成功執行任務的多功能、高效泛化模型，Meta AI 堅信 Voicebox 即將開創生成式 AI 語音模型的新時代，但與其他強大的 AI 創新成果一樣，這項技術同樣可能因誤用引發意外危害。對于語音生成帶來的濫用風險，Meta 也想好了對策——構建一款高效分類器，用以區分由 Voicebox 生成的音頻和真實語音，借此緩解未來可能出現的種種風險。

在論文(https://research.facebook.com/publications/voicebox-text-guided-multilingual-universal-speech-generation-at-scale/)中，Meta AI 研究人員還具體講解了如何構建一款高效分類器，用以區分真實語音和 Voicebox 生成的音頻。

參考鏈接：

https://ai.facebook.com/blog/voicebox-generative-ai-model-speech/

http://www.xinhuanet.com/ent/20230620/85f213fc8b914b7a9ea17addc3cec01e/c.html

本文轉載來源：

https://www.infoq.cn/news/YF1LRfH3Ttt7eZ0mBPjQ

語音生成 AI

您可能感興趣

搞懂物聯網產業鏈其實很簡單！《2023年中國AIoT產業全景圖譜》重磅發布！

2022摯物·AIoT產業領袖峰會【線上直播】

華為回應 6 億元成立精密制造公司：不生產芯片

聯想戴煒：以AI推動IT與CT加速融合，建設高質量算力網絡

央行副行長：推進數字人民幣標準化建設實現“一碼通掃”

物聯格局重塑年，物聯網政策盤點與總結

熱門文章

1

將Agentic AI嵌入家庭網關,如何改變運營商在物聯網市場的游戲規則?

3天前

2

格創東智與香港大學共建工業AI聯合實驗室，推動香港成為全球工業AI創新樞紐

4天前

3

物聯網規模化應用發展：智能網聯汽車發揮示范作用

4天前

4

北京 InfoComm China 2025 今天盛大開幕 AI驅動專業視聽新生態，為亞太市場帶來更多機遇

5天前

5

涂鴉智能亮相2025春電展，以AI科技重塑智能硬件新紀元

5天前

6

垂類模型的晉級之路:從工業互聯網的成敗看未來AI的落地邏輯

6天前

7

工業巨頭西門子開始提供5G切片服務,開拓B2B2B商業模式

6天前

8

滿格地鐵暢聯申城上海地鐵5G公眾信號全線網覆蓋啟動儀式成功舉行

6天前

9

豪擲巨款收入囊中！半導體巨頭盯上邊緣AI/端側AI明星企業

1周前

10

揭秘！2025慕尼黑上海電子展丨展位圖及展商名單公布！

1周前

11

邊緣智能+垂類模型:AIoT 2.0的"雙引擎"

1周前

12

端側AI領袖之聲：比鄰智聯--無AI，不物聯

1周前

13

萬字回顧中國生成式AI大會！50+大咖演講精華干貨爆棚，來沒來都值得收藏

1周前

14

針對極端天氣的巨災保險，物聯網能夠發揮什么作用？

1周前

15

蜂擁的人流量背后，這場展會憑什么號稱“行業資源庫”？

2周前

16

華為攜手菲尼克斯，共推工業數智化

2周前

17

2025電子產業四大猜想，慕尼黑上海電子展帶你一站了解政策、技術、市場的多維破局？

2周前

18

“具身智能十五大重點方向”明確產業發展熱點，上下游合力推動具身時代到來

2周前

19

廣和通亮相火山引擎“AIoT智變浪潮”，共探AI智能硬件全球化機遇

2周前

20

康盈半導體徐州測試基地投產，為存儲產品品質護航

2周前

華為回應向30家日企收專利費：合理收費是創新的結果而非目的

近日，華為向30家日企收取專利使費的消息引發熱議。

2023-06-21

智次方·物聯網智庫 —— 研究型智能產業服務平臺

關于智次方

友情鏈接

ITES深圳工業展

極客邦科技

智聯車智庫

智吱屋小程序

本站由阿里云提供計算與安全服務違法和不良信息舉報電話：010-88884220 舉報郵箱：liuzong@zzw.com 網上有害信息舉報

?2022 北京英維塔科技有限公司京ICP備16012223號-1

京ICP備16012223號

智次方·物聯網智庫 —— 研究型智能產業服務平臺

X

主站蜘蛛池模板：最新理伦片EEUSS影院播放 | 久久糟糟糟www成人免费直播| 一级片aa| 91狠狠色丁香婷婷综合久久| 欧美老bb| 美女教师来我家| 欧洲色视频| 韩国大尺度禁片 bd在线播放| 我和岳乱小说合集| 免费精品国产自产拍在| 无码精品捷克街头在线播放| 海外成人免费A片视频| 将她双腿分得更开| 颐和园郝蕾| 乖?好舒服?把腿张开蜜桃文章| 久久夜视频| 欧美V亚洲V综合Ⅴ国产V| 美女跪床??被??网站| 无限免费高清在线播放| 精品蜜桃秘?一区二区三区| 女子撒尿全过程秘?免费| 男女日皮视频| 性生大片免费观看性试看| 国产对白叫床清晰在线播放中| 国产精品福利短视在线播放频| 久久国产精品综合| poronovideos极大| 88xx永久免费看大片| 涩涩五月| 徐冬冬三级在线未删减版电影| 女朋友中文字幕电影| 99久久国产精品成人观看| 男人把j桶入女人J里面| 449999玄机生活幽默449999| 纯肉高H高辣黄粗暴男男| 都来cao我～用力～h| 51激情精品视频在线观看| 永清县| 91福利国产成人精品播放| 狠狠色狠狠色综合伊人| 被女班长脱了裤子摸jiji|

<ul id="km4km"></ul>

<delect id="km4km"><th id="km4km"></th></delect>

<small id="km4km"><center id="km4km"></center></small>

<source id="km4km"></source>