Windows

マイクロソフト、3秒のサンプルで人の声を再現「VALL-E」が発表!

マイクロソフトは2023年1月5日に音声合成AI「VALL-E」を発表しました。VALL-Eは3秒間の音声サンプルで人の声を再現し、一度学習したデータから声だけでなく感情のトーンや録音環境も再現した合成音声を作ることが出来ます

元々発言していないものを作れる

マイクロソフトVALL-Eは3秒間の音声サンプルだけで声を再現したテキスト読み上げモデルを生産できます。開発者によれば、録音したスピーチやテキスト原稿を変更し、元々は発言していない内容を話したり、他のAIと組み合わせてオーディオコンテンツを作成するといったことが可能になるとのことです。

デモページで確認可能

マイクロソフトはデモページを公開しており、実際に生産された音声を聞くことが出来ます。こういったテクノロジーは便利な一方で、音声合成により偽装やなりすましの可能性が高まるといった懸念もあります。

VALL-Eを聞く

created by Rinker
TOMPOL
¥89,000 (2024/11/22 05:01:34時点 Amazon調べ-詳細)

--

  • この記事を書いた人

のっそす(WPTeq運営)

WPTeqのメインライター兼管理人。 初めてパソコンを購入した際にWindows Meでトラブルに見舞われ、それ以降Windowsに関するさまざまな資料を読むようになる。 Zuneに惚れ込んで以来、Microsoft製品にハマる。 好きなピニャータはファッジホッグ。

-Windows
-, ,

© 2024 WPTeq Powered by AFFINGER5