NTT、高音質かつ低遅延なリアルタイム音声変換技術を開発

■声と話し方を好みのスタイルに一瞬で変える

 NTT(日本電信電話)<9432>(東証プライム)は6月17日、話者の声をリアルタイムで別の話者の声に変換する技術を開発したと発表。同技術は、深層学習に基づき、高音質と低遅延を両立。音声の特徴量を抽出する新たな処理により、未来の音声信号のバッファが不要となり、低遅延処理が可能になった。これにより、Web会議やライブ配信での使用が見込まれ、コミュニケーションの自由度が大きく向上する。

 特徴量変換器は、EncoderとDecoderの2つのモジュールで構成され、話者の特徴を別の話者の特徴に変換。新たに導入された制約により、話者情報の残留が大幅に低減され、高品質な変換が実現した。未来の音声フレームを使用せず、現在と過去の音声フレームのみで変換を行うことで、低遅延を保証している。

 聴取実験では、音質と話者類似性において従来法を上回る結果が得られた。今後、発声機能障がいへの活用や、実環境での使用を想定した対雑音性向上、安定性向上などに取り組む予定で、安心して好みの音声でコミュニケーションできる未来が期待される。(情報提供:日本インタビュ新聞社・Media-IR 株式投資情報編集部)

関連記事


手軽に読めるアナリストレポート
手軽に読めるアナリストレポート

最新記事

カテゴリー別記事情報

ピックアップ記事

  1. ■ガソリン・軽油の暫定税率廃止法成立  ガソリン暫定税率廃止法は11月28日に成立し、ガソリン税2…
  2. ■うつ・統合失調症・発達障害を脳から理解する、最前線研究を平易にまとめた一冊  翔泳社は11月25…
  3. 【新築マンションの短期売買を分析】  国土交通省は11月25日、三大都市圏および地方四市の新築マン…
2025年12月
1234567
891011121314
15161718192021
22232425262728
293031  

ピックアップ記事

  1. ■「大きく産んで小さく育てる」IPO市場、期待裏切る後半戦  48勝2分10敗である。2025年の…
  2. ■日銀イベント通過で円高前提、紙・パ株が師走相場の主役候補  今週のコラムは、日銀の金融政策決定会…
  3. ■FOMC通過も市場は波乱、金利と為替に残る違和感  FRB(米連邦準備制度理事会)のFOMC(公…
  4. ■眠れる6900トンの金が動き出す、「都市鉱山」開発でリデュース株に追い風  今週の当コラムは、金…
  5. ■天下分け目の12月10日、FRB利下げで年末相場は天国か地獄か?  天下分け目の12月10日であ…
  6. ■AI・データセンター需要拡大に対応、測定能力は従来比最大2倍  リガク・ホールディングス<268…

アーカイブ

「日本インタビュ新聞社」が提供する株式投資情報は投資の勧誘を目的としたものではなく、投資の参考となる情報の提供を目的としたものです。投資に関する最終的な決定はご自身の判断でなさいますようお願いいたします。
また、当社が提供する情報の正確性については万全を期しておりますが、その内容を保証するものではありません。また、予告なく削除・変更する場合があります。これらの情報に基づいて被ったいかなる損害についても、一切責任を負いかねます。
ページ上部へ戻る