NTT、高音質かつ低遅延なリアルタイム音声変換技術を開発

■声と話し方を好みのスタイルに一瞬で変える

 NTT(日本電信電話)<9432>(東証プライム)は6月17日、話者の声をリアルタイムで別の話者の声に変換する技術を開発したと発表。同技術は、深層学習に基づき、高音質と低遅延を両立。音声の特徴量を抽出する新たな処理により、未来の音声信号のバッファが不要となり、低遅延処理が可能になった。これにより、Web会議やライブ配信での使用が見込まれ、コミュニケーションの自由度が大きく向上する。

 特徴量変換器は、EncoderとDecoderの2つのモジュールで構成され、話者の特徴を別の話者の特徴に変換。新たに導入された制約により、話者情報の残留が大幅に低減され、高品質な変換が実現した。未来の音声フレームを使用せず、現在と過去の音声フレームのみで変換を行うことで、低遅延を保証している。

 聴取実験では、音質と話者類似性において従来法を上回る結果が得られた。今後、発声機能障がいへの活用や、実環境での使用を想定した対雑音性向上、安定性向上などに取り組む予定で、安心して好みの音声でコミュニケーションできる未来が期待される。(情報提供:日本インタビュ新聞社・Media-IR 株式投資情報編集部)

関連記事


手軽に読めるアナリストレポート
手軽に読めるアナリストレポート

最新記事

カテゴリー別記事情報

ピックアップ記事

  1. ■オーダーメイド開発と人材リスキリングで業務変革を伴走支援  ベルシステム24ホールディングス<6…
  2. ■調査件数拡大と効率化で追徴税額1431億円  国税庁は12月、令和6事務年度における所得税および…
  3. ■企業の6.5%がクマ出没による業務影響と回答、宿泊業で4割に迫る  東京商工リサーチ(TSR)は…
2026年1月
 1234
567891011
12131415161718
19202122232425
262728293031  

ピックアップ記事

  1. ■上場来高値更新の金先物、産金・再資源化・再販株に資金集結  当コラムでは昨年来、何度も金関連株を…
  2. ■地政学リスクの影が迫る市場、ヘッジ先は金関連株にあり  しばしばニュースで報じられる高齢ドライバ…
  3. ■金融政策転換が映す相場の地殻変動、投資視点は次の段階へ  長期にわたり株式市場を押し上げてきた金…
  4. ■為替が握る業績相場の行方、円安継続が選別相場を加速  株式市場が金融環境主導の相場から業績重視の…
  5.  再生可能エネルギーの次を見据えた次世代エネルギー分野では、実用化への距離が縮まりつつある核融合発電…
  6. ■AI圏外で存在感を増すディープ・テック、次世代エネルギー関連株に再評価余地  ハイテク株市場では…

アーカイブ

「日本インタビュ新聞社」が提供する株式投資情報は投資の勧誘を目的としたものではなく、投資の参考となる情報の提供を目的としたものです。投資に関する最終的な決定はご自身の判断でなさいますようお願いいたします。
また、当社が提供する情報の正確性については万全を期しておりますが、その内容を保証するものではありません。また、予告なく削除・変更する場合があります。これらの情報に基づいて被ったいかなる損害についても、一切責任を負いかねます。
ページ上部へ戻る