AI研究所 - AI(人工知能)に脅かされないために、AI(人工知能)を作る側の人間になる -

  • お問い合わせ

HOME  >  AIチャットボットで「多話者多言語音声合成」を実現へ!

公開日:2020.12.15 

AIチャットボットで「多話者多言語音声合成」を実現へ!

チャットボット

こんにちは!AI研究所の見習い研究員Chisatoです。
本日のtopicsは、rinna株式会社が実現した、AIチャットボットにおける「多話者多言語音声合成」をご紹介します。

rinna株式会社は、この度、AIチャットボットにおいて、AIキャラクターの音声表現の多様性を高める新技術「多話者多言語音声合成」を発表しました。

多話者多言語音声合成の概要

rinna社について

rinna社は、MicrosoftのAI&リサーチ部門でAIチャットボットの研究を行っていたチームがスピンアウトして2020年6月に設立したAI開発企業です。ディープラーニング技術を活用し、AIが文脈に応じた会話文を自動生成して人間と自然に会話する「共感チャットモデル」、AIが話し声や歌声で豊かな感情表現を可能にする「音声合成システム」などの技術を発表してきました。これらの最新技術は、rinnaが運営するLINE上のAIチャットボット「AIりんな」や、会話内容や音声表現をカスタマイズしてキャラクター性を持たせたAIチャットボットである「AIキャラクター」の開発に応用され、企業のマーケティングなどに使われています。

「多話者多言語音声合成」技術とは

「多話者多言語音声合成」とは、1つのAIから、複数話者と複数言語の音声を合成する技術です。rinnaでは、日本語話者の音声と英語話者の音声を学習データとし、最先端のディープラーニング技術を用いることにより多話者多言語音声合成システムを構築しました。
従来、AIキャラクターの音声合成を実現するためには、対象の話者の音声を大量に収録する必要がありました。新たに開発した多話者多言語音声合成では、複数の話者の音声を用いて1つの音声合成モデルを学習することで、複数の話者・言語の音声を合成することができます。それによって、対象の話者の少量の音声からでも、その話者のキャラクター性を持った音声を合成することができます。
さらに、日本語と英語といった複数の言語の音声も含めて1つの音声合成モデルを学習することで、英語がしゃべれない話者のキャラクター性を保ったまま、英語の音声を合成することも可能となります。
今回発表した多話者多言語音声合成の技術は、少量の音声データを用いた学習により、それぞれのAIキャラクターがそれぞれの個性に応じた合成音声で会話することを可能にします。

実際、多話者多言語音声合成の技術を使ってrinna社のAIが合成した日本語・英語の音声データが、東映株式会社より2020年12月18日に公開予定の映画『劇場版 仮面ライダーゼロワン REAL×TIME』の一部シーンで採用されました。

 

AIキャラクターの音声表現の多様性を高める新技術「多話者多言語音声合成」に注目です!


参考になったら「いいね!」と「シェア」をお願いします!!

このエントリーをはてなブックマークに追加
AI(人工知能)セミナー開催中