こんにちは!AI研究所の石川です。
本日のtopicsは、 AI アバター作成用プラットフォームである「NVIDIA Omniverse Avatar」をご紹介します。
2021年11月9日、カリフォルニア州サンタクララ — GTC— NVIDIA は、インタラクティブなAIアバターを生成するためのテクノロジプラットフォームである「NVIDIA Omniverse Avatar」を発表しました。
Omniverse Avatarの概要
Omniverse Avatar は、音声 AI、自然言語理解、レコメンデーションエンジンおよびシミュレーションといった領域における、NVIDIA のテクノロジが組み合わされたものです。このプラットフォームで作成されたアバターは、レイトレーシングされた3Dグラフィックスによる、インタラクティブなキャラクターで、見ること、話すこと、多様な話題について会話することができ、自然に話された意図を理解することができます。
また、ほぼすべての業界向けに簡単にカスタマイズできる AI アシスタントの創造への扉を開きます。このAIアシスタントは、レストランでの注文や銀行取引、個人的なアポイントメントと予約といった、日々の数十億のカスタマーサービスのやり取りで使用することができるため、ビジネス機会の拡大と顧客満足度の向上につながります。
3Dワークフローを実行する、仮想世界のシミュレーションおよびコラボレーションのためのプラットフォームである NVIDIA Omniverse™ の一部で、現在オープンベータで7万人以上のユーザーが利用しています。
Omniverse Avatar の主な要素
Omniverse Avatar は、音声 AI、コンピューター ビジョン、自然言語理解、レコメンデーション エンジン、フェイシャル アニメーションおよびグラフィックスの要素を使用しています。それらの要素は、以下のようなテクノロジによって実現しています。
■音声認識は、複数言語の音声を認識するソフトウェア開発キットである NVIDIA Riva がベースとなっています。Riva は、テキストから音声に変換する機能を使って、人間と同じような会話応対を生成するためにも使用されています。
■自然言語理解は、人間の言語を認識、理解および生成することのできる、NVIDIA の Megatron 530B Large Language Model がベースとなっています。Megatron 530B は、ほとんど、あるいは全く学習することなく、複雑な文の作成、幅広い分野の質問への回答、長くて複雑なストーリーの要約、他の言語への翻訳、特別に学習されていない多くの分野への対応が可能な、事前に学習されたモデルです。
レコメンデーション エンジンでは、大量のデータを処理して、賢明な提案をするのを可能にするディープラーニング レコメンデーション システムを構築するためのフレームワークである、NVIDIA Merlin™ が使用されています。
■認知機能では、ビデオ分析用のコンピューター ビジョン フレームワークである、NVIDIA Metropolis が活用されています。
■アバターのアニメーションでは、2D および 3D の AI によるフェイシャル アニメーションとレンダリング技術である、NVIDIA Video2Face と Audio2Face が使用されています。
これらの技術はアプリケーションに組み込まれ、NVIDIA Unified Compute Framework を使ってリアルタイムで処理されます。拡張性に優れ、カスタマイズ可能なマイクロサービスとしてパッケージされた、これらのスキルは、NVIDIA Fleet Command™ によって、複数の場所にわたって、安全に導入、管理および集約することができます。
リアルタイムでの対話型 AI アシスタントが可能になる、AI アバター作成用プラットフォーム「NVIDIA Omniverse Avatar」に注目です!