米オープンAIが開発した対話型AI、ChatGPTに新たな音声機能が加わりました。この機能により、ChatGPTは日本語を含む50以上の言語で、まるで人と話しているかのような自然な会話が可能になります。AIを搭載したスマートフォンを通じて、音声で文章を作成したり、必要な情報を尋ねたりといったことがより身近な体験となるでしょう。
今回は、ChatGPTの新しい音声機能や音声機能を有効にする方法、便利な使い方を詳しく解説します。
ChatGPTの新しい音声機能とは?
ChatGPTに、より人間らしい自然な対話が楽しめる新機能「アドバンスドボイスモード」が登場しました。このモードでは、従来のボイスモードが抱えていた課題が解消され、音声表現力と会話スピードが大幅に向上し、以下のようにできることが増えています。
- 感情のこもったリアルなコミュニケーション
- 会話中のレイテンシーの改善
- 9種類のボイスから選択可能
- カスタム指示機能の活用
- メモリー機能の活用
- 割り込み会話が可能
- バックグラウンドでの会話
以下で、ChatGPTの新しい音声機能を詳しく解説します。
感情のこもったリアルなコミュニケーション
ChatGPTの音声機能では、従来のテキストベースのやり取りに加え、人間と話すような自然な音声での対話が可能です。AIが抑揚や感情を巧みに使い分けるため、まるで人間が話しているかのようなリアルなコミュニケーションを実現しています。
例えば、方言を使った会話や過去のやり取りを細かく記憶し、それに基づいた適切な返答をすることができるため、より親近感のある自然な会話が楽しめるでしょう。また、会話のスピードも人間に近く、発音や声のトーンなどの表現の質が大幅に向上したことで、より豊かなコミュニケーションが可能になりました。
そのため、カジュアルな日常会話はもちろん、ビジネスシーンでの応対まで、幅広い場面で活用することができます。
会話中のレイテンシーの改善
レイテンシーとは、私たちが何かを要求してから、それに応えてもらえるまでの時間のことです。従来の音声認識モデルでは、私たちの言葉を聞き取って理解し、回答するまでに平均5.4秒もの時間がかかっていました。これは、人間同士の会話に比べるとかなり長い待ち時間です。
しかし、ChatGPTの新しい音声機能では、最新のマルチモーダルなGPT-4oモデルが使われているため、レイテンシーが大幅に短縮されました。さまざまな種類の情報を直接処理できるため、平均わずか320ミリ秒、最速では232ミリ秒で応答が可能になりました。これは、人間が自然な会話をする際の反応時間に近いスピードであり、よりスムーズで自然な対話が実現できることを意味します。
9種類のボイスから選択可能
ChatGPTの新しい音声機能では、以下の男性5種類、女性4種類の計9種類からAIのボイスを選択できます。
男性 | Arbor | おおらかで多才 |
男性 | Spruce | 冷静で肯定的 |
男性 | Ember | 自信に満ち、楽観的 |
男性 | Breeze | 活発で真面目 |
男性 | Cove | 落ち着いていて率直 |
女性 | Vale | 明るく好奇心旺盛 |
女性 | Juniper | 開放的で明るい |
女性 | Sol | 知識豊かで落ち着いている |
女性 | Maple | 陽気で気さく |
これらのボイスは、単に声色だけでなく、性格も異なっている点が特徴です。元気で明るい声や落ち着いた印象の声など、さまざまな選択肢が用意されています。
この機能を活用することで、利用シーンに合わせたボイスを選択することが可能になります。例えば、友人とのカジュアルな会話には親しみやすい声、プレゼンテーションなどのフォーマルな場面では、落ち着いた信頼感のある声を選ぶことで、より効果的にコミュニケーションを取ることができるでしょう。
カスタム指示機能の活用
ChatGPTの音声機能には、カスタム指示という機能が搭載されています。カスタム指示機能を使うと、ユーザーはChatGPTに特定の情報を伝えたり、求める回答のスタイルや内容を詳しく指示することができます。
例えば、「クライアントに対応する時は、常に丁寧で専門的な言葉遣いで答えてほしい」といった指示をChatGPTに与えておけば、以降はそのクライアントに対して、常にそのトーンを保ちながら応答してくれるようになります。
メモリー機能の活用
ChatGPTのメモリー機能は、これまでの会話の中から重要な情報を自動的に記憶し、次の会話に活かすことができる機能です。ChatGPTはメモリー機能により、一度話した内容を覚えていてくれるため、同じ質問を何度も繰り返す必要がなくなります。
例えば、「好きな食べ物は和食です」と伝えた場合、ChatGPTはその情報を記憶し、次回「何かおすすめの食べ物はありませんか?」と聞くと、「和食がお好きでしたので、〇〇店はいかがですか?」といったように、よりパーソナルな提案をしてくれます。
また、ユーザーが「この情報を記憶しておいてください」と具体的な指示を出すことで、任意の情報を保存することも可能です。そのため、複雑なタスクやプロジェクトの進捗状況などを、ChatGPTに記憶させておき、いつでも確認することができます。
割り込み会話が可能
従来の音声モードでは、AIが一方的に長文を話し続け、会話の流れを遮ることがありましたが、ChatGPTの新しい音声機能では、人間が途中で割り込んでもスムーズに会話が成立します。AIは、人間の言葉を遮ることなく最後まで聞き取り、適切なタイミングで応答してくれるでしょう。
この機能により、会話のテンポが大幅に向上し、ストレスなく会話を楽しむことができるようになりました。AIとの対話に、より人間らしい深みと奥行きが生まれたと言えるでしょう。
バックグラウンドでの会話
ChatGPTの新しい音声機能では、バックグラウンドでの会話が可能です。他のアプリを使っている時やスマホの画面がロックされている時でも、ChatGPTとの会話を途切れさせることなく続けることができます。例えば、通勤中に音楽を聴きながら、気になることをChatGPTに尋ねたり、作業中に手が離せない時でもアイデアを思いつくたびにChatGPTに相談したりすることができます。
そのため、過去のやり取りを踏まえた上で、AIとの会話をより長く、自然な流れで続けることが可能です。この機能の追加により、より便利で快適な利用が可能になると期待されます。
ChatGPTの音声機能を有効にする方法
ChatGPTの新しい音声機能「アドバンスドボイスモード」は、スマートフォンアプリで利用可能です。この機能を利用する際は、お手持ちのアプリが最新版であることを確認してください。アプリのバージョンが古い場合は、一度アプリストアでアップデートを行ってください。
以下で、ChatGPTの音声機能を有効にする方法を詳しく解説します。
ChatGPTのアプリについては以下の記事でも詳しくご紹介しています。ぜひ参考にしてください。
①Advanced Voice Modeを起動する
スマートフォンでChatGPTアプリを開き、画面右下のアイコンをタップすると、アドバンスドボイスモードの画面に切り替わります。
②Voiceを選ぶ
アドバンスドボイスモードを利用する前に、まずはお好みのボイスを選びましょう。各ボイスには、それぞれ異なる性格が設定されており、まるで個性豊かな友人と会話しているような感覚を味わえます。
ボイスを選択したら、完了をクリックしてください。
③ChatGPTと音声での会話を開始する
このアイコンが表示されたら、マイクに向かって話しかけてみてください。あなたの質問に、ChatGPTが音声で答えてくれるでしょう。
ChatGPTの音声機能の便利な使い方
ChatGPTの新しい音声機能は、ユーザーの生活や仕事をより便利で豊かなものに変える可能性を秘めています。以下では、そんなChatGPTの音声機能を最大限に活用するための、便利な使い方をいくつかご紹介します。
ChatGPTの面白い使い方については以下の記事でも詳しくご紹介しています。ぜひ参考にしてください。
リアルタイムでの音声同時通訳
ChatGPTの新しい音声機能は、リアルタイムで正確に言語を変換してくれるため、言葉の壁を感じることなく、スムーズなコミュニケーションが可能です。バックグラウンド再生に対応しているため、他のアプリを使用しながらでも、音声での翻訳を続けることができ、作業の効率化にもつながります。
また、対応言語は多数に及び、特定の方言にも対応しているため、ビジネスシーンから日常会話まで、幅広い場面で活用できます。例えば、海外のクライアントとの会議や旅行中の現地の人との会話など、様々なシチュエーションで役立つでしょう。
語学学習時の練習相手として
ChatGPTの新しい音声機能では、9種類の異なるアクセントの音声から選択できるため、まるで海外旅行中に様々な国の人々と話しているような臨場感あふれるリスニング練習が可能です。TOEICなどの試験対策はもちろん、飛行機内やレストランなど、実際の生活で起こりうる様々なシチュエーションを想定したロールプレイングも手軽に行えます。
仕事で英語を使う機会が多い方も外国人の同僚との会話練習に活用することで、ビジネスシーンでのコミュニケーション能力を向上させることができるでしょう。さらに、ChatGPTはユーザーの発音や表現に対して的確なフィードバックを提供してくれます。自分の発音を繰り返し聞きながら、ChatGPTからのアドバイスを参考に修正することで、より自然な英語の発音を習得することができるでしょう。
ブレインストーミングやアイデア出し
ChatGPTの新しい音声機能は、仕事のパフォーマンスを向上させる強力なツールとして活躍します。例えば、チームで新しいアイデアを創出するブレインストーミングセッションでは、人間の創造性を刺激し、新たな視点や可能性を示唆してくれるため、より革新的な発想を生み出すことができます。
また、会議の内容をリアルタイムで要約し、議事録を作成する作業をAIに任せることで、参加者は議論に集中できるため効率化が図られ、生産性が向上するでしょう。
自社製品の音声紹介サービスの作成
ChatGPTの音声機能を活用すれば、自社製品を魅力的に紹介する音声コンテンツを作成することができます。まずChatGPTに製品の特徴やメリットなどを文章で記述させ、文章をアドバンスドボイスモードで自然な音声に変換します。
最後に、音声ファイルをWebサイトやアプリに埋め込み、「音声で聞く」ボタンを設置することで、訪問者はワンクリックで製品の説明を音声で楽しめるようになります。顧客は、視覚的な情報に加えて聴覚からも情報を得ることができ、より深く製品の魅力を感じて、購買意欲を高めることが期待できます。
ChatGPTの音声機能ではパーソナライズされた体験が可能
今回は、ChatGPTの新しい音声機能や音声機能を有効にする方法、便利な使い方を解説しました。ChatGPTの新しい音声機能によって、AIが私たちの身近な存在となり、様々な場面で私たちの活動をサポートしてくれる未来が現実のものとなりつつあります。
例えば、仕事中にアイデアに行き詰まった時、ChatGPTと気軽に会話をすることで、思いもよらない新しい視点や解決策を見つけることができるかもしれません。AIが私たちの身近な存在となることで、私たちはより創造的で生産的な活動に集中できるようになるでしょう。
