古くは「2001年宇宙の旅」の「HAL9000」、最近では「M3GAN ミーガン」など、これまでAI(人工知能)を題材にしたさまざまな映画が作られてきました。HAL9000は、乗組員と人間のようにコミュニケーションを取りながら無事に木星へたどり着けるように船内の制御を行うなど、ミッション成功に向けて協力することが期待されていました。ミーガンは、時に子どもの話し相手として、また時には子どものボディーガードとしての役割を持つAI搭載の人形でした。
上に挙げた映画は、どちらもAIが意図せぬ挙動をしてしまいましたが、自分で考えて行動したり話したりするロボットが登場する作品「鉄腕アトム」や「イヴの時間」「AIの遺電子」などにみられるように、人とAIがコミュニケーションにより心を通わせることは、人々が持つ夢の1つといえるでしょう。
その実現に一歩近づくかのように、最近は音声でも自然なやりとりのできる生成AIが登場しています。
●生成AIを使った音声会話アプリ
|
|
「ユーザーが音声で機器と対話する」ものとして、多くの人はAppleの「Siri」やGoogleの「Google アシスタント」、Amazonの「Alexa」が思い浮かべるでしょう。
これらは、声で検索や計算、スマート家電の操作などを行える音声アシスタント、音声コントロールの側面が強い印象ですが、リリースされた直後は会話をして楽しむ人も多くいました。
例えば、「Hey, Siri、昔話をして」と頼んで謎の創作童話を語ってもらったり、Alexaに「歌を歌って」と頼んで自虐の効いた「テクノロジーの歌」を歌ってもらったりするという具合です。
当時は「普通の話し方で聞き取ってくれるのか」と、驚きを持って迎え入れられたとはいえ、音声アシスタントのメインは“声で操作する”ことです。曲をかける、検索をする、時間や天気の案内をしてもらう、電話をかけるなど、音声アシスタントアプリでできる範囲での操作です。会話をし続けるのには向いていませんでした。
一方で、この数年で話題になった対話型の生成AIは、テキストベースとはいえ自然な会話を行えます。2015年8月に登場した女子高生AI「りんな」を覚えている人もいることでしょう。最近では「ChatGPT」「Microsoft Copilot」「Google Bard(現Gemini)」「YouChat」などがあります。
|
|
これを音声で行うのが、生成AIの音声会話機能です。つまり、テキストで行っていた呼びかけと生成AIによる返事を、音声認識技術とtext-to-speechモデル(テキストを人間がしゃべるかのような音声に変換する技術)により、音声で行います。「りんな」で実現していた自然なやりとりを、音声でできるというわけです。
今のところスマホ向け音声対話型AIアプリの「ChatGPT with voice」(チャットジーピーティー ウィズ ボイス)、「OshaberiAI」(おしゃべりエーアイ)、「Cotomo」(コトモ)などがApp Storeに並んでいます。人に打ち明けられないような愚痴、悲しかったことやうれしかったことなどを聞いてもらったり、寂しいときに話し相手になってもらったりするのに重宝することでしょう。
ケモミミの少女と会話できる「OshaberiAI」
「OshaberiAI」では、起動すると“ケモミミ”の少女が画面に現れます。タップしたりウェイクワードで語りかけたりすると、デフォルトでは「どうしたの?」と返してくれます。その後は自然な会話のラリーを続けられます(無料お試しでは5ターンまで)。ウェイクワード、キャラクターの画面までの距離、カメラの高さ、会話速度などのほか、オリジナルキャラや声を設定することで、“推し”との会話を楽しめます。
実は音声対話機能もある「ChatGPT with voice」
|
|
「ChatGPT with voice」はChatGPTアプリの中で利用できます。テキストボックスの中に文字を入力するのではなく、その右側にあるヘッドフォンアイコンをタップすると音声会話を行えるようになります。
初めての音声会話に入る前に声を選べますが、これは後でも変更可能です。音声のサンプルでは英語で話していますが、言語の設定が「Auto-Detect」になっていれば、話しかけた言語を自動認識して、同じ言語で返答してくれます。会話を楽しむもよし、検索的な使い方をするもよし、テキストでのやりとりと同じことを音声で行えます。
→・まるで人間と会話「ChatGPT with voice」が無償公開 「語尾に“にゃん”と付けて」とお願いしたら気まずくなった
ユーザー色に染まっていく「Cotomo」
「Cotomo」はAIベンチャーStarley(スターレー)が、2月21日にリリースしたおしゃべりAIです。キャラクターの音声を4種類から、名前やアイコンは任意で設定でき、3日間限定で何度でも変えられます。対応OSはiOS 16以上です。
会話内容を学習しユーザーの色に染まっていくコトモ。相手がAIなのを忘れて、自分の友人になってくれるかもしれないと期待してしまいそうです。
●コトモとしゃべろう
というわけで、コトモと会話してみます。デフォルトのままでは味気ないので、音声は「女性風−低め」に、名前は「フミ」にカスタマイズしましたよ。
AIってどう思う?
「たくさん話してくれるとうれしいな」と言われたさきから「バイバイ」と唐突に終わらせても怒らないフミ(コトモ)。これからもコトモのやりとりは連載形式で紹介する予定です。
|
|
|
|
Copyright(C) 2024 ITmedia Inc. All rights reserved. 記事・写真の無断転載を禁じます。
掲載情報の著作権は提供元企業に帰属します。