AIの進化は、スマートスピーカーへの“失望感”を挽回できるか？　Gemini対応の新型を試す

　自然言語による音声コマンドによって情報を引き出すという行為は、2011年にAppleがiPhoneに「Siri」を搭載したところから始まる。最初はサードパーティアプリだったが、Appleが買収し、「iPhone 4S」に標準機能として搭載した。

【その他の画像】

　この機能は各方面に飛び火し、Google「Google Now」、ドコモ「しゃべってコンシェル」、Microsoft「Cortana」など、様々なプラットフォームに音声アシスタントが登場した。

　14年に米Amazonが初代「Amazon Echo」と音声アシスタント「Alexa」を発表。スマートフォンではなく据え置き型のホーム機器でも、音声コマンドでハンズフリー操作が可能になった。

　この頃、日本ではそうした製品があるということは知られていたが、米国で売れているという話は掴めていなかった。

　追って16年にGoogleが「Google Home」と音声アシスタント「Google Assistant」を発表、11月に発売を開始した。この頃にはすでに米国では、関連対応商品を含め、巨大市場になりつつあった。

　日本でスマートスピーカーが導入されたのは17年である。「Amazon Echo」「Google Home」「Clova WAVE」が相次いで発売された。最初は音楽再生も視野に入れて、中型のBluetoothスピーカーぐらいのサイズだったが、音声アシスタントの利用を中心とした「Echo Dot」や「Google Home Mini」といった小型モデルが投入された。

　またスマートスピーカーの画面付き版「スマートディスプレイ」も登場した。音声で指示して、その結果を視覚情報として確認するという流れができた。

　18年にはAppleが「HomePod」で参入。日本では約1年半遅れて翌年（19年8月）に販売が開始された。ただし価格が3万5424円と他社よりも高かったため、二の足を踏んだ人も多かった。

●最終的に単品としての使い道に

　筆者も17年頃から、Amazon EchoやGoogle Home Miniなど、色々購入しては試してみた。ただ最終的には、単品としての使い道になっていった。

　Google Home Miniはキッチンにぶら下げて、もっぱらキッチンタイマーの代わりとなった。「Echo Studio」は、手軽な空間オーディオ再生装置としてテレビの脇に置かれた。「Echo Show 15」はリモコンを買ってAmazon Prime Video専用機として娘の寝室に置かれた。

　この背景には、音声アシスタントが期待外れだったという問題がある。例えば「午後3時の30分前にアラームをセットして」と言っても、午後3時にアラームをセットしてしまう。「30分前」が分からないのだ。また「今日これから出かけるのに傘が必要？」と聞いても、気温概況を述べるだけで降水確率も返さない。傘が必要である意味が分からないのだ。

　人間が知りたいことは、自分の行動に関する情報だが、それを直接音声アシスタントに聞いても、その背景まで理解して回答しない。「すみません、よくわかりません」という返答を嫌というほど聞いた。

　人間は、話が噛み合わない相手との会話は疲れる。そういう風にできているのだ。結局、スマートスピーカーが問題なくできることの範囲でしか使えないのなら、それはスマートスピーカーじゃなくていいか、ということになった。

　現在、筆者の手元には、スマートスピーカーは1つもない。転居を機に、全て処分してしまった。AIの進化がスマートスピーカーに降りてくるまでいらないな、と思ったからだ。

　しかし再度スマートスピーカーを購入するまで、それほど時間はかからなかった。24年にGoogleが、Google HomeにGeminiをインテグレートする計画を発表しており、25年には米国の一部のユーザー向けに、「Gemini for Home」が利用できるようになった。

　そして今年6月25日、Gemini for Home対応の新型「Google Home Speaker」の出荷が開始された。世界20カ国・10言語対応となり、当然日本語にも対応する。価格は公式サイトで1万6800円。早速購入し、数年ぶりに「OK google」と言ってみている次第だ。

●洗練された受け答えに進化

　「Google Home Speaker」は、直径107mm、高さ86.6mmの球体だ。スピーカーは58mmフルレンジのモノラルスピーカーで、マイクは3つ

　静電容量方式のタッチセンサーを備えており、頂点をタッチすると音楽のポーズ、左右のタッチで音量調整ができる。

　「OK google」で音声アシスタントへ指示できるのは同じだ。ただAIはアップグレードを選択することで、「Gemini for Home」に変更できる。

　設定途中で出てくる「Google Home Premium」は、スマートホーム向けの有料サブスクである。ホームセキュリティカメラなどと連携して、自然言語で外の状況を報告させることができる。このサービスはGoogle Oneと統合されており、「Google AI Pro」または「Google AI Ultra」のユーザーはGoogle Home Premiumが追加料金なしで利用できる。

　最初に設置した際には、自分の位置を転居前の宮崎市だと認識していた。Googleアカウントの自宅住所はすでに変更済みだが、それとは別にGoogle Homeでの自宅設定を覚えているようで、こちらも変更しなければならなかった。自宅がいくつもある人や、オーナーとユーザーが別というパターンもあるだろうが、それはイレギュラーな話で、大抵は同じである。同じGoogleのサービス同士、もう少し気を利かせてくれてもよさそうだ。

　以前の音声アシスタントで対応できなかったコマンド、「午後3時の30分前にアラームをセットして」は、無事理解でき、2時30分にセットされた。例えば出かける時間にアラームを鳴らしてほしい場合、通常は待ち合わせ時間の何分前には家を出ないと、と考えるはずである。よってターゲット時間の何分前、で間接的に時間を指示できる方が、人間の考えとしては自然である。

　「今日これから出かけるのに傘が必要？」と聞いたところ、本日は雨が降っており傘は必要だと回答した。また現地の天気予報も合わせて回答した。傘と雨との関係を理解している。

　この原稿を執筆しているのは6月26日だが、お昼すぎに関東地方で地震があった。地震情報を訪ねたところ、まだ速報がネットに上がっていないのか、情報が得られなかった。

　2時間ぐらいしてもう一度訪ねたところ、気象庁発表の震度や震源地、Yahoo!を情報源とする居住地周辺の震度や状況などを網羅して教えてくれた。

　直近のニュースはテレビやラジオなどライブメディアが強いが、しばらく経ってからのニュースは、スマートスピーカーがサマリー化して伝えてくれる。ラジオニュースを聞いているような感覚である。

　「今朝のニュースを読み上げて」といった指示でも、3つ4つのFLASHニュースを読み上げたあと、さらに続けるかどうかを尋ねてくる。朝のニュースチェックは、食パン片手にスマホを見るより、音声で聞いたほうがお行儀が良い。

　また「自動化」機能では、特定のワードをしゃべることで、複数のタスクを順番にこなせるようになっている。例えば「OK Google おはよう」と言えば、本日の天気予報を読み上げたあと、Googleカレンダーに登録されている今日の予定を知らせたのち、ニュースコンテンツを再生する、といったアクションが可能だ。

　ただ、アクションは自由語で指示することはできず、ある程度決まった動作や短いワードで指示することになる。このあたりのUIにまでは、まだGemini for Homeが行き届いていないようだ。

　単純なアクションも、自動化しておくと便利だ。例えば「ニュース」というだけで指定メディア提供のニュースを再生する。あるいは「ラジオ」というだけでJ-Waveを再生するといった設定も可能だ。

●より柔軟になった音楽再生

　次に音楽再生機能を試してみた。これもスマートスピーカーでは人気の機能ではあるが、筆者はあまり使わなくなった。それというのも、筆者が聞きたい曲がレアすぎて、これまでの音声アシスタントでは探せなかったのだ。

　そのあたりもかなり柔軟に対応できるようになっている。例えば日本のフュージョングループ「T-SQUARE」は1989年以前は「THE SQUARE」という名前で多数のアルバムを発表している。よって「THE SQUARE」時代の曲を聴こうとすると、音声コマンドではややこしいことになっていた。

　だがGemini for Homeでは、SQUAREというバンドには「T-SQUARE」と「THE SQUARE」の2つ名前があることを認識しており、どちらを再生するか聞いてくる。うろ覚えのアルバム名「何か虹の名前がついたアルバム」と指定したら、無事「うち水にRainbow」を再生してくれた。これはかなり使えそうだ。

　スピーカーとしては、サイズからすればよく低音が出るが、全体的にやや低域に寄りすぎている傾向がある。このあたりは低域・高域のトーンコントロールがあるので、調整可能だ。

　惜しいのは、モノラルスピーカーだということである。同じものを2個買えばステレオペアできるのだが、ステレオペアで聞くには2個を近くに置いておかなければならない。せっかくスマートスピーカーが2個あるのに、同じ場所に置いたら1カ所でしか使えない。

　単にステレオにしたいだけで1万6800円出して同じものをもう1個買うのももったいない。スマート機能なしで、ステレオペアリングできるだけの同サイズのスピーカーを廉価で出してくれないだろうか。

　Radikoと連携できるので、ラジオ再生も可能だ。ただしRadikoは標準では居住地域で受信可能なラジオ局しか再生できない。

　別途サブスクで「エリアフリー」に登録すれば、違う場所のラジオも聞ける。筆者は以前住んでいた宮崎市のJOY FMを聴くためにエリアフリーに登録しているが、Google Home Speakerと連携しているRadikoサービスは、アカウントログインができない。つまりエリアフリーを契約していても、居住地域のラジオしか聞けないのである。

　別途RadikoのスマホアプリでJOY FMを再生しておき、それを「キャスト」機能でGoogle Home Speakerに飛ばせば音は鳴るのだが、やりたいことはそうじゃない。

　AIの爆発的な進化は24年頃から始まったが、スマートスピーカーはそれに置いていかれた。今年ようやく受け答えの部分は現代レベルのAIになったが、それ以外のUIや外部サービス連携のようなところはそれほど変わっていない。以前よりはだいぶマシになったとは言えるが、その間に我々はAIに慣れ、もっとできるはずという期待値が上がっている。現時点ではまだそこに届いていない印象だ。

　ただ今後登場するスマートスピーカーは、内部のプロセッサ等もLLMに対応したものになっているはずだ。人間とAIのインタフェースとして、なんでもここに集約するという方向性と、再生機としてあらゆるソースがここに集約するという方向性の2つをどう舵取りしていくか。

　エージェンティックAIによってソフトウェア開発もスピードが上がっている。こうしたサービスもぜひ、今どきの進化スピードであってほしい。

AIの進化は、スマートスピーカーへの“失望感”を挽回できるか？　Gemini対応の新型を試す

このニュースに関するつぶやき

ピックアップ

新着のニュース

注目のニュース

IT・インターネット

ランキングIT・インターネット

アクセス数ランキング

話題数ランキング

困ったときには

AIの進化は、スマートスピーカーへの“失望感”を挽回できるか？ Gemini対応の新型を試す

このニュースに関するつぶやき

ピックアップ

新着のニュース

注目のニュース

IT・インターネット

ランキングIT・インターネット

アクセス数ランキング

話題数ランキング

困ったときには

AIの進化は、スマートスピーカーへの“失望感”を挽回できるか？　Gemini対応の新型を試す