
生成AI飽和状態の中、スマホから気軽に使えるのがGoogleのAI「Gemini」。アップデートされiPhoneにも対応した"無双AI"を超速解説です!
【画像】Gemini Live、Imagen 4、Android XR、Project Astraを解説
* * *
■Geminiで検索がより便利になります!
5月21日、Googleは同社の開発者向けイベント「Google I/O」で、スマホで使えるAI「Google Gemini」の新機能を発表。誰もが気軽に活用できるようになったというGeminiについて、ITジャーナリストの法林岳之さんに解説してもらいます!
――まず、今回発表されたGeminiのアップデートで注目すべきポイントは?
|
|
法林 各種新機能がiPhoneシリーズのiOS、iPadシリーズのiPadOSにも完全対応したことです。日本ではiPhoneユーザーが多く、これまで以上に最新AIを体験できる機会が増えました。すでにアプリも配信されています。
――そんなGeminiの推し機能は?
法林 「Gemini Live」です。これまで一般的な生成AIのプロンプト(指示)は、テキスト入力が中心でした。一方、スマホに最適化されたGemini Liveを使えば、ユーザーの音声やスマホのカメラでとらえた物体、さらに動画や画像によるプロンプトを行なえます。
――でも、ユーザー視点だと「プロンプトって難しいのでは?」「そもそも画像や動画の生成はやりません」という方も多いと思いますが。
法林 AIで何かを生成するというより、まずは「Google検索の進化版」といった感覚で活用してほしいですね。例えば、Google検索で中古車情報を調べる場合【車名 地域 価格】をテキスト入力することが多いと思います。Gemini Liveなら、それを音声でしゃべればいいのです。
|
|
さらに、カメラと連係しているので、気になった車をカメラに認識させ【この車の中古 最安価格 比較】と音声で指示を出せば、価格の推移や希望車種を扱っているサイトなどを読み上げたり、テキストを表示してくれます。きちんとした文章をしゃべって指示を出す必要はなく、検索キーワードだけでも十分なのです。
――このカメラ認識すごッ! 車のヘッドライトだけでも車名を特定するし、リンゴマークにかざせば「Appleのロゴです」としっかり正解。ただ、スマホに大きな声で話しかけるのは、家でも屋外でもちょっと恥ずかしかったりするのですが......。
法林 私は音声での指示にはワイヤレスイヤホンがマストと考えています。例えば、騒音の大きな電車内で小声でしゃべっても認識しますし、Geminiからの返答もはっきり聞くことができます。価格は高くなりますが、マイク性能を重視した各メーカーのフラッグシップモデルがオススメです。
――画像やイラストの生成なども同じようにすればOKですか?
法林 「Imagen 4」という画像生成ツールが登場しました。こちらもきちんとした文章で指示出しをせずとも、キーワードだけで画像やイラストの生成を行なえます。
|
|
――確かに【二刀流 サッカー選手 イラスト】とかの雑ワードだけでも、ちゃんとイラストを生成。これは友達同士の大喜利には重宝しそう!
法林 ちなみに有料プラン(月額2900円〜)で、AI映像制作ツール「Flow」がアメリカでスタートしました。近日中には各国でも配信予定です。
こちらは基本、映像やイラストなどクリエーティブ関係の仕事をしているユーザーに向けたツールになります。一般的なユーザーなら無課金のImagen 4で十分に楽しめるでしょう。
――ところで、Google I/Oではメガネ型端末のデモも公開されていましたが、これは?
法林 「Android XR」を搭載したスマートグラスの試作機になります。本機はレンズ部分にテキストやルート案内などの情報を表示することができ、話しかけることでGemini LiveなどのAI機能を活用することも可能です。
――Geminiのアップデートで、これまで以上にスマホのAIが身近になってきましたが、より活用するには?
法林 まずは話しかけることです。現在、スマホのAIは話しかけて操作することが基本になってきており、今後はAI以外も音声操作が増えるでしょう。イヤホンがあれば小声でも認識してくれますので、まずは検索からGeminiを始めましょう!
取材・文/直井裕太 写真/Google