Google、次世代AIモデル「Gemini 2.0」発表　レポート作成の「Deep Research」も

　米Googleは12月11日（現地時間）、次世代AIモデル「Gemini 2.0」を発表した。画像や音声の出力、ツールのネイティブ使用などが可能だ。

　まずは、開発者や試験的に使う人に向け、「Gemini 2.0 Flash」として提供する。ベンチマークでは、応答速度は「Gemini 1.5 Flash」と同等でありながら、「Gemini 1.5 Pro」を超えるパフォーマンスを記録した。

　テキストを含む生成画像や、操作可能なテキスト読み上げ（TTS）による多言語音声などをサポートし、Google 検索、コード実行、サードパーティのユーザー定義関数などをネイティブに呼び出せる。

　Geminiユーザーはこれらが可能になったGemini 2.0 Flashを利用できる。

　加えて、高度な推論と長文脈や前後関係を理解する能力を持ち、複雑なトピックを探索してユーザーの代わりにレポートを作成する「Deep Research」という新機能も提供する。対象はサブスクプランサービス「Gemini Advanced」ユーザーだ。

ピックアップ