米Googleは12月11日(現地時間)、次世代AIモデル「Gemini 2.0」を発表した。画像や音声の出力、ツールのネイティブ使用などが可能だ。
まずは、開発者や試験的に使う人に向け、「Gemini 2.0 Flash」として提供する。ベンチマークでは、応答速度は「Gemini 1.5 Flash」と同等でありながら、「Gemini 1.5 Pro」を超えるパフォーマンスを記録した。
テキストを含む生成画像や、操作可能なテキスト読み上げ(TTS)による多言語音声などをサポートし、Google 検索、コード実行、サードパーティのユーザー定義関数などをネイティブに呼び出せる。
Geminiユーザーはこれらが可能になったGemini 2.0 Flashを利用できる。
|
|
加えて、高度な推論と長文脈や前後関係を理解する能力を持ち、複雑なトピックを探索してユーザーの代わりにレポートを作成する「Deep Research」という新機能も提供する。対象はサブスクプランサービス「Gemini Advanced」ユーザーだ。
|
|
|
|
Copyright(C) 2024 ITmedia Inc. All rights reserved. 記事・写真の無断転載を禁じます。
掲載情報の著作権は提供元企業に帰属します。
タカラトミー、サンタさんへ助言(写真:おたくま経済新聞)46
YouTube、自動で吹き替え可能に(写真:ITmedia Mobile)49