
米Googleは5月19日(現地時間)、開発者会議「Google I/O 2026」で、動画の生成・編集に対応するAIモデル「Gemini Omni」を発表した。自然言語による指示で動画を作成・編集でき、同社は「世界モデル」や画像生成モデル「Nano Banana」の動画版とうたう。最初のモデル「Gemini Omni Flash」の提供も開始した。
Gemini Omniでは、会話形式での指示により、一貫性を保ちながら段階的に動画を編集できる。画像・テキスト・動画・音声など複数のデータ入力を参照でき、撮影済み動画内の人物やキャラクター、物体のディテールを変更したり、差し替えたりすることも可能だ。カメラアングルの変更や、テキストの表示などもできるという。
Google I/O 2026で公開したデモでは、白いメッシュ状の素材でできたオブジェの質感をさまざまに変更する映像などを披露。カラフルな毛糸のようになったかと思えば、風船のようになり、次の瞬間には泡でできたような質感になる──といった具合だ。
Gemini Omniで生成・編集したコンテンツには、AI生成であることを示す電子透かし「SynthID」と、コンテンツの来歴を記録する「C2PA Content Credentials」を付与。それぞれの記録はGeminiアプリ内で検証できる。今後、Google ChromeやGoogle検索での検証機能も追加する方針だ。
|
|
|
|
Gemini Omni Flashは、Geminiのアプリや、映像制作ツール「Google Flow」で、AIサブスクリプション「Google AI Plus」「Pro」「Ultra」のユーザー向けに19日から提供。さらに、今週中にはYouTube上でも無料提供する予定。APIも今後提供する。
|
|
|
|
|
|
|
|
Copyright(C) 2026 ITmedia Inc. All rights reserved. 記事・写真の無断転載を禁じます。
掲載情報の著作権は提供元企業に帰属します。

ドコモで通信障害か「圏外」の声(写真:ITmedia Mobile)44

あくどい質問へのベストアンサー(写真:おたくま経済新聞)68