Google、画像プロンプトで画像をリミックス生成する「Whisk」

1

2024年12月17日 09:31  ITmedia NEWS

  • チェックする
  • つぶやく
  • 日記を書く

ITmedia NEWS

 米Googleは12月16日(現地時間)、画像を入力することで画像を生成する新しい生成AIツール「Whisk」を発表した。


【その他の画像】


 米国在住のユーザーは、Google LabsのサイトでWhiskを試すことができる。


 Whiskは、テキストではなく画像を使用してプロンプトを作成できるGoogle Labsの実験プロジェクト。Subject(被写体)、Scene(シーン)、Style(スタイル)の3つの画像をドラッグ&ドロップして“リミックス”し、独自の画像を作成できる。テキストプロンプトで説明を補足することも可能だ。


 Whiskは、Googleの生成AI「Gemini」を使用して画像の詳細なキャプションを自動的に記述し、それをGoogleの画像生成モデル「Imagen 3」に入力する。


 Whiskは、画像からいくつかの主要な特徴のみを抽出するため、期待とは異なる画像が生成される場合がある。例えば、生成された被写体の身長、体重、髪型、肌の色が異なる場合がある。その場合は、プロンプトを編集することで修正できる。


 GoogleはWhiskを、従来の画像エディターではなく、新しいタイプのクリエイティブツールと位置付けている。ピクセル単位の完璧な編集ではなく、「迅速な視覚的探索のためのツール」であり、新しい創造的な方法でアイデアを探り、数十のオプションを試して、気に入ったものをダウンロードできるツールだとしている。



このニュースに関するつぶやき

  • 米国在住のユーザーは、Google LabsのサイトでWhiskを試すことができる ←なら、mixiのニュースには無用な記事だが。
    • イイネ!0
    • コメント 0件

つぶやき一覧へ(1件)

ランキングIT・インターネット

前日のランキングへ

ニュース設定