テキストや画像などを自動生成するAI(人工知能)技術「生成AI」が普及する中で、アーティストや写真家といったクリエイターの仕事を生成AIが奪うのではないかという懸念が広がった。クリエイターの制作物を生成AIが無断で学習し、独自の画像を生成する恐れがあるためだ。
この懸念を払拭する動きがあった。2023年、デジタル素材を提供するGetty Imagesは画像生成AIツール「Generative AI by Getty Images」を発表した。その特徴は「クリーンデータセット」を使用する点だ。クリーンデータセットとは何か。クリーンデータセットがクリエイターに希望をもたらす理由とは。
●クリーンデータセットがクリエイターに“優しい”理由
「クリーンデータセットとは、安全で責任ある商用利用が可能な教師データだ」。Getty ImagesでデータサイエンスおよびAI・機械学習部門のディレクターを務めるアンドレア・ガリアーノ氏はこう説明する。
|
|
ガリアーノ氏によると、Getty Imagesのクリーンデータセットには、企業の著作物、デザインといった知的財産や、有名人の画像が含まれていない。「特定の有名人の画像を生成しないように、細心の注意を払っている」(同氏)
クリーンデータセットを使えば、ドナルド・トランプ氏やカマラ・ハリス氏といった人物の画像も生成しないという。「Generative AI by Getty ImagesのAIモデルは両者の画像を学習したことがない」(ガリアーノ氏)
このような規制を設けることで、ディープフェイク(AI技術を使って合成された、事実と異なる映像や音声、写真)を作成される可能性を排除する。生成した全てのコンテンツには「合成」や「AI生成」というタグ付けをしている。
「人物や物体を写した画像の価値を損なうような状況を避けたい」(ガリアーノ氏)
AIモデルのトレーニングに使用するデータを提供した人物には報酬が支払われる。Generative AI by Getty Imagesの収益の一部が、データセットの作成に貢献したクリエイターに分配される仕組みだ。
|
|
本記事は米国TechTargetの記事「Creating a clean generative AI data set with Getty Images」を翻訳・編集したものです。一部、翻訳作業に生成AIを活用しています。