限定公開( 2 )
米OpenAIが4月16日(現地時間)に発表したハイエンドAIモデル「o3」。旧モデルに比べ推論性能が向上した他、新たにWeb検索と画像生成機能の併用にも対応したという。そのクオリティーや、画像をジブリ風の画像にする“ジブリ化”からよくも悪くも話題になったChatGPTの画像生成機能だが、o3ではどれだけ進化したのか。
●何が変わった? 新モデル「o3」の特徴
o3は同社がこれまで一般公開している中で最高性能を持つ「o1」の次世代モデルだ。特にコーディングや数学、科学、視覚認識などの分野を得意としており、OpenAIによれば複数のベンチマークで最高記録(SOTA)を達成したという。
さらに、ChatGPT内の全ツールを組み合わせて、AIエージェントのように使うことが可能になった。対象の機能は画像生成やPythonでのデータ分析やWeb検索など。例えば「YouTubeのトレンドを調べて」と指示し、その結果を画像に反映させられる。
|
|
画像生成機能で使っているモデルが、従来の「GPT-4o」などと異なるかどうかは、OpenAIの説明からは判然としない。とはいえo3の推論性能が加わり、Web検索などとの組み合わせも使えるので、モデルが変わっていなくても、実質的には高機能化していると言えそうだ。
●「よく見る“アレ”っぽいやつが欲しい!」実現力が上がった
というわけで、早速画像生成機能を試してみる。記者は記事のサムネイル画像を自作することがあるが、デザインの心得があるわけでもなく毎回苦心しているので、この作業をAIに任せてみる。
例えば、1月に公開した「動画生成AI『Sora』爆速レビュー 50本生成して分かった、得意なこと・苦手なこと」という記事のサムネイル。記者が作ったものはこんな感じ。
生成動画のスクリーンショットをコラージュし、文字を加えただけなので、もっと見栄えの良いものにできたはず。そこでo3に「YouTubeでの反応が良さそうなサムネイルの傾向をつかんで、それに合わせたサムネを作って」と指示してみた。すると、Web検索で集めた情報を参考に、こんな感じの画像を出してきた。
|
|
「本」が1個多いミスをしてはいるが、かなりYouTubeっぽい。文字のミスは後からの指示で修正もできた。思考過程を見るに、推論→検索→それを基に得た情報を参考にさらに推論→要件定義→画像を作成といったステップを踏んでいるようだ。所要時間は1分半程度。この間に、人間でいう参考資料の検索と、そこから構成などを考える作業を、自律的に行っているといえるだろう。
一方4oに同じ指示をするとこんな感じ。
どことなく情報商材っぽさが強い。ブラウジングの有無が影響したか、アスペクト比も異なる。どっちをクリックするかと言われれば、まぁo3の方だろう。ただ、o3は長考を前提とするモデルなので、所要時間は4oに比べ長い。
違ったジャンルの画像生成も試してみる。例えば日本のアニメっぽい美少女イラスト。記事のサムネイルと同じく、o3にはWeb検索でトレンドをつかんで生成するよう指示し、4oには検索なしでトレンドに合わせた画像を出すよう頼んだ。それぞれの出力結果がこれだ。
o3の方が若干、4oにあったスケッチぽさが減り、服装なども“今風”になった印象だ。o3の返答いわく、「Y2K」(2000年代のファッション風)を意識したといい、トレンドをつかもうとする努力も見られる。
|
|
次に「日本の経費精算SaaSのUIを出力して」と頼んでみた。こちらもo3はWeb検索を使い、4oはそうでない形で出力した。
文字が多いために、さすがに双方フォントが崩壊しているし、要素はどちらもあまり変わらない。ただ、ややクリーム色がかった色合いの4oに比べ、o3は真っ白な色をベースにしており、日本のSaaSっぽくなっている。動画のサムネイルを頼んだときと同様、アスペクト比も違う。
他にもいろいろ試したが、o3は4oに比べ、出てくる画像の画風やタッチが劇的に変わっているわけではない。一方で「よく見る“アレ”っぽいやつが欲しい!」を実現する能力が、Web検索や推論によって補強されているように感じた。サムネイルなど、独自性があまり高くない画像を作る用途においては、4oより便利に使えそうだ。この記事のサムネイル画像も、o3に頼んでみた。
ただし、実用性が増して利用頻度が高まれば、リテラシーも求められる。特にo3の画像生成機能は、Web検索と生成をワンストップで併用できるだけあって、気付かず著作権侵害をしてしまうリスクも高まるかもしれないと感じた。もちろん、ChatGPT側にも回避の仕組みは存在するだろうが。
ChatGPTの画像生成AI機能を巡っては、自分の写真などをジブリ風の画像にするジブリ化について、文部科学省の戦略官が16日の衆議院内閣委員会で「(日本の著作権法においては)単に作風・アイデアが類似しているのみであれば、著作権侵害に当たらない」「他方、AIにより生成されたコンテンツに、既存の著作物との類似性及び、依拠性が認められれば著作権侵害となり得る」と答えたところ。権利侵害になり得るコンテンツとそうでないコンテンツの違いについて、今後もよりしっかりとした理解が必要になりそうだ。
|
|
|
|
Copyright(C) 2025 ITmedia Inc. All rights reserved. 記事・写真の無断転載を禁じます。
掲載情報の著作権は提供元企業に帰属します。