“暖かみのある会話”を実現――OpenAIの新言語モデル「GPT-4.5」は何が変わったのか?

0

2025年02月28日 13:11  ITmedia PC USER

  • チェックする
  • つぶやく
  • 日記を書く

ITmedia PC USER

OpenAIが「GPT-4.5」をリリースした

 OpenAIが2月27日(米国太平洋時間)、新たなAIモデル「GPT-4.5」をリリースした。同社のサム・アルトマンCEOが最近存在をほのめかしていた新しいLLM(大規模言語モデル)である。


【その他の画像】


 これまで提供されていた「GPT-4」世代のLLMと比較すると、より深い知識と正確さを備え、複雑な情報を直感的に理解するようになったという。その上で、感情的知性(専門用語で「EQ」と呼ばれる能力値)が高まり、対話する相手の微妙な意図や感情をくみ取り、共感性の高い暖かみのある対応が可能となったともしている。加えて、LLMにおける課題の1つと指摘されている「ハルシネーション」(事実と異なる情報を、あたかも事実のように語る現象)の発生率も大幅に低減できたとのことだ。


 彼らは、これらをどのように実現したのだろうか?


【更新:15時】GPT-4oに関する説明を変更しました


●「GPT-4.5」の位置付け 「Open AI o」との違いは?


 この話題に踏み込む前に、GPT-4.5の位置付けやネーミングについて整理しておきたい。


 OpenAIはGPT(Generative Pre-trained Transformer)シリーズとは別に「OpenAI o1」なるLLMをリリースしている。o1は推論能力を高めたことが特徴で、登場時は「これがGPT-4の後継モデルだ」との誤解も広まっていた。この誤解は無理もないことだが、実はo1とGPTは進化の方向性が異なる。


 GPTの番号は、基本的にAIモデルの世代を表している。番号が大きくなるほど、モデルの規模と性能が向上し、情報処理能力や知識の量も増えている


 一方で、o1や「OpenAI o3-mini」といったOpen AI oシリーズは、GPTシリーズとは異なる“軸”を重視して開発された。推論モデルの規模や基本性能はGPT-4世代の技術を流用しているが、oシリーズは推論能力(Reasoning)の向上に特化されており、例えると問題を解く際に、思考の過程を明確に示しながらステップを踏んで解答(回答)を行うようになっている。


 これは難しい数学や科学など、特に論理的な考え方が必要な分野で特に力を発揮する。実際に使っているユーザー、特に「ChatGPT Pro」ユーザーはo1 Proモードで、実にきめ細かにステップを踏みながら、多方面に思索を巡らせて結論を出している過程を目撃しているだろう。


 GPTは「広範で直感的な知識と自然なコミュニケーション」を目指して、モデルの規模や基本性能を高める進化を志向している。一方で、oシリーズは「論理的で明確な推論能力」を中心に発展している。「o1はGPT-5だ」と誤解するのも、推論の結果がより賢い感じる場面が多いからだが、単に進化の方向性が異なるからこうなっているだけだ。


 なお、現時点においてGPT-4.5には推論能力は組み込まれていないとのことだが、GPT-4.5をベースに推論能力を備える派生LLMが登場する可能性はありそうだ。


●「GPT-4.5」の仕組み


 GPT-4.5の仕組みにおいて最も大きな特徴は「教師なし学習(Unsupervised Learning)」によってモデルの規模を大幅にスケールアップしたことにある。


 教師なし学習とは、その名の通り人(教師)が明示的に答えを教えなくても、AIが大量のデータから自分でパターンを見出して学習を進める方法だ。これまでは学習に使う大量のデータを事前に調整するために、大きな手間とコストがかかっていた。その点、教師なし学習ではデータを自律的に処理することで効率が上がるだけではなく、人間が気付かないような微妙なパターンや関連性を発見しやすい利点がある。


 また特定の分野やタスクに限定してチューニングやトレーニングを行うわけではないため、モデルに汎用(はんよう)的かつ柔軟な理解力を与えることができる。さらには、新たなデータや未知の状況にも迅速かつ適切に対応可能だ。


 例えばネット検索で見つかる新しい情報に対する適応力が高くなるため、ネット検索を併用した質問などに対する適応性(妥当性)は改善するだろう。


 GPT-4.5のモデル規模は具体的な数字としては発表されていないが、こうした自律的な学習のアプローチが、学習規模やパラメーター数の増大に大きく寄与していると推察される。その結果、冒頭でも紹介したように、GPT-4.5では「知識の深さと正確さ」「EQの高まり」「ハルシネーションの低下」などを実現している。


 例えば、悩みを相談した時に機械的なアドバイスだけでなく、ユーザーの感情や状況を理解し、寄り添った励ましや共感を示すようになった。


●「GPT-4」「GPT-4o」「GPT-4.5」の違いを整理する


 ここで最近のGPTシリーズのリリースを改めて整理しよう。


 「GPT-4」は、広範囲な知識と優れた文章作成能力を持つ汎用的なモデルとして、「GPT-3.5」の後継として登場した。この頃までのGPTは、一直線にモデル規模の拡大を続けていた。


 「GPT-4o」の「o」は、ドイツ語の「Omni」を意味している。応用範囲が広く、マルチモーダル入力に対応したのが特徴だ。大規模化で知識と文書作成能力を高めたGPT-4をさらに高速/効率化したモデルでもある。最適化で応答速度や運用コスト面で優れ、コストも下がったものの、知識の深さやEQの点では進化しているわけではない。


 これに対してGPT-4.5は、GPT-4の特徴をさらに強化するために、知識に関しては「広げる」よりも「深みを持たせる」ことを重視し、より正確な情報を提供することを主目的に開発されたLLMモデルといえる。この中には、EQの向上も含まれる。


 先述したように、この進化軸とは別に、推論に特化したOpenAI oシリーズもあるが、現時点であGPT-4.xとoシリーズは相互補完の関係にある。アルトマンCEOによると、oシリーズは最終的にGPTシリーズに合流する方向とのことなので、将来的には両者が融合することでさらに強力なAIモデルが提供されることが見込まれる。


●「GPT-4.5」が提供する自然で楽しい会話


 Open AIはGPT-4.5が「自然で楽しい会話を実現する」としている。それがどのようなものなのか、気になるところだろう。


 そこで実際に試してみると、例えばユーザーが「テストに失敗して落ち込んでいる」と伝えた際に、従来は改善のためのアドバイスを行うと共に「次は頑張りましょう」といった比較的平凡な返事をしていた。


 その点、GPT-4.5は会話の中から感じ取ったニュアンスに応じて、多様な言葉を添える。先の例なら「失敗すると本当に気持ちが沈みますよね。でも、あなたの能力や価値がそれで決まるわけではないですよ。」「今回のテスト結果はあくまで現時点でのものです。これからの努力次第で、成績は必ず向上します。前向きな気持ちで、次のテストに向けて一緒に頑張りましょう。」といった共感して寄り添う言葉や、状況に応じて励まして向上心をかき立てる言葉を自然に掛けてくれる。


 GPT-4.5は「ChatGPT Pro」を通して既に利用可能だ。筆者はまだ使い始めて数時間だが、一般的な文書作成の中でも、言い回しや論旨の不自然さが解消されているように感じる。


 ただし、GPT-4.5はまだ研究開発段階の「リサーチプレビュー版」だ。今後継続して回答の品質が改善されていく可能性は高い。来週には「ChatGPT Plus」ユーザーも試せるようになるそうなので、契約している読者は実際に試してみるといいだろう。


●今後「GPT」で考えられる展開


 リサーチプレビュー版GPT-4.5は、自然な会話や文章作成支援において、大幅な性能向上が確認されている。誤情報を生成するハルシネーションが減少し、ユーザーの意図をより的確にくみ取る能力が増した点は、ビジネス現場での活用でも大いに歓迎されるはずだ。


 ただし、GPT-4.5には推論機能がまだ公式実装されていない。外部ツールとの連携や、高度な論理推論が必要なタスクでは、既に一定の拡張が行われているGPT-4や、一部のバリエーションモデル(「GPT-4o」「OpenAI o1」など)の方が強みを持つ可能性がある。


 今後GPT-4.5に推論機能が統合されれば、さらに幅広いビジネスユースケースに対応できる万能型AIに発展していくだろう。現時点では、あくまでチャットや文章生成を強化した「対話特化型」としてのアドバンテージに注目するといい。


 例えばカスタマーサポートやマーケティング支援、アイデア発想サポート、さらには社内ナレッジベースへの応答など、「人間らしいやり取り」が求められる場面で効果を発揮することが期待できる。



    ランキングIT・インターネット

    前日のランキングへ

    ニュース設定