
11月だけで3社が、新しいLLM(自然言語処理モデル)を投入した。OpenAI、Google、xAI――。米国のAI御三家にイーロン・マスクが加わり、わずか1週間の間に、首位争いがめまぐるしく変動した。さらに中国のDeepSeekとQwen(アリババ)が「コスト激安」を武器に殴り込みをかけている。選択肢が多すぎるが、ビジネスパーソンはどうすればいいのか。
●激動の11月
首位争いの口火を切ったのは、OpenAIだった。11月13日、同社はGPT-5.1を発表した。実は前作のGPT-5は評判が悪かった。「冷たい」「機械的すぎる」など、ユーザーからの声は厳しかった。新版は会話の自然さを最優先に設計し直した。
例えば、失恋相談。ユーザーが「彼女に振られた」と打ち込むと、旧版はいきなり「対処法は3つあります」と語り出した。一方、新版はまず「つらいですね」と共感する。たったこれだけで、印象は大きく変わる。
|
|
|
|
しかし、わずか5日後に情勢が一変する。11月18日、GoogleがGemini 3 Proを投入し、LMArena(AI性能ランキングサイト)で1501点を記録した。業界標準のベンチマークで首位に立ったのだ。
このモデルの強みは、圧倒的な“保持できる情報量”だ。比喩的にいえば、書籍1000冊分に相当するデータを一度に扱える。さらにGmail、Google Drive、検索エンジンと連携するので、「明日の会議資料を探して要約して」と頼めば、Drive内を検索し、メールの日程と照合して答えを出す。単体の賢さだけでなく、Googleの全サービスと連動する「万能選手」路線である。
マスク氏のxAIも、反撃に出た。11月19日、xAIはGrok 4.1を発表し、LMArenaで1483点。Geminiに31点差で及ばなかったものの、マスクは「地上最強AI」と譲らない。Grok最大の武器はリアルタイム性だ。Xの全投稿を学習し続け、「今、世界で何が話題か」を誰よりも早く知る。ニュース速報が出る前に、トレンドをつかめるというわけだ。
少しさかのぼるが、9月末にAnthropicがClaude Sonnet 4.5を出していた。こちらは長時間労働が得意だ。30時間ぶっ通しで開発作業をこなせる。途中で文脈を忘れたり、方針がブレたりしないので、まさに“疲れ知らずの同僚”といえる。
●中国勢の衝撃
|
|
|
|
実はこの争いには、もう一つの戦線がある。中国勢だ。2025年1月のDeepSeekショックを覚えている方も多いだろう。わずか数百万ドルで最先端AIを作り、世界を驚かせた。
DeepSeekとQwenは、米国勢とは全く違う戦い方をしている。彼らはAIモデルの“設計図”を丸ごと公開する「オープンウェイト」という方式をとっている。普通、OpenAIやGoogleはモデルの中身を企業秘密として公開しないが、中国勢は逆で、学習済みデータまで無料で配ってしまう。そのため、誰でもモデルをダウンロードして、自分のPCで動かせるのだ。
しかも性能で劣らない。DeepSeekのV3.1は、オープンウェイトモデルながらLMArenaでGPT-5やGeminiと並ぶ水準にある。
10月、ある実験が行われた。米国のnof1.ai研究所が「AI投資大会」を開いた。6つのAIモデルにそれぞれ1万ドルを渡し、17日間、暗号資産で運用させた。参加者はDeepSeek、Qwenの中国勢2社と、GPT-5、Gemini、Claude、Grokの米国勢4社だ。
結果は衝撃的だった。Qwenが22.32%の利益を出し、DeepSeekも4.89%の黒字で続いた。一方、米国勢は全滅した。GPT-5は-62.66%、Geminiは-30.81%の大赤字である。ClaudeもGrokも赤字で終わった。
|
|
|
|
なぜこうなったのか。DeepSeekの取引記録を見ると、分散投資と厳格なリスク管理が徹底されていた。市場が下落する前に利益を確定し、上昇の兆しで再び買う。まさにプロ投資家のような振る舞いだった。対照的にGPT-5とGeminiは、理論に忠実すぎた。教科書通りの判断を繰り返し、市場の急変に対応できなかった。
中国勢の狙いはこうだ。オープンウェイト化で自社規格を「デファクトスタンダード」にして開発者を囲い込み、独自の推論技術で実現した「構造的な安さ」を武器に企業を取り込む。
皮肉にも、米国のAIスタートアップの多くが中国製LLMを使っている。シリコンバレーのベンチャー企業が、GPT-5ではなくDeepSeekを組み込んでサービスを作る。理由は単純で、コストが10分の1なら、粗利が何倍にもなるからだ。
OpenAIに毎月数万ドル払うより、DeepSeekを自社サーバで運用したほうがコスト効率が良い。中国市場でも同様だ。比亜迪(BYD)などの自動車メーカーが車載AIに採用し、華為(ファーウェイ)、小米(シャオミ)のスマホにも搭載される。性能は米国最高峰に迫り、コストは大幅に安い。
●で、結局どれを使えばいいのか
結局のところ、どれを使えばいいのか。答えは簡単で、全部使えばいい。幸い、どれも無料で試せる。
ビジネスパーソンにとって大事なのは、各社の得意領域を理解することだ。ベンチマークの総合点では僅差に見えても、実際の使い勝手は驚くほど違う。無料版と有料版でも能力差は大きい。「どれが最強か」ではなく「何に使うか」で選ぶ時代になった。
実は、各サービスの得意分野はかなり違う。会話の自然さならChatGPT、長文の資料作成ならClaude、画像や動画を読み込ませるならGeminiのマルチモーダルが強い。しかもGeminiは、図版の作成や画像編集を大幅に強化している。リアルタイム情報ならGrok、コストを抑えるならDeepSeek。さらに無課金と課金では性能差も大きい。
そういえば、米国にもオープンウェイトのLLMがあった。MetaのLlamaである。一時は「オープンソースで最高性能」と評価され、累計12億回もダウンロードされた。
しかし、最近はあまり話題にならない。AIのゴッドファーザーの一人、ヤン・ルカン博士も2025年に、Metaを去った。Llamaはどこに行ったのだろう。ひょっとしたら、中国勢に食われたのかもしれない。
(斎藤健二、金融・Fintechジャーナリスト)
|
|
|
|
|
|
|
|
Copyright(C) 2025 ITmedia Inc. All rights reserved. 記事・写真の無断転載を禁じます。
掲載情報の著作権は提供元企業に帰属します。