
Intelは1月6日から9日まで(米国太平洋時間)、「CES 2026」においてショールーム「Intel Lounge」を開設した。このショールームでは、会期前日に発表された「Core Ultraプロセッサ(シリーズ3)」(開発コード名:Panther Lake)が持つ、多彩なポテンシャルを体感できた。
会期中、Intel Loungeを訪れる機会を得たので、その様子をレポートしたい。
●Panther Lakeの「推論アクセラレーター」は1つじゃない
現在、あらゆるIT機器に「推論(AI)アクセラレーター」が搭載されつつあるが、その実装形態は大きく分けると3パターンあることをご存じだろうか。
|
|
|
|
1つ目は、CPUの拡張命令として実装されるスタイルだ。Core Ultraプロセッサ(シリーズ3)だと「AVX-VNNI」「AVX-VNNI-INT8」「AVX-VNNI-INT16」「AVX-NE-CONVERT」「AVX-IFMA」などが該当する。
このタイプの推論アクセラレーターは、CPU用プログラムとして直にコーディングできる特徴があり、PCI Expressバスを介さずに直接データ群にアクセスできること、既存のCPUコードとの連携がしやすいことから、主に軽量な推論を超低遅延で運用する用途に用いられる。
2つ目は、GPUに推論アクセラレーターを内蔵するスタイルだ。Core Ultraプロセッサ(シリーズ3)だと、GPUタイルに内包された「XMX(Xe Matrix Extensions)」がそれに当たる。
GPU内蔵スタイルの推論アクセラレーターは、主にAI支援をグラフィックス処理系に適用する目的で活用されることが多い。具体的には「超解像処理」「フレーム生成」「アンチエイリアス処理」などが用途の定番だ。AI支援で高度な表現を実践する「ニューラルレンダリング」も、昨今では注目を集めつつある。
また、大容量のグラフィックスメモリが搭載されている場合は、GPU単体でLLM(大規模言語モデル)/SLM(小規模言語モデル)や拡散モデルといった生成AIをローカルで動作させる際にもGPU内蔵型の推論アクセラレーターが活用される。
|
|
|
|
3つ目は、CPUやGPUには統合されない、単体の専用推論アクセラレーターだ。これは「NPU(Neural Processing Unit)」と呼ばれることもあり、Core Ultraプロセッサ(シリーズ3)では「Intel AI Engine」がそれに相当する。
NPUは“専用”ということでAI処理、もっというと推論処理で用いられる演算に特化している「固定機能プロセッサ」に近い位置付けだ。消費電力当たりの性能、いわゆるワッパが圧倒的に優れているという特徴がある。
今回のIntel Loungeでは「GPU内蔵スタイル」「専用アクセラレータースタイル」の推論アクセラレーターの活用事例を体験できるようになっていた。
なお、1つ目に紹介した「CPUの拡張命令スタイル」の推論アクセラレーターは、ゲームなどではNPC(ノンプレイヤーキャラクター)などの「意志決定AI」や「リアルタイム物理シミュレーションの近似」などで採用事例がある。
しかし、これらの事例はユーザーに分かりやすく見せてアピールすることが難しいこと、またこの実装スタイルは競合のCPUでもおおむね同様に実践できるため「Intelならでは」をアピールしづらい。もっというと、昨今のRyzenシリーズが「AVX-512」系の命令にフル対応している分、CPU拡張命令スタイルでは「AMDがIntelより先行している」というイメージも強まっている。
|
|
|
|
これらの事情もあって、今回のデモでは意図的にCPU拡張命令スタイルの推論アクセラレーターを取り上げなかったのかもしれない。
●GPU内蔵の「XMX」を使ったデモ
Core Ultraプロセッサ(シリーズ3)の内蔵GPU「Xe3 GPU」に内包された推論アクセラレーターであるXMXは、基本的に先代の「Xe2アーキテクチャ」におけるXMXと大きく変わりがない。Xe3 GPUの最上位に当たる「Intel Arc B390」の公称ピーク性能は120TOPS(毎秒120兆回)だが、この性能は以下の計算式から導出されたものだ。
12(Xeコアの数)×4096(OPS)×F(GHz)=120TOPS
このデモコーナーでは、Core Ultraプロセッサ(シリーズ3)マシンのローカル環境で動作可能な言語空間の生成AIを動作させる実演と、実際に来場者がデモマシンに触れる機会が与えられた。
1つ目は、HPの14型ノートPC「HP EliteBook X G2i 14-inch」のCore Ultra X7 358H/32GBモデルに、Iternal Technologiesが開発したフルローカル動作可能なAIアシスタント「AirgapAI」を組み合わせたデモンストレーションだ。
AirgapAIは、Meta製の「Llama 3.2」(1B/3B)、Google製の最新軽量モデル「Gemma」(9B)、Microsoft製の「Phi-3.5」「Phi-4」など、どちらかと言えば小規模言語モデル(SLM)にカテゴライズさせられるAIを内包している。現地のデモ機では、AirgapAIに対してCES 2026の基調講演のプレゼン資料を読み込ませた状態となっており、今回の発表内容について聞くことができるようになっていた。
ちょっと意地悪かもしれないが、筆者はここで、基調講演で触れられなかったPanther Lake世代のCPU「Coreプロセッサ(シリーズ3)」について質問したところ、ややトンチンカンな回答が返ってきた。
「えー、トンチンカンじゃなぁ」と思ったかもしれないが、実はややトンチンカンな答えを返す挙動こそが“正解”なのだ。というのも、このAirgapAIは、“Airgap”と名前が付く通り、ネットワークから物理的に隔絶された状態で稼働する(推論を行う)ことを売りとしているアシスタントなのだ。外部サーバへの通信は、設定を変更しない限り行われない。
つまり、ローカルで保有しているデータ以上の受け答えができないのは当然というわけである。
2つ目は、Khadas Mindの「Mini PC」のCore Ultra X7 358H/96GBモデルに「Super Agent+MCP」を組み合わせたデモンストレーションだ。先ほどと同じようにCoreプロセッサ(シリーズ3)について質問したところ、こちらは“正しい”返答を得ることができた。
ちなみにSuper Agent+MCPは「Intel AI Assistant Builder」の機能名で、ローカル動作させたLLMにRAG(検索拡張生成)機能を統合した仕組みのことを指す。「MCP」はModel Context Protocolの略で、ベースシステムのAIに足りない情報(知識)を外部ツールや外部ネットワーク上のサーバに求めるためのオープン規格となる。
こちらのデモ機でローカル動作していたのは、Alibaba CloudのLLM「Qwen3-30B-A3B」だ。これは体感レスポンスを稼ぎやすい「MoE(Mixture of Experts)」と呼ばれるLLMの一種だ。名前からも察せる通り、総パラメーターは30B(300億)規模ではあるが、推論時には1トークン当たり3B(30億)パラメータのみを採用する仕組みが取り入れられている。簡単にいえば「知識の書庫は30Bもあるが、推論する知能は3B程度」といった感じとなる。得られた回答はシンプルとはいえ間違えてはおらず、正しい返答になっている。
こちらも、NPUではなくXMXで動作するため、タスクマネージャではGPUの「Compute」の方に負荷がかかる。高負荷な時間は2回に分かれており、一旦負荷が収まる挙動となったのは、このタイミングで基調講演では触れられなかった「Coreプロセッサ(シリーズ3)」の情報を探索に出かけた証左といえる。
1台目のデモは完全ローカル動作かつ外部情報探査なしのSLM系AI、2台目のデモは基本はローカル動作で、足りない知識は外部に求めるタイプのLLM系AIだったが、いずれも「Core Ultraプロセッサ(シリーズ3)ならバッチリ動くよ」という意味で強いアピールにはなる。
ただし、この手の言語系生成AIをローカルで動かそうとするとメインメモリが多く必要となるのは言うまでもない。
●「Davinci Resolve」のMagic Mask機能がXMX対応
GPUに内蔵されているXMXは、AI機能の中でも特に映像やグラフィックスに対する処理系が得意だ。その事例としてIntelが紹介していたのが、BlackMagicの映像編集アプリ「Davinci Resolve」の機能の1つ「Magic Mask」だ。
Magic Maskでは映像内の特定の人物や物体をAIが自動で認識し、フレームが進んで適用対象物が移動したり変形しても、その領域を正確に追従するマスクを動的に作成できる。AI登場以前であれば、1フレームずつ手作業で作らなければならなかったところ、Magic Maskを使えば編集画面でマスク対象としたいオブジェクトをクリックするだけで、そのオブシェクトだけを追跡するマスクを生成可能だ。
今回のデモンストレーションでは、「スケートボード競技者の衣服の色を変える」というお題を見せていた。編集中のフレームよりも時間軸上の前方向と後方向の両方に追跡をかけて、見事にマスクを生成していたのが印象的だった。
なお、このデモではマスク生成中にXMXへと高い負荷がかかり続けたが、一度生成処理が終わると、編集画面ではほとんどXMXには負荷がかからなくなっていた。
ちなみに、筆者が調べた限りにおいて、Magic Mask機能はNVIDIAの「Tensorコア」、Appleの「Neural Engine」、AMDの「Radeon AIアクセラレーター(WMMA)」に対応していたが、IntelのXMXに対応したのは2022年の「Intel Arc A700 Graphicsシリーズ」からであった。 CPU内蔵GPUのXMXに対応したのは、先代の「Core Ultra 200Vプロセッサ」(開発コード名:Lunar Lake)から対応している。その意味では、このデモは特段「Panther Lakeならでは」ということになる。
とはいえ、映像編集アプリにおけるAI支援機能が、CPU内蔵GPUへの対応が着々と進んでいることを示すには悪くない。今や単体GPUがなくても、ある程度のAI機能が利用できるようになったということなのだ。
●NPUを活用したデモはどんな感じ?
Core Ultraプロセッサ(シリーズ3)に搭載されている専用推論アクセラレーター「Intel AI Engine」は、「第5世代(NPU 5)」ということになっている。先代のCore Ultra 200Vプロセッサに搭載されている「第4世代(NPU 4)」のピーク性能は最大48TOPSだったのに対して、今回のNPU5は微増して最大50TOPSとなった。
今回のデモコーナーにおいて、この新NPUを活用したデモンストレーションとして公開されていたのは、Elgatoの「Prompter」と、その支援アプリ「Elgato Camera Hub」だった。
Elgato Prompterとは、小さなディスプレイ装置の前にハーフミラーを被せたような構造のテレプロンプターで、手持ちのカメラ機器あるいはElgato純正のWebカメラと合体することでいわゆる「プロンプター(原稿表示装置)」として利用できる。ユーザーは画面に映る原稿を見ながら読み上げることで“カメラ目線”を簡単に実現できるというものだ。
この製品は個人ユーザー向けだ。比較的安価なので筆者も所有しており、少し詳しい。従来、Camera HubのAI支援機能はGeForce RTXシリーズを搭載するPC、あるいはApple Siliconを備えるMacでのみ利用できたが、今回お披露目された新バージョンにおいて晴れてIntel AI Engineに対応したとのことである。
Intel AI Engineでは「Voice Sync」と呼ばれる、話者の読み上げに同期して原稿のスクロール速度を調整する機能がサポートされる。話者が発声を止めたり、原稿内容から外れたフリートークを始めたりすると、それを検知して原稿のスクロールを停止してくれる。なかなか賢い。
担当者によると「この機能はNPU側で動作するため、GPU側のMXMに負荷はかからない。つまり、XMXを活用した超解像処理『XeSS(Xe Super Sampling)』のパフォーマンスに影響しない」という。
まあ、ゲーム実況配信者がプロンプターを使ってカメラ目線で原稿を読み上げる状況は少ないと思うので、この例えにリアリティーは感じなかったが、この読み上げ連動スクロール機能自体はビデオ会議でのプレゼンテーションに確かに役に立ちそうである。
●他の展示物
会場内には、Core Ultraプロセッサ(シリーズ3)を搭載した製品や、その周辺機器なども展示されていた。その一部を紹介したいと思う。
今回のIntelラウンジでは、Core Ultraプロセッサ(シリーズ3)搭載PCに任意のゲーム系ベンチマークアプリをインストールして、その結果を計測できるという取り組みをしていた。
ということで、筆者は「モンスターハンターワイルズ ベンチマーク」をCore Ultra X9 388H搭載ノートPCと、筆者私物の「ASUS ROG Xbox Ally X」(Ryzen Z2 Extreme搭載)にインストールして、パフォーマンスの違いを比較してみた。
テストの設定は「グラフィックスプリセット:中」「レイトレーシング:中」「フレーム生成なし」とした。結果は、Ryzen Z2 Extreme×Radeon 890Mの結果が「1万767ポイント/平均31.55fps」なのに対して、Core Ultra X9 388H×Arc B390では「1万4725ポイント/平均43.37fps」だった。プレイ可否判定でいうと、Core Ultra X9 388H×Arc B390は一段階上の「快適にプレイできます」となった。
一応、GPUの理論性能(FP32演算時)は以下の通りとなる。
・Radeon 890M:CU16基×128SIMD×2FLOPS×2.9GHz≒11.88TFLOPS
・Arc B390:Xeコア12基×128SIMD×2FLOPS×2.5GHz≒7.68TFLOPS
理論性能値的には1.55倍も高いRadeon 890Mを相手に、Arc B390はゲーム系ベンチマークソフトで勝利したことになる。
2026年は、Core Ultraプロセッサ(シリーズ3)を搭載するポータブルゲーミングPCが出てくるかもしれない。
|
|
|
|
|
|
|
|
Copyright(C) 2026 ITmedia Inc. All rights reserved. 記事・写真の無断転載を禁じます。
掲載情報の著作権は提供元企業に帰属します。