米エヌビディアは19日、現行のAI向け半導体「Blackwell(ブラックウェル)」と比較して処理性能が1.5倍の「Blackwell Ultra(ブラックウェル・ウルトラ)」を2025年後半に提供開始すると発表した。推論の技術を強化し、AIリーズニング、エージェント型AI、フィジカルAIなどのアプリケーションの高速化を可能にしたという。「NVIDIA Dynamo推論ソフトウェア」によりリーズニングAIサービスを拡張し、スループットの飛躍的向上、応答時間の高速化、総所有コストの削減を実現するという。現行のBlackwellから何が変わるのか。専門家の見解を交えて追ってみたい。
AI開発には最先端GPUが必要とされ、世界の最先端GPU市場で一強ともいわれるエヌビディアの地位は絶対的ともいわれていたが、今年1月には中国の新興AI企業DeepSeek(ディープシーク)が米Open AIの「ChatGPT」に匹敵する性能を持つAIモデルを、米国製の10分の1以下のコストで開発したと発表。半導体についてエヌビディア製の最先端モデル「H100」の代わりに廉価版の「H800」を使用していることから、最先端の半導体を使用せずとも高性能なAIモデルを開発できるという見方も広まった。
そんな見方を打ち消すかのように、エヌビディアは今月開かれた年次開発者会議「GTC」において、今後毎年、新製品を投入していく計画を表明。25年にはBlackwell Ultra、26年には次世代AI半導体「Rubin(ルービン)」、27年には「ルービンUltra」を投入する計画を発表した。
今回発表されたBlackwell Ultraの大きな特長が、新しいオープンソース「Dynamo推論ソフトウェア」だ。エヌビディアのリリースによれば、複雑な多段階の問題を自律的に解決するエージェント型AIに最適であり、AIエージェントシステムは単に指示に従うだけでなく、特定の目標を達成するために論理的にリーズニングを行い、計画を立てて行動することが可能だという。また、フィジカルAIにより、ロボットや自動運転車などのアプリケーションの大規模なトレーニング用に、ビデオをリアルタイムで生成できるようになるという。
Blackwellからの進化について、AI開発・研究者でメタデータ社長の野村直之氏はいう。
|
|
「生成AIブームはますます隆盛を誇り、多段の推論をしたり(例:ChatGPT o1,o3)、その際にネット上を調査しながら思考の流れを変え、深めていくタイプのAI(例:Deep Research, Deep Seek R1)が登場しています。これら、2025年からの流れの大きな特徴は、以前のように大量に学習させてモデル(AIの実体)を大きくするのに計算パワーを使うのではなく、お題を与えられてからの推論の際に多大な計算パワーを使うようになってきたのがポイントです。実際、因果推論、根拠探し、例証、といった15のステップを踏んで10分間くらいかけて、合計100近いウェブの探索もしながら、下手なコンサル顔負けの立派なレポートを作ってくれることもあります。
こんな、(AIの学習でなく)推論過程(対話ボットが質問を解釈し咀嚼・調査・思考を重ねて回答を作成する過程)をサポートする動きは、最新のハードウェアと、それを効率よく活用するためのミドルウェア(ハードウェアやOS、ドライバ等を効率よく動かすための基本ソフトウェア)の充実にも現れています。今年はじめ、約2年ぶりにGPUのラインアップを刷新してBlackwell世代としたエヌビディアも先陣を切って参入しています。
従来のBlackwell発表時(2024年3月)には、AIファクトリープラットフォーム『NVIDIA』として、例えばエヌビディアが第2世代『Transformer Engine』と呼ぶアルゴリズムが、Blackwellの低精度ながら高速な4ビット浮動小数点演算ユニットがAIの推論を高速化することにより、2倍サイズのモデルが扱えるとうたわれました。これに対しBlackwell Ultraは、当初のBlackwell世代GPUよりもマイナーチェンジで1.5倍の性能に強化されたとうたわれています。たとえば、HGX B300 NVL16は、ある条件下でのLLM推論が11倍高速化されています。
Blackwell Ultraのソフトウェア面では、オープンソース推論フレームワーク『NVIDIA Dynamo』を活用することで、AIリーズニングサービスの拡張と応答時間の短縮、スループットの向上がはかられています。
まとめると、Blackwell UltraではAIの推論能力を向上させるために、ハードウェアとソフトウェアの両面から強化が図られており、特にステップを踏んで深く推論する推論・思考型のAI、エージェント型AI、エージェントをセンサーや動作アームなどと連携させたフィジカルAIなどの分野での応用が期待されています」
|
|
(文=野村直之/AI開発・研究者、メタデータ株式会社社長、東京大学大学院医学系研究科研究員)
|
|
|
|
Copyright(C) 2025 Business Journal All Rights Reserved. 記事・写真の無断転載を禁じます。
掲載情報の著作権は提供元企業に帰属します。