「GeForce RTX 5090」を速攻テスト! 約40万円からだが“異次元”のうたい文句はダテではない ただし電源容量と冷却面に注意

0

2025年01月24日 00:11  ITmedia PC USER

  • チェックする
  • つぶやく
  • 日記を書く

ITmedia PC USER

GeForce RTX 5090 Founders Edition

 NVIDIAの新型GPU「GeForce RTX 5090」を搭載するグラフィックスカードが、まもなく発売される。日本における税込み想定販売価格は39万3800円からとなる。


【その他の画像】


 ITmedia PC USERでは、発売に先駆けてNVIDIA純正のグラフィックスカード「GeForce RTX 5090 Founders Edition」(日本未発売)を先行レビューする機会を得て、そのパッケージとカードの外観を紹介する記事を先日掲載した。


 この記事では、いよいよ本カードの“実力”をチェックしていく。


●そもそも「GeForce RTX 5090」ってどんなGPU?(おさらい)


 テストを始める前に、GeForce RTX 5090を含む「GeForce RTX 50シリーズ」の仕様を改めて確認していこう。


 GeForce RTX 50シリーズは、NVIDIAの最新GPUアーキテクチャ「Blackwell(ブラックウェル)」をコンシューマー向けに初採用したGPUだ。AI(人工知能)を生かした「ニューラルレンダリング」を実現すべく、AIの処理性能を高める工夫が施されている。


 行列演算をつかさどる「Tensorコア」は第5世代に進化し、FP4(4bit浮動小数点演算)」をサポートした。これにより、生成AIの大幅な性能向上が望める。


 ゲーミングという観点では、NVIDIA独自の超解像技術「DLSS(Deep Learning Super Sampling」の最新バージョン(DLSS 4)において「マルチフレーム生成」を利用できるようになった。これはGeForce RTX 40シリーズにおける「フレーム生成」をより高度にしたもので、1つのフレームにつき補間フレームを最大3つ生成できる。


 動画エンコーダー「NVENC」は第8世代から第9世代に、動画デコーダー「NVDEC」は第5世代から第6世代に進化し、4:2:2フォーマットの動画のエンコード/デコードに対応した。動画を扱うクリエイターにも、一定の恩恵がある。


 グラフィックスメモリはGDDR7規格となり、メモリの帯域幅は最大で毎秒1.7TBまで拡大された。GPU内のデータ伝送速度が向上するということは、PCとの接続バスも高速化を求められる。そのこともあり、接続バスはPCI Express 5.0(PCI Express 4.0互換あり)となった。


 今回レビューするGeForce RTX 5090は、GeForce RTX 50シリーズのフラグシップモデルだ。主な仕様は以下の通りとなる。


・CUDAコア:2万1760基


・Tensorコア(ピーク処理性能):3352 AI TOPS


・RTコア(ピーク処理性能):318TFLOPS


・動作クロック(定格仕様):2010GHz〜2410GHz


・グラフィックスメモリ:32GB(GDDR7/512bit)


・動画エンコーダー:3基(第9世代)


・動画デコーダー:2基(第6世代)


・消費電力(定格仕様):575W(補助電源は「8ピン×4」相当)


 CUDAコアの数は、先代の最上位モデル「GeForce RTX 4090」(1万6384基)から約25%しか増えていないものの、先述したTensorコアの改善やAI処理の整理を行う「AIマネジメントプロセッサ」の実装によりピーク時の処理性能が2倍以上に向上している(1321AI TOPS→3352AI TOPS)。


 グラフィックスメモリの容量は24GBから32GBに増え、帯域幅も384bitから512bitに拡張された。動画エンコーダー/デコーダーは世代が進化しただけでなく、それぞれ1基ずつ増設された。まさしく、GPUを使う“あらゆること”に対して機能を強化した、現時点で最強のGPUといえる。


 しかし、かなりの性能向上には“代償”を伴う。定格の消費電力(TGP)は450Wから575Wとなり、PC全体に求められる推奨電源容量も850Wから1000Wと増えている(※1)。


 現在使っているデスクトップPCのアップグレード手段として、GeForce RTX 5090を搭載するグラフィックスカードに載せ替える場合、電源容量が十分か事前に確認が必要となる。


(※1)Ryzen 9 9950X(TDP:170W)を搭載するPCの場合。実際に必要な電源容量はシステム環境によって異なる


●ベンチマークテストで実力をチェック!


 ここからは、ベンチマークテストを通してGeForce RTX 5090の実力をチェックする。今回は「Core Ultra 7 265K」を軸に組み立てたPCと、GeForce RTX 5090 Founders Editionを組み合わせている。なお、CPU、マザーボード、電源、CPUクーラー(水冷式)はASUS JAPANから借用している。


 グラフィックスドライバはテスト版の「バージョン571.86」で、マザーボードなどのファームウェア/デバイスドライバやOSは1月21日時点における最新版を利用している。PCの構成やドライバのバージョンは異なるが、ITmedia PC USERの記事で過去に実施した「GeForce RTX 4090」「GeForce RTX 4080 SUPER」「GeForce RTX 3090 Ti」のテスト結果も参考に掲載する。


 本当であれば各世代のグラフィックスカードをそろえた状態で、改めて計測を行い比較したかったのだが、テストを行える期間が非常に短かったため、ご容赦いただきたい。


3DMark


 3Dグラフィックスのパフォーマンスをチェックするアプリ「3DMark」で主要なテストを実行してみよう。今回はDirectX 11ベースの「Fire Strikeシリーズ」、DirectX 12ベースの「Time Spyシリーズ」を用意されている全解像度で実行した上で、リアルタイムレイトレーシング(RT)のパフォーマンステスト「Port Royal」も実施した。


 各テストの総合スコアは以下の通りだ。


・Fire Strike(DirectX 11/フルHD)


・GeForce RTX 5090:5万5209ポイント


・GeForce RTX 4090:5万3932ポイント


・GeForce RTX 4080 SUPER:4万781ポイント


・GeForce RTX 3090 Ti:4万4452ポイント


Fire Strike Extreme(DirectX 11/WQHD)


・GeForce RTX 5090:4万4572ポイント


・GeForce RTX 4090:4万578ポイント


・GeForce RTX 4080 SUPER:3万1613ポイント


・GeForce RTX 3090 Ti:2万5932ポイント


Fire Strike Ultra(DirectX 11/4K)


・GeForce RTX 5090:3万906ポイント


・GeForce RTX 4090:2万4428ポイント


・GeForce RTX 4080 SUPER:1万7982ポイント


・GeForce RTX 3090 Ti:1万4247ポイント


Time Spy(DirectX 12/WQHD)


・GeForce RTX 5090:3万7538ポイント


・GeForce RTX 4090:2万8552ポイント


・GeForce RTX 4080 SUPER:2万6660ポイント


・GeForce RTX 3090 Ti:2万278ポイント


Time Spy Extreme(DirectX 12/4K)


・GeForce RTX 5090:2万1620ポイント


・GeForce RTX 4090:1万7652ポイント


・GeForce RTX 4080 SUPER:1万4118ポイント


・GeForce RTX 3090 Ti:1万1274ポイント


Port Royal(DirectX 12/レイトレーシング)


・GeForce RTX 5090:3万3423ポイント


・GeForce RTX 4090:2万5280ポイント


・GeForce RTX 4080 SUPER:1万8526ポイント


・GeForce RTX 3090 Ti:1万4554ポイント


 当たり前かもしれないが、いずれのテストもGeForce RTX 5090が最高スコアとなった。


 環境に違いがあることは前提だが、スコアの乖離(かいり)状況はテストによって異なる。RTをテストするPort Royalの結果に注目して4090のスコアと比べてみると、スコアの差はTensorコアの性能差(公称の演算性能差)とおおむね比例している。


 ハイエンドのGPUを求めるユーザーは、総じてゲームをプレイするディスプレイ環境もハイエンドな環境をそろえているだろう。4K(3840×2160ピクセル)以上の解像度ともなれば、単純な3Dモデルの美しさだけでなく、より「現実に近い表現」での没入感を求めたくもなる。その点でいえばGeForce RTX 5090におけるPort Royalのスコアは、よりリアルな表現を担保するものとして見て良いだろう。


 前々世代の最上位であるGeForce RTX 3090 Tiと比べてみると、テストによってスコア差は2倍近くになる。2世代差なので当然といえば当然なのかもしれないが、よくよく振り返ると、GeForce RTX 3090 Tiは2022年3月発売、GeForce RTX 4090は2022年10月発売と7カ月差しかない。「3090 Tiを買ったから、4090をスキップした」という人には、今回の5090はまさに“買い時”なのかもしれない。


FF14ベンチマーク


 続いて、実際のゲームタイトルをベースとするベンチマークテストアプリを使ってパフォーマンスをチェックしてみよう。


 現在は既に軽量なゲームに分類され、またベンチマークソフトとしても旧バージョンとなるが、今回は過去のテスト結果と比較するために「ファイナルファンタジーXIV : 暁月のフィナーレ ベンチマーク(FF14ベンチマーク)」を最高画質のプリセットでフルHD(1920×1080ピクセル)/WQHD(2560×1440ピクセル)/4Kの3つの解像度でスコアを測った。結果は以下の通りだ。


・フルHD


・GeForce RTX 5090:3万864ポイント


・GeForce RTX 4090:3万6524ポイント


・GeForce RTX 4080 SUPER:3万9402ポイント


・GeForce RTX 3090 Ti:2万9868ポイント


WQHD


・GeForce RTX 5090:3万1533ポイント


・GeForce RTX 4090:3万4084ポイント


・GeForce RTX 4080 SUPER:3万4457ポイント


・GeForce RTX 3090 Ti:2万4851ポイント


4K


・GeForce RTX 5090:2万6618ポイント


・GeForce RTX 4090:2万4796ポイント


・GeForce RTX 4080 SUPER:2万2292ポイント


・GeForce RTX 3090 Ti:1万7951ポイント


 少し不思議なことが起こった。5090のスコアが非常に高いことは間違いないのだが、4K以外の解像度で4090を下回ってしまったのだ。気のせいかと思って何度か計測し直したのだが、結果は変わらなかった(掲載したスコアは最良のものを取っている)。


 ここで“心当たり”があるとすると、ずばりCPUだ。以前、筆者はアンロック版のCore Ultra 200Sプロセッサのテストを実施した。その際はGPUをそろえて試したのだが、一部のテストで過去世代のCPUに“負ける”という事案が発生した。Intelはこの事象を認識しており、パフォーマンスを改善する取り組みを実施してたのだが、一部で「まだ改善が不十分」との指摘も見受けられる。


 ただ、4K解像度ではしっかりとトップに立っていることを踏まえると、CPUもGPUも負荷が高まると性能が出せるともいえるかもしれない。この辺は、CPU(Core Ultra 7 275K)/GPU(GeForce RTX 5090)共にもう少し様子見が必要そうである。


高負荷グラフィックス×DLSS 4のパフォーマンスは?


 GeForce RTX 50シリーズにおいて、特にゲームシーンで利用したい機能といえばDLSS 4だろう。


 これまでのGeForce RTXシリーズでも、DLSSの恩恵は大きかった。ワンランク上の解像度のディスプレイと組み合わせた際に、重量級のゲームタイトルであっても十分に遊ぶことのできるフレームレートを実現する「PCゲームの救世主」ともいえる。


 そこで今回、NVIDIAから提供された3DMarkの「DLSS 4 Feature Test」と、「Cyberpunk 2077」のDLSS 4対応版(共にβ版)を使い、GeForce RTX 5090におけるDLSS 4の“威力”をチェックしてみよう。なお、このパートのテストはGeForce RTX 5090でのみ実施している。


【3DMark DLSS 4 Feature Test】


 3DMarkのDLSS 4 Feature Testは、Port Royalをベースとしたベンチマークテストで、4K出力を前提に「2倍」「3倍」「4倍」のアップスケール時の平均フレームレートをを計測できる。当然、倍率は低いほどネイティブ解像度(実際の描画解像度)に近づくので、負荷は大きくなる。


 オリジナルのPort Royalと、超解像利用時の平均フレームレートは以下の通りだ。


・Port Royal(等倍):154.74fps


・拡大率2倍:246.06fps


・拡大率3倍:339.73fps


・拡大率4倍:416.16fps


 ある程度“決め打ち”のシナリオでのテストとなるため、「DLSS 4の効果は大きい!」と結論付けられる結果になるのは、ある意味で当然だ。ただ、拡大率4倍(フルHD→4K)のアップスケーリングだと平均400fpsを超えるのは驚きだ。さすがに、ここまでの表示スペックを備えるディスプレイはまだない。


 ある意味で、GeForce RTX 5090はまだ見ぬ4K/400Hz超のディスプレイを待っている状況といえるのかもしれない。


【Cyberpunk 2077 with DLSS 4】


 Cyberpunk 2077では画質設定を「レイトレーシング:オーバードライブ」とした上で、フルHD/WQHD/4Kの3解像度で出力した際の平均フレームレートを計測した。


 現行最新アプリ(DLSS 3まで対応)では「DLSSオフ(ネイティブ解像度)」と「DLSSオン(=DLSS 3相当)」を、DLSS 4に対応するβアプリでは「DLSSオン(=DLSS 4相当)」の拡大率「2倍」「3倍」「4倍」でチェックを行った。現行最新アプリではフレーム生成を、βアプリではマルチフレーム生成を有効化している。


 平均フレームレートは以下の通りだ。


・フルHD


・DLSSオフ(等倍):94.52fps


・DLSS 3 オン:224.81fps


・DLSS 4 オン/拡大率2倍:223.34.3fps


・DLSS 4 オン/拡大率3倍:338.05fps


・DLSS 4 オン/拡大率4倍:434.35fps


WQHD


・DLSSオフ(等倍):62.57fps


・DLSS 3 オン:194.19fps


・DLSS 4 オン/拡大率2倍:200.52fps


・DLSS 4 オン/拡大率3倍:285.92fps


・DLSS 4 オン/拡大率4倍:365.02fps


4K


・DLSSオフ(等倍):32.38fps


・DLSS 3 オン:145.01fps


・DLSS 4 オン/拡大率2倍:153.88fps


・DLSS 4 オン/拡大率3倍:219.37fps


・DLSS 4 オン/拡大率4倍:277.53fps


 倍率が上がれば上がるほど、DLSS 4の効果はてきめんだ。DLSS 3と比べると、超解像の品質も良くなっている。ただ、4倍にすると、さすがにじっと見た時に「ああ、引き延ばしているな……」と分かってしまう。


 もっとも、引き延ばしはプレイに影響するレベルで(≒プレイを中断する程度に)凝視をしないと分からないレベルなので、よほど画面表示を気に掛ける人でもない限り拡大率を3〜4倍にプレイすると快適になるだろう。


 なお、テストの本旨とは異なるが、DLSSをオフにしてもフレームレートはそこそこ高い。「平均で30fps出ればプレイはできる」と考えると、“超”高負荷なレイトレーシング:オーバードライブ設定でも4Kネイティブで平均30fpsを超えるGeForce RTX 5090ってすごいGPUだな、と思う次第である。


 GPUの使い道はゲームだけではない。仕様の際にも触れたように、動画編集などクリエイター向けの作業でも高速なGPUがあった方が快適になるシーンは多い。


 簡単ではあるが、クリエイター向けアプリケーションでのパフォーマンスのチェックも実施したので、その結果も見ていこう。


Blender Benchmark


 まず、2D/3Dアニメーション製作ツール「Blender」をベースとしたベンチマークテストアプリ「Blender Benchmark」のWindows版を用いて、パフォーマンスの比較を行った。今回は「Monster」「Junkshop」「Classroom」の3つのシナリオにおいて、1分間当たりの生成サンプル(オブジェクト)数を計測した。結果は以下の通りだ。


・Monster


・GeForce RTX 5090:7158.741924個


・GeForce RTX 4090:6362.262159個


・GeForce RTX 4080 SUPER:4501.148281個


・GeForce RTX 3090 Ti:3170.575989個


Junkshop


・GeForce RTX 5090:3850.060831個


・GeForce RTX 4090:2956.122639個


・GeForce RTX 4080 SUPER:2129.966019個


・GeForce RTX 3090 Ti:1803.310914個


Classroom


・GeForce RTX 5090:3588.898376個


・GeForce RTX 4090:2979.535322個


・GeForce RTX 4080 SUPER:2177.976374個


・GeForce RTX 3090 Ti:1560.694279個


 ただでさえ強かったGeForce RTX 4090よりも、多くのオブジェクトを生成できている。GeForce RTX 3090 Ti比では2倍超だ。コンシューマー向けGPUにおいて、最も作業効率の良いアニメーション制作環境を整えたいなら、GeForce RTX 5090はピッタリといえる。


Adobe Premiere Pro(4K動画書き出し)


 続けて「Adobe Premierer Pro」を使って、4K動画のエンコードに要する時間を比較してみよう。今回は「GoPro HERO 10」で撮影した数本の4K動画を30分ほどにまとめて書き出すのに要した時間をまとめた。結果は以下の通りだ。


・GeForce RTX 5090:5分44秒


・GeForce RTX 4090:7分18秒


・GeForce RTX 4080 SUPER:7分6秒


・GeForce RTX 3090 Ti:9分30秒


 GeForce RTX 4090で「すごい、早く(速く)なった!」と感動していたところ、GeForce RTX 5090はさらに早くなっている。エンコーダーの世代が上がっただけでなく、基数が2基から3基に増えたこと、そしてメモリ帯域が広くなったことが奏功しているものと思われる。


 動画の書き出し中は、編集アプリで別の作業を行えない。編集する動画が多ければ多いほど、次の動画の編集までの待ちが短くなるのは作業効率を重視するパワーユーザーには魅力的に映るはずだ。


●まとめ


 今回、GeForce RTX 5090 Founders Editionのテストは期間が短く、テストできた項目が少なめとなってしまった。しかし、それでも前世代を上回る性能はしっかりと確認できた。


 コンシューマー向け製品としてはやはりゲームでの利用が中心になるとは思うが、重量級のゲームタイトルを4K解像度で“ネイティブ”でも30〜60fpsで動かせるパワーは尋常ではない。


 目玉であるDLSS 4の効果も大きく、今後さらに重量級のゲームタイトルが出てきたときも、対応していればという条件こそついてくるものの、動かない/動作に不満が出るといったことは、まずないだろう。


 ゲーミングだけでなく、クリエイターにとっても作業の生産性が確実に向上するパフォーマンスを備えている。エンコードやレンダリングに待っている時間がもったいないと考えるクリエイターであれば、初期投資としては高いものの、あっという間に元が取れるだけの成果も得られるのではないだろうか。


 なお、気になる消費電力だが、アイドル時こそシステム全体で85Wと、従来製品とそう差はないのだが、3DMarkのTime Spy Extremeの実行した際のピーク時で778Wまで上昇することが確認できた。システム全体で1000Wの電源を推奨するのは“だて”ではない。


 このGPUの性能を引き出すには、CPUの性能も高い方が良い。そうなると、電源の容量はもちろんだが、PC内のエアフローも十分に考慮しなければならない。GeForce RTX 5090 Founders Editionは2スロット厚でコンパクトなのだが、GPUに負荷が掛かるとカード上部から吹き出される熱はそれなりに高い。


 サードパーティー製カードはより大きくファンも多いとはいえ、トータルの排熱量はそれほど変わらないと思われる。とにかく本体(ケース)内に熱ををこもらせないためにはどうしたらいいのかという観点は必須だろう。


 GeForce RTX 5090は、価格だけでなくシステム構成までも考えると、導入の障壁も”高い”GPUだ。だが、異次元ともいえる高い性能からしか得られない体験や、生産性の向上を目的とするのであれば、憧れではなく真剣に導入を検討する価値はある。



    ランキングIT・インターネット

    前日のランキングへ

    ニュース設定