「こんなハズでは……」 理論性能は良いのにベンチマークスコアが奮わない? 「モンスターハンターワイルズ」にピッタリなGPUの選び方

0

2025年02月18日 17:21  ITmedia PC USER

  • チェックする
  • つぶやく
  • 日記を書く

ITmedia PC USER

「モンスターハンターワイルズ」のPC版は意外と重たい?

 最近の大作PCゲーム(いわゆる「AAAタイトル」)では、理論性能が高いGPUを備えるPCでも、想定通りのパフォーマンスが出ないことが多い。逆に、タイトルによっては理論性能がそこそこなのにパフォーマンスが良好なこともある。


【その他の画像】


 最近であれば、カプコンがSteam経由で配信を開始した「モンスターハンターワイルズ ベンチマーク」が、このような事象の“好例”となっている。いいスペックのGPUを用意したのに、どうしてこうなるのか――特にPCゲーミング初心者は、「なんでこうなるの?」と頭を抱え込んでしまうかもしれない。


 そこで2回に分けて、このような現象が起こる“理由”を解説した上で、「2025年に快適なPCゲーミングライフを送るためのGPUの選び方」を伝授していく。今回は解説編だ。


●「Radeon RX 7600」よりも「PS5 Pro」のGPUの方が強い?


 2024年11月に発売されたソニー・インタラクティブエンタテインメント(SIE)の新型据え置きゲーム機「PlayStation 5 Pro(PS5 Pro)」では、APU(GPU統合型CPU)に搭載されたGPUコアのピーク時の処理(演算)性能が16.7TFLOPSと公表された。


 発表時、世間ではこの性能に近いPC向けGPUに注目が集まった。PS5 ProのAPUを供給するAMDでいえば、「Radeon RX 7600」(22TFLOPS)、あるいは「Radeon RX 7600 XT」(23TFLOPS)がほぼ同等スペックということである。NVIDIAであれば、「GeForce RTX 4060」(15TFLOPS)や「GeForce RTX 4060 Ti」(22TFLOPS)あたりということになるだろう。


 そうした世間の関心を検証すべく、筆者は別のメディアに対して「Windows(OS)代込みで、PS5 Proと同じくらいの予算(=12万円)で買えるゲーミングPCの自作」という記事を提案し、実際に掲載された。製作の模様はYouTubeにも掲載している。


 この「12万円自作PC」の主なスペックは以下の通りで、理論的にはPS5 Proよりも性能は良いはずである。


・CPU:Ryzen 7 5700X(8コア16スレッド)


・GPU:Radeon RX 7600


・メモリ:16GB×2(DDR4-3200 UDIMM)


・ストレージ:Crutial P3 Plus 1TB(PCI Express 4.0接続)


 WindowsとPlayStation 5(PS5)の両方にリリースされていて、かつPS5 Proに最適化されている「PS5 Pro Enhanced」指定タイトルでもある「ゴッド・オブ・ウォー ラグナロク」と「Horizon Forbidden West」の2タイトルを用いて両者のパフォーマンスを比較してみると、興味深いことが起こった。


 自作PC(Radeon RX 7600)では、グラフィックス関連設定オプションを「中」品質設定として、AMDの超解像技術「FSR(FidelityFX Super Resolution) 3」を有効化すると、、4K(3840×2160ピクセル)解像度でフレームレートは15〜20fps程度となる。フルHD(1920×1080ピクセル)にすると、40〜60fpsまで向上するといった感じだ。


 一方、PS5 ProではSIEの超解像処理「PSSR(PlayStation Spectral Super Resolution)」が有効な状態において、シーンによっては50fps程度まで落ち込むものの、ほぼ4K/60fpsを維持できていた。


 繰り返すが、理論上の性能は自作PCの方が上だ。しかし、実際に動かすとPS5 Proが“圧勝”するのである。


●今話題の「モンスターハンターワイルズ」もPS5 Proの方が有利?


 さらに、WindowsとPS5に提供されていた「モンスターハンターワイルズ」のβテスト版でも検証した。2024年11月初旬にリリースされたβ版は、時期が時期ということもあってかPS5 Proに対する最適化が行われていなかった。


 この状態でも、PS5/PS5 Proの両方において、高品質なグラフィックスにそこそこのフレームレートで楽しめた。PS5 Proでは最適化未了、つまりPSSRが使えないのにPS5比で20%ほど高いフレームレートだった。この際の様子は、YouTubeに動画として公開しているので参照してほしい。


 「じゃあPCではどうなんだ?」というところだが、12万円自作PCに組み込んだRadeon RX 7600では、グラフィックス品質プリセットのうち「最低」と「低」しか選べなかった。低設定の場合、FSR3を適用するとフルHD解像度なら60fpsを維持することができ、WQHD(2560×1440ピクセル)解像度だとほぼ60fps(シーンによっては50fps程度まで落ち込む)といった具合だ。


 このことを踏まえて、1世代古いものの理論性能的にはRadeon RX 7600とほぼ同等な「Radeon RX 6800 XT」(21TFLOPS)を同じPCに装着して試してみた。こちらは最上級のプリセット「ウルトラ」を選択可能で、ウルトラ設定でFSR3を適用することで4K解像度においてほぼ60fpsを維持できた(シーンによっては50fps程度まで落ち込む)。


 以下のスクリーンショットは、それぞれRadeon RX 7600とRadeon RX 6800 XTで実行したモンスターハンターワイルズ(β版)のものだ。見れば分かるが、低設定の画質は残念すぎる。


 ここまで見ると、いろいろと疑問が湧いてくるはずだ。次のページでは、その疑問に答えていく。


●ピーク性能がほぼ同じGPUでパフォーマンス差が出るのはなぜ?


 PC初心者、あるいは近代ゲームグラフィックスの仕組みに詳しくないゲームファンは、ここまでの結果を見ると以下の2つの疑問を思い浮かべるではないだろうか。


1. (プラットフォームが違うのはさておき)理論性能では勝るはずのRadeon RX 7600が、PS5(10TFLOPS)やPS5 Proと比べて描画品質が低いのはなぜか?


2. 同じゲームタイトルなのに、理論性能がほぼ同等のRadeon RX 7600とRadeon RX 6800 XTで、なぜ描画品質に差が出てしまうのか?


 答えは案外シンプルだったりする。グラフィックスメモリの“差”だ。いくら演算性能に勝るGPUを搭載したとしても、グラフィックスメモリに差があると、グラフィックス品質における「下克上」が生じてしまう。


 ということで、現代のゲームグラフィックスではTFLOPSで表されるGPUそのものの性能よりも、グラフィックスメモリを重視すべき……なのだが、グラフィックスメモリで重視すべき“差”とは何なのだろうか。それを知るには、現代におけるゲームグラフィックスのアーキテクチャをひもとく必要がある。


グラフィックスメモリの容量と帯域を大量に消費する要素は何?


 前提として、近代のゲームグラフィックスは、グラフィックスメモリの容量を大量に消費し、さらにグラフィックスメモリの帯域をえげつなく消費する。


 グラフィックスメモリは、その名の通りGPUが使うメモリだ。その容量は、「8GB」「12GB」「16GB」といった具合で、グラフィックスカードのパッケージにも大きく書いてある。メーカーによっては、カードの型番に容量を示す数値が含まれていることもある。


 「グラフィックスメモリ」はGPUに直結されている。CPUに直結している「メインメモリ」とは別物で、最近ではGDDR6/GDDR6X/GDDR7といった規格を採用している(Gは「グラフィックス」を表す)。


 そしてグラフィックスメモリの「帯域」は、簡単にいうとGPUとグラフィックスメモリが1秒間にやりとりできるデータ量を表す。当然、数値が大きければ大きいほど、大きなデータを短時間でやりとりできるということになる。


決定的な要素1:レイトレーシング


 近代ゲームグラフィックスが、大容量のグラフィックスメモリを消費し、帯域の消費も大きくなってきた――そう聞くと「4K解像度が主流になったから?」「3Dモデルを構成するポリゴン数が多くなったから?」といった理由が直感的に思い浮かびそうだ。確かにこれらも一因なのだが、もっと“決定的な”要因がある。


 その1つは「レイトレーシング(レイトレ)への対応」だ。レイトレを行うためには、レイトレ専用のシーン構造体として「BVH(Bounding Volume Hierarchy)」を構築する必要がある。BVHのディスプレイサイズは「どの程度の大きさで、どの程度の複雑性をもってシーンを描画するか」によって変わるが、屋内シーンでも数十MB、屋外の広大なシーンだと数百MB〜数GBに達する。


 ちなみに、BVHは「レイトレ専用の構造体」として、「レイトレを使わず、通常描画するために準備した3Dシーンの構造データ」とは別に用意しなければならない。別に用意しないといけないとなれば、そりゃあメモリ容量を“浪費”するわけである。


 「レイトレは演算の負荷が重い」というイメージがあると思うし、確かにその通りなのだが、レイトレの実務を担当する「レイトレーシングユニット(RTU)」自体は、それほど複雑な幾何学演算をしているわけでもない。実は、レイトレ処理においても、実際の各種陰影計算(ライティング/シェーディング/テクスチャリング)は以前のGPUから搭載されていた「プログラマブルシェーダーユニット」に外注されているのだ。


 そうなると「RTUの最も負荷が大きい仕事は何?」という疑問が生じる。


 近代GPUのRTUは、大きく「レイの生成」「レイの推進」「レイの交差判定」の3つを担っている。これらのうち、先述したBVH構造体の中でレイを進ませるレイの推進処理と、BVHの中を進むレイがどのポリゴンと衝突したかを判断する交差判定は、事実上グラフィックスメモリ内のBVH構造体に対する探索動作と等しい。


 これは要するに、グラフィックスメモリ内のデータをひたすら読み込みまくるという挙動となる。レイが反射したり分散したりすれば、当然データへのアクセス頻度は上がる。そしてレイが散らばれば、アクセスに対するキャッシュは効きにくくなり、ランダムアクセスを強いられる。


 そしてレイトレ処理の対象となる3Dオブジェクトが動いたり、消滅したり、はたまた新たな3Dオブジェクトが登場したりすれば、BVH構造体を更新しなければならない。そう、今度はグラフィックスメモリーへの書き込み処理のラッシュが発生する。


 GPUのグラフィックスメモリへのアクセス頻度は、「レイトレオフ」の時と「レイトレオン」の時とでは、全く違った状況になっているのだ。


決定的な要素2:物理ベースレンダリングとテクスチャーマップ


 そして、グラフィックスメモリの容量と帯域を消費する要素の2つ目だ。


 近代ゲームグラフィックスでは、材質表現を「物理ベースレンダリング(PBR:Physically-based Rendering)」で実践している。このレンダリング手法こそが、グラフィックスメモリの容量をかなり消費するものだ。具体的にいえば「PBRテクスチャーマップ」だ。


 PBRとは、各材質の屈折率/反射率/吸収率/散乱率/透過率といった光学的なパラメーターを、現実世界に実在する材質と合わせる前提のレンダリング技術となる。加えて、ライティングやシェーディングといった各種処理系も「エネルギー保存の法則」に従って行うことを前提とする。


 具体的に例を挙げると、「量として100の光」がある材質にやってきた場合、先述した屈折/反射/吸収/散乱/透過といった現象で方々に散っていった光の総和は“100”にならないといけない。


 PBRは「リアリティーの追求」を第一の目標としているが、副次的恩恵として「描画結果が不自然にならない」という特性も得られる。端的にいえば現実世界と同じ照明結果が得られるということだ。そして現実世界にあるカメラ/照明/光学機器に関する技術や知見をそのまま応用できることも、PBRの大きな利点として挙げられる。


 この技術自体は「プレイステーション3」世代の後期からゲームグラフィックスに導入され始め、「プレイステーション4」世代になる多くのゲームグラフィックスで実践されるようになった。今でも、ごくありふれた技術として浸透している。


 さて、PBRでは1つの材質ごとに複数枚のPBRテクスチャーマップが必要となる。テクスチャーマップというと、今でも「ポリゴンに貼り付けるステッカー画像」のようなものをイメージする人は多いとは思うが、PBRテクスチャはいわば「2次元空間に展開された数値パラメーター(2次元配列データ)」というイメージの方が正確だ。


 またPBRテクスチャーは、1つの材質につき「ベースカラー(アルベド)」「法線(微細な起伏の面の向き分布)」「メタリック(金属性)」「ラフネス(粗さ)」「アンビエントオクルージョン(自己遮蔽(しゃへい)性)」「ハイト(微細な起伏の高低分布)」など、複数枚のマップが必要になる。


 もちろん、テクスチャーマップ群は「BC3」「BC7」といった不可逆圧縮技術によって、元容量の約25%以下に圧縮されてはいる。また、ゲーム進行に応じてSSD/HDDなどのストレージから必要分だけをメモリに読み出す、いわゆる「テクスチャストリーミング」技術を活用することも多い。


 しかし、特にオープンワールド系ゲームにありがちな広大なシーンでは、登場する材質やオブジェクトが膨大なので、グラフィックスメモリ上に常駐“させられる”PBRテクスチャの容量は相応に巨大だ。今やPBRテクスチャだけで数GBのグラフィックスメモリを使うゲームは珍しくない。


 そして、実際の描画処理では、画面上の描画対象ピクセルを描画する際に、その都度、複数枚からなるPBRテクスチャーマップにアクセスし、複数のPBRパラメーターを使って、描画対象ピクセルが何色になるのかを演算している(これを「ライティングシェーディング」という)。1ピクセル描画する度に、PBRテクスチャーへのアクセスが発生する――これはすなわちグラフィックスメモリへのアクセスに他ならない。


 もちろん、一連の処理をスムーズにこなすには、グラフィックスメモリに“圧倒的な”帯域が必要となる。


決定的な要素3:さまざまな「中間バッファー」の生成


 近代ゲームグラフィックスでは、不可視な「中間バッファー」の生成数が多いことも見逃せない。これこそが、グラフィックスメモリの容量と帯域を消費する3つ目の要素だ。


 「不可視」というだけあって、この中間バッファは画面には表れない。しかし、最終的な映像を作り上げるためには欠かせない。いわば「メモ書き」「計算用紙」的な役割を果たす、一時的なデータなのだ。


 その一例として「シャドウマップ」がある。これは、影の生成に用いる、シーンの遮蔽構造を書きためておく不可視な中間バッファーだ。これを生成するためには、シーン内の各動的光源の位置から、光の照射方向に向かって「その3Dシーンの深度情報」をGPUに描画させる必要がある。


 イメージ的には、3Dシーン内の各動的光源位置から、自動運転技術に用いられる「LiDAR(Light Detection and Ranging)センサー」の出力画像のようなものを描画させるといった感じだ。シャドウマップの描画は影を出力したい動的光源の数だけ必要なので、光源の数に比例してグラフィックスメモリの容量を消費する。


 そして影生成の際には、このシャドウマップにアクセスして、描画対象の1ピクセル単位で「このピクセルは影になっているかどうか」を判定する。これはグラフィックスメモリーのアクセスの増加(=帯域消費)に他ならない。


 また、近代ゲームグラフィックスでは、過去フレームのバッファリングも日常茶飯事だ。過去フレームを4K解像度で複数バッファリングすることだってあり得る。いうまでもなく、画面に表示した映像フレームを複数保持することはグラフィックスメモリの容量を消費する。


 そして、過去フレームと現在フレームのポリゴン位置の推移から、1ピクセル単位の速度情報(速度ベクトル)を描画した「ベロシティーバッファ」を生成するのも当たり前だ。この生成にはグラフィックスメモリの帯域を消費するし、バッファ分のメモリ容量も必要だ。


 このベロシティーバッファにアクセスして、1ピクセル単位の「速度ベクトル」を取り出して、その速度ベクトルの逆方向に対応する過去フレームにアクセスしてモーションブラー効果を描画したり、アンチエイリアス処理や超解像処理を行ったり、その他のポストエフェクト処理を行ったり……と、これらの処理は全てグラフィックスメモリの帯域を大きく消費する。


 ゲームタイトルによっては、「半透明パーティクル描画用バッファ」を生成する場合もあるし、霧や煙のようなオブジェクトをボリュメトリックレンダリングするために「三次元バッファ」(イメージ的には3次元配列で「3Dテクスチャ」とも呼ばれる)を確保して、このバッファに煙や煙の密度値をGPUを使って描画することもある。これはグラフィックスメモリの容量を消費する。


 3Dバッファに書き込まれた密度値から煙や霧を描画するには、3Dバッファに対してレイマーチングを使って可視化する必要がある。これはグラフィックスメモリの帯域を消費する。


 これらの「中間バッファ」の描画解像度は用途に応じてさまざまで、GPUの負荷低減やグラフィックスメモリの帯域/容量を節約するために、本来の解像度の4分の1に抑えるという話もよくある。


 仮に4K解像度で中間バッファを持つとしても、1枚当たりの容量はせいぜい数十MBだが、その数が多くなれば数百MB、気が付いたら数GBになっていた――なんていうことも、珍しくはない。


 結局のところ、これらの中間バッファ生成はグラフィックスメモリの容量と帯域の消費を意味し、中間バッファへのアクセスもグラフィックスメモリの読み書き(=帯域消費)となる。


●実は描画品質を左右するグラフィックスメモリの「容量」と「帯域幅」


 ここまでグラフィックスメモリの容量と帯域の重要性を長ったらしく説明してきたわけだが、とどのつまり、PCでAAAタイトルを“それなりのクオリティー”でプレイするにはグラフィックスメモリの「容量」と「帯域」にも目を向けないといけないということだ。


 話を戻して、PS5/PS5 ProとRadeon RX 6900 XT/7600の描画品質の“差”をグラフィックスメモリの帯域幅という観点で考察してみたい。


 先述の通り、GPU自体の理論性能ではRadeon RX 7600はPS5 Proの約30%増しだ。しかし、グラフィックスメモリ(※1)の帯域幅を比べると以下の通りとなる。


・Radeon RX 7600:最大毎秒288GB


・PS5 Pro:最大毎秒573.4GB


(※1)PS5 Pro(とPS5)では、グラフィックスメモリをメインメモリとしても利用している(メインメモリをグラフィックスメモリと兼用するPCのGPU内蔵型CPUとは逆の発想)


 先述の通り、現代のゲームグラフィックスでは、GPUが猛烈な頻度でグラフィックスメモリにアクセスしている。「TFLOPS」で表される理論性能値は、あくまでもGPUの演算性能“のみ”を示す値だ。確かにRadeon RX 7600の方が演算そのものは高速でも、演算の結果を書き出す性能と、データを読み出す性能がPS5 Proはおろか、PS5にも全く及ばないのだ。


 もしかすると、Radeon RX 7600はメモリの帯域不足のせいで22TFLOPSの性能を生かし切れていないかもしれない。逆にいえば、PS5やPS5 Proはグラフィックスメモリへのアクセスが高速なおかげで、性能を極限まで引き出せているということなのだろう。


 PS5 Proは、Radeon RX 7600のほぼ2倍のメモリ帯域幅を確保している。これは、PC向けの超ハイエンドGPU級だ。Proの付かないPS5でも、グラフィックスメモリの帯域幅は毎秒448GBとなっており、Radeon RX 7600はその64%分の幅しかない。


 クルマに例えると、「エンジンの馬力はあるが、エコタイヤを履いている状態」だ。エコタイヤはグリップ力を低めに設定しているため、馬力のあるエンジンを搭載するクルマと組み合わせても、そのパワーを生かすことはできない。その点、PS5 Proは「ハイグリップタイプのスポーツタイヤを履いて、エンジンの馬力を余すところなく引き出せる状態」ということになる。


 そしてRadeon RX 6800 XTは、Radeon RX 7600と比べるとGPUの理論性能はほぼ同じだがグラフィックスメモリの帯域幅が約1.8倍の毎秒512GBと高速だ。理論性能がほぼ同じなら、グラフィックスメモリの帯域幅の差が最終的な性能差を生む。そしてPS5 ProやPS5のように、グラフィックスメモリの帯域性能が優れていれば理論性能の差を“逆転”できるということでもある。


 筆者はかなり古参のPCゲーミングファンで、今でもグラフィックスクオリティー設定をあれこれいじりながらAAAタイトルを中心にプレイしている。そんな筆者から見ると、2025年以降のAAAタイトルをフルHD解像度を超える解像度(WQHD/4K解像度)で“満足に”プレイするには、グラフィックスメモリの帯域幅を少なくとも毎秒400GBは必要だと考える。できればPS5の毎秒448GBを上回る、毎秒500GBは欲しい。


 GPUの理論性能やグラフィックスメモリの容量は覚えていても、グラフィックスメモリの“帯域幅”まで覚えているという人は恐らく少ないだろう。帯域幅の情報はGPUやグラフィックスカードのメーカーのWebサイトに掲載されているので、改めて確認してみてほしい。


●グラフィックスメモリの「容量」はどのくらいが理想?


 グラフィックスメモリは帯域幅はもちろん容量も重要だ。では、今どきのゲームを楽しむには、どのくらいの容量があればいいのだろうか。


 先述の通り、モンスターハンターワイルズのβ版ではRadeon RX 7600は画質プリセットで「最低」と「低」しか選べなかった。厳密にいうと、「低」よりも高いプリセットを全く選べないわけではなく、グラフィックス関連設定も細かく設定できる。しかし、「グラフィックスメモリ消費予測ゲージ」の警告が出てしまう。


 この警告を無視してより高いグラフィックス設定を選ぶと、容量不足でグラフィックスメモリに格納できないデータ群はメインメモリに格納される。そうなると“か細い”PCI Expressバスを通してメインメモリとグラフィックスメモリとの間でデータの出し入れが頻繁に発生するため、ゲームのパフォーマンスは著しく低下する。


 ゲームのグラフィックス設定で「グラフィックスメモリが足りない」旨の警告が出た場合は、容量不足にならないように素直に設定を下げた方が良い。端的にいうと、モンスターハンターワイルズのβ版にとって、Radeon RX 7600はグラフィックスメモリの容量不足ということになる。


 ちなみに、このβ版ではグラフィックスメモリが12GBのGPUだと画質プリセットで「中」「高」を警告なしで選べた。16GBになれば「最高」も余裕だ。


 デスクトップPCの場合、ごく一部の例外を除くとメインメモリは増設/換装が可能だ。しかし、GPUのグラフィックスメモリは増設/換装ができないため、購入段階の容量で“打ち止め”となる。そのため、搭載しているグラフィックスメモリの容量選びも重要な要素といえる。


 ちなみに、PS5は16GBのGDDR6メモリをCPUとGPUで共有するシステムで、そのうちの最大13GB程度をゲームで利用可能とされている。ゲームプログラムのランタイム自体は、通常それほど大きくはないので、多くのゲームでは容量の多くをグラフィックスに割いているはずだ。Windows版のβテストの手応えからすれば、モンスターハンターワイルズのような情報量(≒リアリティ)重視型の“美麗グラフィックス”のタイトルなら8GB以上(ともすると10GB前後)をグラフィックスに割り振っていると思われる。


 PS5 Proでは、16GBのGDDR6メモリに加えて2GBのDDR5メモリも搭載している。単純計算だが、CPU側で実践する処理をDDR5メモリ側に振ってしまえば、さらに2GBをグラフィックスに割けるだろう。


 数年前なら、PC向けGPUにおいて「8GB」というグラフィックスメモリ容量は標準サイズだったが、そろそろ、その常識は変わりつつあるのかもしれない。


 「なら、どのくらいの容量が必要なの?」というところだが、筆者が2024年にプレイした「黒神話・悟空」のPC版でも、8GBのグラフィックスメモリでは満足の行くクオリティーでプレイできなかった。この点は、モンスターハンターワイルズと通ずるものがある。


 黒神話・悟空は2024年を代表するタイトルの1つで、先に引き合いに出したモンスターハンターワイルズも、注目度からすると2025年を代表するタイトルの1つとなるはずだ。これらの重量級AAAタイトルを、標準以上のプリセット画質でプレイするには少なくとも12GBのグラフィックスメモリを備えるGPUがあった方が安心だ。


 今後のゲームにおいて、グラフィックスメモリの消費量は増えることはあっても減ることはないと思う。これからグラフィックスカード(GPU)を買い替えるという人は、16GBメモリでも多すぎることはないと考える。


 次回は、本稿を踏まえて「具体的にどのGPUを選べばいいか?」を解説していきたい。



    ランキングIT・インターネット

    前日のランキングへ

    ニュース設定