M4 Maxチップ搭載「16インチMacBook Pro」の実力をチェック 誰に勧めるべきモデルなのか?

0

2024年12月06日 12:51  ITmedia PC USER

  • チェックする
  • つぶやく
  • 日記を書く

ITmedia PC USER

16コアM4 Maxチップ搭載の16インチMacBook Pro(左端)を交えて、M4ファミリー搭載Mac(と一部過去モデル)のパフォーマンスを改めてチェック!

 発売から少し時間が経過してしまったが、16コアM4 Maxチップを備える「16インチMacBook Pro」(128GBメモリ)を借りてテストする機会を得た。


【その他の画像】


 連載では既にM4/M4 Proチップを搭載する新型Macの実力をチェックしたが、いよいよ最新Apple Siliconの(現時点における)最高峰モデルの実力を見ていきたい。


 なお、今回は以下のMacとパフォーマンスを比較している。


・Mac Studio(24コアM2 Ultraチップ/128GBメモリ)


・14インチMacBook Pro(12コアM3 Proチップ/36GBメモリ)


・14インチMacBook Pro(14コアM4 Proチップ/64GBメモリ)


・16インチMacBook Pro(16コアM3 Maxチップ/128GBメモリ)


・iMac(10コアM4チップ/24GBメモリ)


 なお、ここから先は説明で必要な場合を除き、CPUコアの数は省いて記載する。


●性能向上が著しいM4チップファミリー


 テストの結果を細かく見る前に、全体的な概要を述べておこう。M4チップファミリーは、特にCPU性能とGPU性能の優秀さが際立っている。


 M4チップは、M3 Proチップに対してシングルコア性能を上回るだけでなく、マルチコア性能も肉薄している。「Puget Bench」を使ったAdobe Photoshopのテストでは、M3 Proチップを上回る結果を示した。


 そして今回のテストの“目玉”であるM4 Maxチップについては、「Blender Benchmark」のGPUを使ったテストにおいてM2 Ultraチップよりも高いスコアをたたき出した。M4 MaxチップのGPUコアは40基と、M2 Ultra(72基)の約56%しか搭載していないにも関わらずだ。これはメッシュシェーダーやレイトレーシング(RT)のアクセラレーターによるものと思われる。


 一方で、同種のアクセラレーターを備え、同じく40基のGPUコアを備えるM3 Maxチップに対しても、スコアが25%以上の伸びを示した。M4ファミリーはRTアクセラレーターが“第2世代”となったが、動作クロックの向上も手伝って性能が伸びたのだろう。


 NVIDIAの外部GPU「GeForce RTX 4070 Laptop」を搭載するノートPC「ASUS TUF Gaming A16(FA607PI)」と比べても、Blender Benchmarkのスコアは47.4%高い。M4 Maxチップを搭載する16インチMacBook Proが63万4800円から(48GBメモリの場合)、TUF Gaming A16(FA607PI)が直販価格で24万4800円(Ryzen 9 7845X/32GBメモリ)と価格帯が違いすぎるとはいえ、GPUのいわゆる「ワッパ」(消費電力当たりのパフォーマンス)は驚異的だ。


 しかし、M4ファミリーの長所、あるいは将来的な可能性を示唆するのは大規模言語モデル(LLM)をオンデバイスで動かす「LM Studio」でのテストだった。Apple Siliconの「GPUから共有メモリに直接アクセスできる」というメリットが遺憾なく発揮され、そこに128GBという大容量さが相まって、汎用(はんよう)的なLLMをより大きなモデルデータで稼働できるのだ。このことは3Dアニメーション制作などにおいてもメリットとなりうる。


 より大きなデータをメモリ上に置き、データや処理の特性に合わせてCPU/GPU/NPU(Neural Engine)に処理を振り分けられる――これは他のプラットフォームにはない圧倒的な優位点だ。


●「Geekbench 6」の結果


 まず定番のベンチマークテストの結果から見ていこう。まず、クロスプラットフォームのCPU/GPUベンチマークテストとして「Geekbench 6」を実施した。


 シングルコアのCPU性能向上は顕著だ。動作周波数もM2 Ultraチップからは1GHz、M3 Max/Proでも500MHz向上している効果も大きいが、M4 Maxチップ(4065ポイント)はM3 Maxチップ(3216ポイント)比で約26%、M4 Proチップ(3955ポイント)はM3 Proチップ(3192ポイント)比で約24%の性能向上を果たしている。最大クロックは1.125倍(4GHz→4.5GHz)しか上がっていないことを考えると、IPC(クロック当たりの処理可能命令数)の改善効果が大きいことがうかがえる。


 一方、マルチコアテストでは、CPUをどれだけ“動かせるか”は省電力性能にもかかっている。フルパワーを出そうにも、全コアがフル回転するとなると排熱が追いつかない可能性もあるからだ。


 スコアをコア数で割ると、M4 Maxチップは1コア当たり1667ポイントで、M2 Ultraチップ(1コア当たり911ポイント)の1.83倍となっている。この差はもちろん注目ポイントなのだが、M4ファミリー同士ではPコアとEコアの数の差がきれいにスコア差へと反映されていることも興味深い。


 より高い負荷を継続的にかけた場合にどのような結果になるかは別途評価しなければならないが、M4ファミリーは従来よりもさらに高い電力効率を備えることは間違いない。


 Proチップ同士の比較をすると、PコアとEコアのバランスが異なることもあり、M4 ProチップはM3 Proチップの約1.44倍のスコアを記録している。1世代の進化と考えると、この差は相当に大きい。先述の通り、M4チップもマルチコアスコアならM3 Proチップに迫っている。


 実用面で考えると、シングルコアスコアの上昇はアプリの応答性の向上につながる。マルチコアスコアも高くなっていることは、長時間連続しても“タレる”ことが少ないことを意味し、重負荷時における高性能の維持を期待できる。


 続けて、Geekbench 6においてGPUの演算性能をチェックするComputeテスト(Metal API)の結果を見ていこう。


 このテストは純粋に演算性能を見ることもあり、M3ファミリー以降におけるメッシュシェーダー/RTのハードウェアアクセラレーションの効果は加味されない。そのこともあってか、GPUコアがとにかく多いM2 Ultraチップは22万6458ポイントと一番高いスコアをたたき出した。


 ただ、M4ファミリーはGPUコアの数の割にはスコア面で健闘しており、M4チップとM2 Ultraを比べるとコア数の差から考えられるようなスコア差にはなっていない。


 「では、GPUに追加されたアクセラレーションを加味するとどうなるか?」ということで描画(レンダリング)が映像処理に関するテストに移ろう。


●ハードウェアアクセラレーションの差が際立つ「Blender Benchmark」


 2D/3Dグラフィックスのレンダリングパフォーマンスをチェックする「Blender Benchmark」の結果だが、先に述べた通りM3ファミリー以降に搭載されたアクセラレーター類は効果てきめんで、コア数だけが多いM2 Ultraチップは若干の置いてけぼりを食らってしまっている。


 76コアGPUを備えるM2 Ultraチップの総合スコアは、3346.26ポイントだった。それに対して、20コアGPUを備えるM4 Proチップは2547.55ポイントだ。コア数が3.8倍あるM2 Ultraチップだが、総合スコアは1.3倍しか差を付けられていない。言うまでもなく、40コアGPUのM4 Maxチップ(5222.18ポイント)には遠く及ばない。同じ40コアGPUで比べると、M3 Maxチップの総合スコアは4171.61ポイントで、わずか1世代で25.2%も性能が向上している。


 TUF Gaming A16(FA607PI)のGeForce RTX 4070 Laptopはの総合スコアは3542.35ポイントとM4 Proチップと比べると少しだけ高い。しかし、M4 Maxチップには1.5倍近い差を付けられている。はるかに大きな電力を消費することを考えれば、M4 Maxチップにも及ばない(絶対的な価格差を度外視すれば)。


ちなみにM4 MaxチップとM2 ProチップのGPUコア1基当たりのスコアを算出してみると、M4 Maxチップの130.55ポイントに対して、M4 Proは127.38ポイントとなる。ほぼ線形なスケーリング効率を示しており、いわゆる熱だれはほとんど見られない様子がうかがえる、


●「Photoshop」「DaVinci Resolve」のパフォーマンスも有意に向上


 次に、「Puget Systems Benchmark」を使って、Adobe Photoshopのパフォーマンスをチェックしていこう。


 M4 Maxチップのスコアは、M3 Maxチップ比で約22.5%、M3 Proチップ比で約21.1%向上しており、M2 Ultraチップと比べても約14.3%高い。そして興味深いことに、M4チップでもM3 Proチップのスコアを上回っている。もちろん、消費電力ははるかに低いだろう。


 PhotoshopのパフォーマンスはGPU性能と若干の相関関係があるものの、基本的にはM4チップでも各種ワークフローをこなすには十分な性能を備えている。ニューラルフィルターなど負荷の掛かる応用的処理をする場合を考えても、M4 Proチップ以上のモデルは費用対効果が低くなってしまうかもしれない。


 続けて、Puget Systems Benchmarkを使って「DaVinci Resolve」のパフォーマンスを確かめよう。


 先ほど「PhotoshopのワークフローならM4チップでも十分」と言ったが、動画編集アプリであるDaVinci Resolveのテストでは、GPUのパフォーマンス差が明らかに分かる結果となった。スコア的には、Geekbench 6のComputeテストとのスコアとの相関性は極めて高い。


 他の動画編集アプリもそうだが、より多くの画素数(より高い解像度)で多くのエフェクトを利用したり、情報の欠落が少ない画素フォーマットで編集を行ったりする場合、演算プロセッサとしてのGPUが大きな役割を果たすからだ。


 そのスコアだが、M4 MaxチップはM3 Maxチップ比で約14.8%、M4 ProチップはM3 Proチップ比で約34.4%、それぞれ向上している。M4 Maxチップについては、72基のGPUコアを備えるM2 Ultraチップに対しても10.6%ほどスコアが高くなっている。Proチップ同士のスコア差がこれだけ大きくなっているのは、メモリ帯域幅が1.75倍に広がった効果も大きいと思われる。


 プロフェッショナル用途ならM4 Maxチップが欲しくなるだろうが、4K(3840×2160ピクセル)動画の編集用途にMacを探しているのなら、M4 Proチップ搭載モデルが費用対効果の面で優れている。


 「いやいや、絶対的な性能は高い方がいい」という人であれば、M4 Maxチップが最良の選択肢だとは思うが、M4チップファミリーに限っていえば、M4 Proチップのコストパフォーマンスの良さは光るものがある。


 一方、ベースグレードのM4チップのCPU性能も、省電力性能を鑑みると大変魅力的だ。14インチMacBook ProならM4チップモデルも用意されているので、「ポートがある程度そろっているMacBook Proがいいけれど、値段がな……」とちゅうちょしていた人も、安心して選択できる。「MacBook Air」など、いまだにM3ファミリーまでの採用にとどまっている製品のアップデートにも期待が膨らむ結果といえるだろう。


●「高性能GPU×共有メモリ」でLLMのパフォーマンスは良好


 今回は「LM Studio」のパフォーマンスも検証した。LM Studioはオープンソースの大規模言語モデル(LLM)を動かすためのアプリで、いわゆるチャット型のAIアシスタントをオンデバイスで実行可能だ。


 ここではLLMの性能テストが直接の目的ではないが、比較的規模が大きく、実用性の高そうなモデルとして「Qwen2.5 Coder 32B Instruct」を使うことにした。評判の高い「Llamma 3.2」向けAIモデル「Qwen2.5」を、プログラマー向けにトレーニングしたものだ。ランタイムの実装はAppleのGPUライブラリ「Metal」を用いており、推論演算に特化したNPU「Neural Engine」は利用しない。


 LM Studioをテストに用いた理由は、M4チップファミリーを搭載する新型MacBook Proが発表されたときに、Apple自身が「このアプリの強力な開発プラットフォームになり得る」と訴求していたからだ。実際にテストをしてみると、Appleがそう主張した理由が分かった。Apple Siliconの広帯域共有メモリがLLMを稼働する際に極めて有利に働くからだ。


 テストに用いたAIモデルは、日本語の質問にはあまり良い品質の回答は得られないが、プログラミングの補助に使うのであればそこそこ使える感じだ。このモデルは320億パラメーターで、容量が17GB以上ある。


 このモデルをTUF Gaming A16(FA607PI)で動かすと、全く話にならないほど文字出力が遅い。GPU(GeForce RTX 4070 Laptop)のグラフィックスメモリが8GBしかなく、AIモデルを収納しきれないからだ。結果としてGPUには一部の処理が割り振られるだけで、大部分(今回であれば95%)がCPUに回されてしまう。


 その点、今回試したM4ファミリーのMacでは、M4チップ以外は共有メモリ内にAIモデルを格納できた。よって、GPUの性能をフルに生かすことも可能だった。結果はグラフの通りだが、「これをローカルで動かす必要があるのか」という議論はさておいて、将来的にローカルAIを実用レベルで動かせそうということはよく分かった。


 LLMをローカルで動かす利点として、より長いコンテクストに対応するための文脈を保存するためのメモリをより多く確保しやすいという利点がある。見方を少し変えると、より長いプログラム(コード)を作る際に、過去の指示履歴をより多く覚えておいてくれるということになるので、「プログラミングの補助」としてLLMをローカル稼働させることは一定のメリットがあるかもしれない。ただし、ローカルで動かすLLMがより賢く、本当に使い物になるまでは、もう少し時間がかかるだろう。


 ともあれ、今回のテスト結果を通して外付けGPUで扱いきれないサイズのデータを扱う場合は、Apple Siliconの共有メモリアーキテクチャは有利に働きやすいということがよく分かった。自身が使うアプリごとに状況は異なるが、このことは心に留めておきたい。


●「M4 Maxチップ」がもたらす価値はどこにある?


 先ほど「M4 Proチップのコストパフォーマンスの良さが際立つ」旨を述べたが、もちろんハイエンドのユースケースにおいてM4 Maxチップが有益であることは間違いない。


 アプリテストを通して見てみると、一部に思ったほどの差が出ていないように思える部分もあるかもしれないが、かなり極端な処理を行うと、テストでは表に出ない差が出ることもあることは別途把握しておくべきだろう。


 その典型例がメディアエンジンの構成だ。M4 Proチップのメディアエンジンは、ビデオエンコード/デコードエンジンとProResアクセラレータを1基ずつ備えるのに対し、M4 Maxチップではこれらを2基ずつ搭載している。


 単純計算すると、M4 MaxチップはM4 Proチップの2倍の動画処理パフォーマンスを備えていることになる。具体的には、M4 Maxチップでは4K解像度のProResビデオを最大66ストリーム、8K(7680×4320ピクセル)解像度のProResビデオを最大15ストリーム同時処理できるが、M4 Proチップでは4K解像度のProResビデオは最大37ストリーム、8K解像度のProResビデオは最大8ストリームと、同時処理数が半分程度になっている。


 メディアエンジンを完璧に使いこなすApple純正の動画編集アプリ「Final Cut Pro」を使う場合、同時処理能力差は約1.8倍とのことで、上記の性能差とほぼ一致する。このこと自体は先にテストしたDaVinci Resolveでも同様なのだが、アプリの応答速度をトータルで見てみると、そこまで大きな差は出てこない。


 M4 Proチップは研究者、開発者、エンジニア、クリエイティブプロフェッショナルなど、高度な処理能力を必要とするユーザー全般に適している。


 一方、M4 Maxチップは8K動画編集、複雑な3DCGレンダリング、大規模な機械学習モデルの学習など、極めて高負荷な作業を行うプロフェッショナルに最適な選択肢だ。



    ランキングIT・インターネット

    前日のランキングへ

    ニュース設定