ベンチマーク

Core i7-10700+Radeon RX5700の追加詳細レビュー

著者の仕事&趣味で利用するメインPCをCore i7-10700ベースで組み直してから結構時間が経ちました。その後も全く何の問題もなく使い続けられていますし、パフォーマンス面も非常に満足しています。

使っていく中で色々と追加のソフトを導入したりして、より詳細に性能面などをチェックできる環境が揃ってきました。今回はこれらを使ってCore i7-10700マシンのもう少し詳細なレポートをまとめてみます。

追加テスト内容

今回レポートする追加のテスト内容は以下の通りです。

  • 3DMarkのフィーチャーテスト
  • TMPGEnc Video Mastering Works 7による動画エンコード
  • Sandraのライト版によるメモリ性能

動画エンコードのテストではCPUの電力制限を定格と今現在、著者が常用している125W制限での性能差も見てみます。

ちなみに3DMarkはパソコン用ゲームのフレームワークであるSteam上で動作するバージョンです。ある時ふと気づいたら3DMark利用権の大安売りが行なわれていましたので、すぐにAdvanced版を入手しました。これを使ってより詳細なテストを行なっています。

TMPGEncシリーズはペガシスの手になる日本製の老舗動画編集・エンコードソフトです。

これまで一般的だったH.264形式でのエンコードと、より高画質・高効率なコーデックであるH.265形式へのエンコードで処理性能を見てみます。

AVXなどの新しい命令もすぐに対応してくれるソフトですので、CPUの実力をフルに発揮させられます。

3DMarkによる追加テスト

まずは3DMarkの追加テストからです。一応、一部テストにCPU性能も一緒に見るものがありますが、こちらのテストは基本CPUよりもGPUの性能を見るもの。著者のメインマシンの場合にはRadeon RX5700の性能を主にチェックする形になります。

Time Spy

まずはTime Spyから。
こちらはDirectX12ベースのテストになります。
無償版の3DMarkではこちらが実行されますね。

以前のレビューでも実行していますがこちらも改めて。
結果の方はこんな形になります。

スコアは8396ポイントです。

より解像度を高めて描画負荷を高めるテストも可能ですが、Radeon RX5700をチョイスするようなシステムではそこまで負荷の高いテストを行なう意味はあまりないのではないかと思います。ゲームのターゲット解像度は2,560×1,440程度が上限ではないでしょうか。

今回はフルHD解像度でのテストです。

使用したのはSteam上で動くバージョンのため、Steamのランチャーというかミドルウェアというか、間にはさまるソフトウェアが常駐した状態でのテストになります。このため厳密に見るとわずかにそちらにパワーを食われるはずです。

が、スコアの方にはほとんど影響はなかったようです。

Fire Strike

続いてFire Strike。こちらはDirectX11ベースのテストです。

数年前のGPUだとものすごく重いテストだったはずですが、今ではハイエンドとは呼べない性能のRadeon RX5700でも、解像度がフルHDならほとんどコマ落ちも感じない滑らかな動作が見られます。

なんというか、PCもここまで来たのか、的なすごい感慨があります。

もはやこのテストは独立GPUの性能限界を問うようなものではなくなっている訳です。

スコアの方はこんな感じに。
2万ポイント以上を叩き出します。

Night Raid

このテストは独立GPUではなく統合GPUの性能テストを意識した内容のものです。このため描画負荷はかなり抑えられていて、外部GPUならばエントリークラスでも楽々動かせる程度の描画負荷のはずです。

一応、実行してみましたが、スコアの方は5万ポイントを超えて実行中のフレームレートも300fpsを超える部分もあるなどかなりすごいことになります。

このテストでは光源の描写や被写界深度の表現など高度なグラフィクスは使われていませんが、3Dモデルの複雑さはかなり頑張っているように見えます。このクラスの画面を統合GPUで描画できる可能性がある、というのもなかなかにインパクトがあります。

さらに描画負荷が軽いベンチマークも用意されていますが、さすがにそこまではテストしてみてもあまり意味がないと思い、そちらは省略しています。

動画エンコード性能

次にTMPGEnc Video Mastering Works 7を使った動画エンコードの性能を見てみます。

こちらはほぼ完全にCPUの性能を見るテストになりますので、CPUの電力制限を定格と著者が普段使いしている125W設定でどの程度の違いがあるかもチェックします。

素材となるデータはゲームをWindows 10のゲームバー(GameDVR)で録画したフルHD、60fps、長さ4分56秒の動画です。これをそのままの解像度、フレームレートでH.264形式、H.265形式での2パス平均ビットレート方式でトランスコードします。

ターゲットの動画のビットレートは6Mbpsに設定しています。

まずは長時間電力制限125Wの設定から。
H.264形式だと8分56秒でエンコードが完了。

H.265形式だと16分7秒かかりました。

次に65W設定
H.264形式のエンコード完了には10分9秒。

H.265形式だと19分11秒かかっています。

125W設定だと安定して動作している最中はCPUの動作クロックが4.35GHz程度で安定。65W設定だと3.5GHzぐらいが限界でそれ以上は上げられないようです。

動画エンコード中のCPUのクロックは125W設定時の方が24%ほど上になっています。

それに対してエンコードにかかった時間の差の方はH.264形式で14%向上、H.265でも19%向上程度とCPUクロックほどの差は出ませんでした。

エンコード実行中のCPUの負荷を見てみるとH.264エンコードの方がCPUを上手く使えているものの、それでも平均85%~90%程度。H.265のほうだと70%前後とCPUを完全には使い切れていません。

CPUの処理性能部分以外のどこかに処理のボトルネックになるポイントがあるのだと思います。このあたりの関係からクロック比通りの処理時間差にはならなかったのでしょう。

この辺りの性能と消費電力の対比は判断が結構難しい所ですね。CPUだけでも60Wの消費電力増加で動画のエンコード時間は15%前後しか節約できません。

ですが職業的に動画を作りまくるユーザーでなければ動画のエンコードでCPUをフルに使う時間なんていうのはたかがしれています。また、動画のエンコード中にはGPUには負荷が基本かかりませんし、パソコンのトータルの消費電力が跳ね上がる訳でもありません。

そういった部分をどう評価するか、そこは結局はそれぞれのユーザーの考え方次第、と言うことになってしまいますね。絶対的な優劣が下せるポイントではありません。

さて、実は著者はかなり以前から動画のエンコードをお遊び的に試していました。当時から動画を「実時間」でエンコードできるのが一つの目標でした。(動画の時間、長さと同じ時間以下でエンコードできること)

今のそこそこ高性能なCPUならフルHDで毎秒30コマの動画だったら、この条件をほぼクリア可能と言うことになります。やはり単純にすごい時代になったものだと思います。

パソコンユーザーみんながこの性能を必要とする訳ではありませんが、それを求めるユーザーには確実な生産性の向上が約束されています。

ちなみにCPUのコア温度の方は高性能な冷却システムが今回のテストでも有効性を発揮してくれました。室温が30度を超える中でも電力制限125Wの設定でコア温度が75度以下に収っていましたので。

65W設定ならば60度前後。安心感の高い温度ですね。これだったら標準クーラーでもなんとか冷やしきれるかもしれません。

ちなみにGPUに内蔵されている動画のハードウェアエンコーダーを使うとCPU側で行なうソフトウェアによるエンコードの数倍の性能が出せます。ですが、画質に関してはソフトエンコードの方が未だに数段以上上。特にビットレートを低めに抑えたときの差は非常に大きいものがあります。

YouTubeなどネット動画の配信サイトに上げたいときや仲間内でネット経由で動画を共有するとき、データ量を抑えて画質を最大化したい場合にはソフトエンコードを活用したい所です。

Sandra Liteでメモリ関連の性能をチェック

CPU性能を見るベンチマークテストのメジャーなものの一つにSandraシリーズがあります。

このテストの他にはあまりない特徴としてメインメモリの帯域やキャッシュメモリの帯域・レイテンシを測る機能があります。

有償版でしかこの辺りの機能は使えないのかと思っていたのですが、無償利用可能なLite版でも測定が可能でしたので今回追加テストを行なってみました。

まずはメインメモリの帯域から。
今回の測定では34.3GB/secほどの転送速度が出ています。

著者がテストマシンで使っているメモリはDDR4-3200のもの。

メモリ側の論理的な転送速度は1チャンネルで25.6GB/sec。2チャンネル合計で51.2GB/secの帯域がありますので、論理的な最大値の67%ほどが実性能と言うことになります。

実メモリ帯域34GB/secは悪い数字ではありませんが、メモリコントローラーの性能としてはすごくいい訳でもありません。今風のマシンとしては普通、という表現が合っているのかもしれませんね。

続い転送データのサイズごとの帯域を見るテストで、こちらは概ねキャッシュメモリの性能を見ることができます。

32kBまでは2クロックのレイテンシでアクセスすることが可能なことが分ります。この範囲では転送速度は1.85TB/secに達し、1次キャッシュの高速さが見えてきます。

しかし、今の高クロック化したCPUでは、CPUに一番近い所にあるはずのメモリである1次キャッシュでもCPUと等速では動いていない訳です。

そこから先、256kBまでが2次キャッシュの範囲という測定結果になっていて、レイテンシは7クロック。さらに先、16MBぐらいまでが3次キャッシュ=ラストレベルキャッシュ(LLC)の有効範囲で19クロック程度でのアクセスが可能になっています。

その先のサイズはメインメモリに対する直接アクセスにあたり、データアクセスには83クロックもの遅れが生じます。

超高速化してしまったCPUに対しメインメモリがいかに遅いかがよく分り、そのことからキャッシュメモリがどれだけ重要な存在かが分る結果です。

キャッシュメモリがなければメインメモリからデータを取ってきたり書き込もうとしたりすれば、CPUの速度は実質1/100近くまで低下してしまうのと同義な訳ですから。

ただまあ、最新のCPUではどうしてもメインメモリにアクセスが必要になったときには、待ち時間の間、別スレッドにコンテキストを切り替えてCPU自体が遊ぶ時間を出来るだけ減らす工夫は行なわれています。

まとめ

手元のCore i7-10700マシンについて少し詳細な追加テストを行なってみました。

実用上はもうこれで十分と言う性能がある、としか言いようがなくなりつつあるのがPCの世界ですが、仕事だけではなく趣味の世界でもより高い性能を必要とする新しいタスクがどんどん生まれてくるのがこのジャンルでもあります。

「自分のマシンでどこまで出来るのか」を、しっかりと把握して上手に使いこなしていきたい所です。

2020年時点のデスクトップPC向けCPUではAMDのRyzenシリーズが数歩リードしている感がありますが、2021年にはようやくインテルの本命となる第11世代のCoreプロセッサのデスクトップ版も登場するでしょう。

そうなったときの勢力図の変化もまたちょっと楽しみになりそうです。いちPCファンとしては。