Keplerと比べて2倍の電力効率を実現した「GeForce GTX 980/970」 Text by 笠原一輝

半導体メーカーのNVIDIAは、9月18日(現地時間)にロサンゼルスで行われているゲーマー向けイベント“GAME24”において、同社の最新GPUとなる「GeForce GTX 980/970」の2製品を発表した。NVIDIAによれば、Maxwellという新しいアーキテクチャを採用しているGeForce GTX 980は、2012年に発表されたKepler世代の最初の製品となるGeForce GTX 680と比較して2倍のパフォーマンスを実現しながら、電力効率は2倍に改善されている。

そうしたことを実現した秘密は、並列実行優先のKeplerまでのアーキテクチャを見直したことにある。それにより、実行エンジンの効率が大きく改善され、ちょうどIntelのCPUが、Pentium 4系列からCore系統へと切り替わったように、少ない電力でより効率よく処理することが可能になっているのだ。

●GeForce GTX 980とGeForce GTX 970の2製品をラインナップ

今回NVIDIAが発表したGeForce GTX 980/970の2製品は、基本的に同じ「GM204」というダイに基づいているが、CUDAコアと呼ばれる演算器の数、SMと呼ばれるブロックの数、クロック周波数などが異なっている。具体的にはGTX 980はSMが16個とフルスペックになっているのに対して、GTX 970の方はSMが13個と3個が無効になる構成になっている。

GeForce GTX 980を搭載したビデオカード
nvidia-02

nvidia-03

表1 GeForce GTX 980/970のスペック



GeForce GTX 980 GeForce GTX 970
ダイ GM204 GM204
CUDAコア 2048 1664
SM 16 13
ベースクロック 1126MHz 1050MHz
メモリクロック 700MHz 700MHz
ビデオメモリ 4GB GDDR5(256ビット) 4GB GDDR5(256ビット)
メモリ帯域 224GB/秒 224GB/秒
ディスプレイ出力 3xDP1.2、1xHDMI2、1xDL-DVI 3xDP1.2、1xHDMI2、1xDL-DVI
TDP 165W 145W
価格 549ドル 329ドル

 

半導体メーカーは、同じダイから製品のバリエーションを行う場合、いくつかのブロックを無効にしたバージョンを作ることがある。そうしておけば、製造時に一部のブロックが使えないダイでも下位製品として製品化出来るためで、歩留まりを向上させる為の手段として利用されている。GTX 980、GTX 970に関しても同様で、フルスペックで利用できるものはGTX 980として出荷され、いくつかのブロック(3つ)が利用できないモノがGTX 970として出荷される。このため、歩留まりはGTX 970の方がよいと考えられ、サプライも潤沢で、かつ価格もGTX 980に比べて安価に設定されている。

GeForce GTX 980/970のダイである“GM204”は、アルファベットの2つめが示すように、NVIDIAの最新GPUアーキテクチャとなる“Maxwell”(マックスウェル)に基づいている。Maxwellは、2010年に登場したFermi(フェルミないしはファーミ)、2012年に登場したKepler(ケプラー)に次ぐNVIDIAのGPUアーキテクチャで、今後登場するNVIDIAの新しいGPUはしばらくはこのMaxwellに基づく製品となる。

●Keplerアーキテクチャをベースに電力効率を重視した設計にしたMaxwell

今回のGeForce GTX 980/970に採用されているGM204は、一昨年発売されたGeForce GTX 680(GK104、Keplerベース)の後継となるダイだ。それぞれのダイの機能を表にすると以下のようになる。

表2 GeForce GTX 980とGeForce GTX 680の比較



製品 GeForce GTX 980 GeForce GTX Titan Black GeForce GTX 680
開発コードネーム GM204 GK110 GK104
CUDAコア(最大) 2048 2880 1536
SM 16 15 8
SMあたりのCUDAコア 128 192 192
メモリ 256ビット(64ビット×4) 384ビット(64ビット×6) 256ビット(64ビット×4)
L2キャッシュ 2MB 1.536MB 512KB
TDP 165W 250W 195W
補助電源ピン 6ピン×2 6ピン+8ピン 6ピン×2
製造プロセスルール 28nm(TSMC 28nm HP) 28nm(TSMC 28nm HP) 28nm(TSMC 28nm HP)
トランジスタ数 52億個 71億個 35億4千万個
ダイサイズ 398平方mm 非公表 294平方mm

 

これを見ると分かることだが、半導体の基本性能を決めると言える製造プロセスルールに関してはGeForce GTX 680と同じ28nmプロセスルールのままだ。従って、そうした面での性能向上は望めないということになる。では、それ以外の部分でどのように性能を向上させたのだろうか?

その秘密は、内部アーキテクチャの改良にある。1つはGPU内部構造の切り分けが変更されていること。NVIDIAのGPUは、最小の演算単位となるCUDAエンジンが複数まとめられてSMというブロックが構成されている。CPUでいえば、このSMが1つのコアみたいなようなモノで、SMの中にCUDAエンジン、スケジューラー、L2キャッシュなどがまとめられている。Kepler世代まではSMに192個のCUDAエンジンがまとめられており、4つ内蔵されているスケジューラが積極的に192個のCUDAエンジンに演算を割り当ててどんどん並列実行していく形になっていた。このような構造を取っていると、分岐命令などが来た時には多少の無駄は発生するが、並列実行の効率は高めることができる。特にHPCで多用されるような科学演算ではメリットが大きかった。

これに対して、Maxwellではそれに加えて演算の効率も重視するような最適化が行われている。まず1つ1つのSMに内蔵されるCUDAコアは減らされて128個になっている。また、それぞれのSMの内部で4つのスケジューラに対して32個のCUDAエンジンが割り当てられて実行される形になっている。並列実行時のパフォーマンスはやや落ちるが、分岐命令が来た時のペナルティは減ることになるので、トータルでの実行効率は向上することになる。特に、無駄な演算が減るので、電力効率は大きく向上しており、NVIDIAによればGK104世代に比べて2倍の電力効率を実現しているという。

この変化は、CPUでいってみれば、ピーク性能を重視していたIntelのPentium 4が、効率を重視したCoreプロセッサに転換していったような変化で、GPUもピーク性能だけでなく電力効率が重視される時代に突入しつつあることを示している。

ただし、GK104に比べてSMあたりのCUDAコアは減ったものの、SM自体は倍増しており、トータルでは2048個のCUDAコアとGK104の1536個に比べて33%ほど増えている。さらに電力効率が改善されているので、ダイサイズは398平方mmとGK104に比べて35%ほど大きくなっているが、熱設計時の指標となるTDPで比較すると165Wで、GK104の195Wから下がっている。本来であれば同じプロセスルールでダイサイズが大きくなれば消費電力は増え、それに比例してTDPもあがることになるが、むしろ下がっているので、Maxwellのアーキテクチャの電力効率が高いことがよくわかると言えるだろう。

この他、NVIDIAはMaxwellで、メモリコントローラも改善している。第3世代デルタカラー圧縮という仕組みが導入されており、メモリへデータを展開するときに色データの圧縮率をこれまでよりも高めている。これにより、アプリケーションソフトウェアによるものの、平均して25%程度の帯域幅へのインパクトを減らすことが可能で、ビデオメモリの帯域幅を25%増やしたのと同じ効果を実現することができる。

●新機能も実装され、効率アップしたGeForce GTX 980/970

この他、NVIDIAはいくつかの新機能をGeForce GTX 980/970に実装している。MFAA(Multi Frame AA)は、アンチエリアシングを複数フレームの情報を参考にしつつ行う技術。現在のフレームだけでなく、前のフレームの情報も参考にしつつ複数サンプルを利用してアンチエリアシングを行うため、半分の負荷で倍のアンチエリアシングのクオリティを得ることができる。NVIDIAによれば、MFAAを有効にすると2xMSAAと同じ程度の負荷で4xMSAAの品質のアンチエリアシングを有効にすることができるという。

DSR(Dynamic Super Resolution)の機能は、ユーザーが1080p(1,920×1,080ドット)のディスプレイを使っている場合に、その倍の解像度となる4K(3,840×2,160ドット)で内部的にレンダリングし、ラスタライズする段階で1080pにダウンスケーリングして出力するという技術だ。これにより、内部的には4Kの解像度でレンダリングすることになるので、より高い表示品質を実現できる。

VR Directは、Oculus VR社のOculus RiftなどのVRに特化したHMDを利用する際にレイテンシを削減する技術。これを有効にすると、Oculus RiftをGeForce GTX 980/970などに接続した時の表示レイテンシを削減し、ユーザーの違和感を少なくする効果がある。

このようにGeForce GTX 980/970は内部構造を見直したことで電力効率が大幅に改善され、プロセスルールが同じでダイサイズが大きくなったのにTDPは下がるというこれまでの常識に反することを実現している点が大きな特徴だ。その上で基本性能も向上しているので、ハイエンドGPUでそれなりに省電力というGPUを探しているのなら検討してみるといいだろう。

・記事掲載時点でのドスパラ通販販売価格
Palit GeForce GTX 980 4GB:75,039円
Palit GeForce GTX 970 4GB:45,987円

・ドスパラWEBサイト商品ページはこちら
Palit GeForce GTX 980 4GB
Palit GeForce GTX 970 4GB

レビュー / コラム

ページトップへ