仕事で役立つ人気ビジネスアプリおすすめ!
[PR]
[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。
GTC 2015 – NVIDIA、7TFlopsの演算性能を実現したハイエンドGPU「Titan X」を発表
NVIDIAは同社主催の「GPU Technology Conference 2015(GTC 2015)」において、単精度浮動小数点の場合、7TFlopsという性能を実現したハイエンドGPU「Titan X」を発表した。価格は999ドルと発表されており、コンシューマ向けのGPUである。
Titan Xは3072 Cudaコアを集積し、単精度(SP)浮動小数点では7TFlopsという高い性能を持つ。これまでの最上位のGeForce 980は2048 CUDAであるので、コア数を1.5倍に引き上げている。
なお、NVIDIAの製品ページでは、コアクロックは通常1GHzで、ブースト時でも1.075GHzとなっており、3072×2×1.075=6.6048となり、基調講演での7TFlopsには若干届かない。
倍精度(DP)の演算性能は0.2TFlopsと単精度の1/32程度の値であり、倍精度の演算器は申し訳程度に積まれているという構造になっている。ゲームなどで必要なグラフィックスのための演算は単精度で十分であり、また、今回のGTCのメインテーマであるニューラスネットワークのDeep Learningにおいても単精度で十分であるので、倍精度演算器にチップ面積を割くという設計にはなっていない。
そして、Titan Xのデバイスメモリは12GBで、メモリの転送速度は7Gbps、このメモリを含めて、消費電力は250Wと発表されている。
画像認識に関してImageNet Large Scale Visual Recognition Challengeという競争がある。人間でも、これは何の写真? と迷うようなものもあり、訓練した人間でも正解率は95%(誤り率5%)程度である。これに対して、2015年の1月に中国のBaidu(百度)は誤り率5.98%という成果を発表し、2月6日にはMicrosoftが4.98%の誤り率という人間を上回る性能を達成したことを発表した。そうすると、1週間も経たない2月11日にGoogleが4.82%を達成と発表するというデッドヒートの状態となっている。
なお、写真のCEOであるジェンスン・ファン(Jen-hsun Huang)氏の後に見えるグラフは認識率の年次推移を示すもので、2010年は72%、2011年は74%とゆっくりとした改善であったが、2012年にトロント大学のHinton教授のグループが新しいラーニング法を開発し84%と大幅な改善を実現した。…