構造をはじめ、さまざまな物理現象を解析するANSYS
ThinkStation D30のパフォーマンスを検証していただいた
サイバネットシステム株式会社 メカニカルCAE事業部
東日本技術部 技術第1グループの宗像佳克氏。
ANSYSは、構造解析を行うツールとして古くから使われており、構造・熱流体・電磁界・回路・システム等の物理現象、それらが組み合わされた場合の連成問題等を解析することができるマルチフィジックス解析ツールとなっている。
その解析には膨大な計算処理が行われ、使うワークステーションの性能が高ければ、計算時間を短縮でき、開発費用の削減や開発期間の短縮ができるほか、解析を繰り返し行うことで設計の精度を高められるなど多大なメリットがある。
2014年に登場した最新版である「ANSYS 15.0」では、解析における機能強化や処理の高速化が行われている。また、グラフィックス(GPU)にも処理を委託するGPGPUも従来からサポートしている。
そこで、今回はハイエンドのスペックを詰め込んだThinkStation D30の“怪物モデル”に、ANSYSの最新版を組み合わせて使ってみた。怪物モデルによって、解析処理のスピードがどのように変化するか、期待どおりの超高速処理が行われるのかどうかを検証した。
GPUのパワーを活用して高速処理が可能に
それでは、ベンチマーク数値を見てみよう。処理に用いたCPUコア数とGPUの有無と種類に分けて計測を行った。ANSYS Mechanicalの標準ベンチマークモデルの中から、静的構造非線形解析を行った。モデル規模として節点数1,787,602、要素数1,064,475、自由度数4.9MDOF。ソルバは共有メモリー型「SPARSE(実数型、対称マトリクス)」、かつIncoreメモリーモードによる実行形態を使用した。
その処理に使ったCPUのコア数、GPUの有無による処理に要する時間の変化を表にした。
Quadro K6000,Tesla K20を搭載したThinkStation D30
グラフはかかった時間を示しているため、短ければ短いほど高速処理が行われている。全体的には、使ったCPUコア数や高性能GPUの利用によって高速処理が行われていることに違いはない。コア数が増えるに従ってGPUを利用した場合の差が縮まっていくことにも注目だ。処理にもよるが、CPUコア数の増加による処理能力アップよりも、GPU追加による処理能力アップが著しいということも言える。
また、別に、節点数144,218、要素数99609、自由度数0.4MDOFというモデルを使ったベンチマークでは、GPUの有無の差がほとんどない。これはモデルの計算規模が小さく、GPUやCPUのコア数の差が大きく出るほどに至らなかったということだ。
CPUの性能が高すぎると、GPUに計算処理を頼らないこともある
しかし、前述のモデルを使い、ソルバの処理能力を示す「Equation solver computational rate」のグラフでは、この表にだけ見られる傾向だが、CPUのコア数が4から8に増加すると、わずかではあるがGPUの効果が少なくなってくる。これは、CPUの処理能力を優先してしまい、GPUの手を借りるまでもなく、CPUだけで処理が進んでしまう傾向があると考えられる。GPUの搭載によって処理能力が著しく上がる処理モデルに限っためずらしい事例だ。
この結果を逆の視点から見れば、処理によってはCPUの性能を重視するよりも、高性能GPUを搭載してGPUに処理を任せられるところは任せたほうが処理能力向上に効果があるということになる。ThinkStation D30怪物モデルのように最新のハイエンドグラフィックス、NVIDIA Quadro K6000と処理専用のNVIDIA Tesla K20cを搭載したことで浮き彫りになったが、GPUの性能をバランス良く高いものにしていくことは必要なことなのだ。
続きは、レノボ・ジャパンのウェブサイトで。