GPU コンピューティング研究会

TESLA C2050

GTC Japan 2014 テクニカルセッション プログラム(招待講演)

GTC Japan 2014

テクニカルセッション プログラム

 

13:10 - 13:35

GPUを使った3次元素粒子飛跡認識システムの開発

中野 敏行 (名古屋大学大学院理学研究科 素粒子宇宙物理学専攻)

原子核乾板は素粒子検出器として極めてユニークな特徴を持っている。写真フィルムの一種あり、記録された飛跡は現像後に微小な銀粒子の並びとして真の3次元情報として現れる。その空間分解能はナノメートルのオーダーに達し、その情報量は100cm2あたり10テラバイトに相当する。従来は顕微鏡により読み出されたデータ処理にFPGAを用いてきたが、現在開発中の高速顕微鏡システムは26GByte/sのスループットを要し、高速性・アルゴリズムの自由度からGPUでの処理を採用した。これにより、次世代の素粒子実験、反物質実験、ガンマ線天文学、宇宙線による構造体の内部透視等の研究を行っていく。

13:45 - 14:10

TSUBAME2におけるGPUを用いた大規模データ処理

佐藤 仁 (東京工業大学 学術国際情報センター)

TSUBAME2の1024ノード、3072台のGPUを用いたMapReduceによる大規模グラフ処理や、2048台のGPUを用いた大規模ソートなどの実例を交え、将来の大規模データ処理に向けた取り組みについて述べる。

14:20 - 14:45

GPUを用いた大規模シミュレーションによる地震ハザード評価

青井 真 (防災科学技術研究所 観測・予測研究領域 地震・火山防災研究ユニット)

将来発生する地震によりどのような揺れが生じるかを予測する地震ハザード評価では高精度かつ大規模な地震波伝播シミュレーションが必要となる。我々がこれまでに開発してきた差分法による地震動シミュレータGMSをTSUBAME上でフルGPU化し、格子数が数百億規模の極めて大規模かつ現実的なモデルまで高いスケーラビリティ(弱スケーリング)が得られるシステムの開発に成功した。本講演ではGMSにGPU化について述べるとともに、2011年東北地方太平洋沖地震への適用例や長周期地震動のハザード計算の事例について紹介する。

14:55 - 15:20

多相流LBMシミュレーションの大規模間隙モデルへの適用

辻 健、 蒋 飛 (九州大学カーボンニュートラル・エネルギー国際研究所)

二酸化炭素の地中貯留(CCS)、原油増進回収(EOR)、シェールガス開発といった地下エネルギー資源の開発では、岩石孔隙内の多相流挙動の解明が求められている。我々は2相格子ボルツマン法(LBM)の計算コードをGPUに実装し、世界最高サイズの岩石孔隙モデルに対して、2相流の計算を実現することに成功した。これにより、これまで孔隙スケール(μmスケール)で行ってきた計算を、実験スケール(cmスケール)に拡張することが可能となった。一般的に、異なったスケールの現象を統一的に理解することは難しいが、GPUを用いることで、孔隙スケールと実験スケールの壁を取り除くことに成功した。これにより、実験データによる計算結果の検証や、実験結果と比較した議論が可能となった。

16:20 - 16:45

動的負荷分散による粒子法(SPH/DEM)の大規模粒子法シミュレーション

都築 怜理 (東京工業大学 総合理工学研究科)

重力多体問題などと異なり、紛体計算の DEM や流体計算の SPH は相互作用が局所的で粒子分布が時間とともに大きく変化する。これらを複数 GPU を使って効率よく計算するために、計算領域を再分割することによる動的負荷分散を導入する。1000万個以上の粒子を用いたゴルフのバンカーショットなど多数の大規模粒子シミュレーション例を紹介する。

16:55 - 17:20

TSUBAMEを用いた生体分子シミュレーション研究

宮下 尚之 (理化学研究所 生命システム研究センター)

最近、生体分子シミュレーション研究の分野でもGPGPUを搭載したPCクラスタが利用されつつある。ベンチマークと共に我々がTSUBAMEにて実施した長時間生体分子シミュレーション研究の例を紹介をする。また、GPGPU搭載PCクラスタにも対応させた多次元レプリカ交換インターフェースプログラムREINと、そのアプリケーション(HPCI)研究の進捗についても紹介する。

17:30 - 17:55

フラグメント分子軌道法におけるFock行列計算のGPGPU化

梅田 宏明 (筑波大学計算科学研究センター)

大規模分子に対する量子化学計算を可能にするフラグメント分子軌道法について、そのホットスポットの一つであるFock行列計算のGPGPU化を行なったのでその実装を紹介する。Fermi世代のGPUで苦手としていた倍精度のアトミック加算を回避するFock行列計算アルゴリズムを開発する等で高速化を実現している。