GTC招待講演リスト | GPU コンピューティング研究会

GTC Japan 2012

テクニカル・セッション　プログラム

13:10 - 13:40	Petascale Fast Multipole Method on GPUs 横田　理央（KAUST, Saudi Arabia） Fast Multipole Method (FMM)はO(N)でありながら演算律速であり，楕円型方程式の解法でありながらグローバルな同期を必要としないという特長から，近年HPC業界で注目されているアルゴリズムの一つである．従来FMMは重力多体問題や分子動力学，境界要素法の高速化に用いられてきたが，近年はこれを疎行列ソルバの前処理などにも拡張する研究が盛んに行われており今後幅広い分野で用いられる可能性がある．本講演では，FMMのデータ・ドリブンな最適化や大規模並列実行時の動的負荷分散に関する最新の研究例やTSUBAME 2.0において4096GPUを用いた計算例を紹介する．
13:50 - 14:20	CUDAによるモンテカルロ木探索の高並列高性能化 Kamil Marek ROCKI (東京大学 / JST) モンテカルロ木探索 (Monte Carlo Tree Search, MCTS) は組合せゲームなどのAI問題で最善手探索に用いられる手法で，ランダムシミュレーションと木探索の組み合わせで汎用性と精度を両立する特徴を持つ．MCTSはコンピュータ碁での大きな成功で研究者の注目を集め，他の困難な問題への応用も期待されている．本講演では，我々が行ったTSUBAME2.0上でのMCTSのマルチGPU実装について紹介する．我々の実装では，条件によっては1GPUでも50～100 CPU相当の性能を実現しており，さらにマルチGPUを用いて高速な超大規模計算を達成することができた．
14:30 - 15:00	CUDAカーネルの自動最適化手法（仮）額田　彰（東京工業大学・学術国際情報センター） CUDA GPU用のFFTライブラリNukadaFFTに組み込まれている自動チューニング手法の詳細を紹介する。（仮）
16:00 - 16:30	GPUによる分子軌道法プログラムの高速化成瀬彰（(株)富士通研究所　ITシステム研究所）汎用プロセッサに対して演算性能・メモリスループットに優れたGPUは、HPC分野では一般的に使われるようになってきた。しかし、GPUはそのアーキテクチャの特性上、命令実行やメモリアクセスが不規則なプログラムでは、その高い性能を生かすのが難しく、より広い用途でのGPU利用の壁となっている。本発表では、分子軌道法プログラムのGPU向け高速化手法に関して説明する。このプログラムは、命令実行やメモリアクセスが不規則で、GPUが不得意な種類のプログラムであるが、GPU向けに実装アルゴリズムを根本的に見直すことで、GPU上での高速実行が可能となった。発表では、高速化の考え方や具体的な実装方法を詳しく説明する。
16:40 - 17:10	偏微分方程式の陽解法のための自動チューニングフレームワーク村主　崇行（京都大学・白眉センター）偏微分方程式(PDE)の陽解法のためのドメイン特化言語、Paraisoを開発している。Paraisoでは、数学的で簡潔な表記を使用してPDEソルバを記述することができ、それらを並列仮想マシン(OM)の単純な命令列に変換する。Riemannソルバの選択や、空間補間法、時間積分などの高次精度化など数値流体計算のさまざまな技法を、プログラムに対する操作として再利用・組み合わせ可能な形で表現することができる。また、生成したコードに対する手動および進化的計算にもとづく自動チューニングを施すことができる。Paraisoは現在OpenMPあるいはCUDAで並列化されたコードを生成できるが、XcalableMP,Physis, Edenなどの並列言語を利用して分散計算にも対応できるようにする計画もある。
17:20 - 17:50	Graph500 への挑戦 - GPU を用いた大規模グラフ処理鈴村　豊太郎（東京工業大学 / IBM 東京基礎研究所）大規模グラフ処理はWebページのリンク解析, タンパク質間の相互作用解析, 道路網,送電網の最適化など様々な応用分野があり,近年盛んに研究されている．そのような中,スーパーコンピュータのグラフ処理性能を測る Graph500 という新しいベンチマークが登場し，注目を集めている．2012年6月に発表された最新のランキングでは,東京工業大学学術国際情報センターのスーパーコンピュータ TSUBAME 2.0 の1366ノードに搭載される合計4096個の GPUを活用し, 世界4位を獲得した. 大規模に GPU を活用してグラフ探索を実行させた例は世界初である. 本講演では Graph500 の概要及び GPU を用いたスケーラブルなグラフ探索手法に関して述べる.