GPU コンピューティング研究会

TESLA C2050

GTC Japan 2013 テクニカルセッション プログラム(招待講演)

 

GTC Japan 2013

テクニカルセッション プログラム

 

13:00 - 13:40

GPUによる映像処理シミュレーションの研究例:3次元テレビジョンを指向したホログラフィ計算

伊藤 智義(千葉大学)

GPUのキラーアプリケーションは画像処理系といわれることがある。もともと画像処理専用プロセッサであったのだから、当然と受け取られることも多い。その理由について、3次元映像技術の一つであるホログラフィの数値計算を例にとって、明示する。ホログラフィによる映像技術は究極の3次元テレビジョンを作り出す可能性を秘めているが、計算時間が膨大で現在の計算機環境では実用化が困難である。今はまだ研究レベルにとどまっているが、当該分野においてはGPUが有効に利用されており、その状況についても、あわせて紹介したい。

13:55 - 14:25

NVIDIA プロセッサによる最適化高速計算及び省電力グラフ探索

藤澤 克樹(中央大学, JST-CREST)

複雑な現実問題に対する数理モデル化の技術の進歩は著しく、データ収集技術の発展によって、大規模最適化問題には多くの注目が集まっている。本講演では多くの応用分野を持ちながら、大規模並列計算の難易度が高いと言われている半正定値計画問題に対する内点法アルゴリズムの高速計算について紹介する。アルゴリズム的な2つのボトルネックをそれぞれ多数のCPU及びGPU(東工大 TSUBAME 2.0 の4080 GPUを用いた倍精度計算:1.018PFlops)によって高速化に成功した。さらに Tegra 3 を用いた省電力グラフ探索の実装(第1回Green Graph500 ベンチマーク世界1位)についても紹介する。

14:40 - 15:10

Roadmap to Eigensolver on a GPU-cluster

今村 俊幸(理研AICS, JST-CREST)

汎用プロセッサで開発を進めてきた固有値計算ライブラリの性能は主記憶プロセッサコア間のメモリバンド幅に制限を受ける。GPUの総メモリバンド幅は一般的な汎用プロセッサよりも高く、GPUを用いた固有値計算は高い性能向上を期待できる。また、GPUクラスタはポストペタ環境の一プラットフォームとしても興味深く、その要素技術蓄積は重要である。本発表では自動チューニングにより得られた高性能なCUDA BLASライブラリを使用したGPU固有値計算ライブラリEigen-Gについてその現実装とGPUクラスタに向けた開発計画の一部を紹介する。

16:10 - 16:40

GPUクラスタによる音空間レンダリングと高精細可聴化

土屋 隆生(同志社大)

音空間レンダリングは,波動性を考慮した3次元音場計算により,聴取位置での音圧波形を計算,可聴化する技術で,ちょうど画像分野における画像レンダリングに対応する技術である。音空間レンダリングには,メモリや計算量などの計算機資源が膨大に必要となるため,GPUクラスタの使用が有効である。本講演では,GPUに適した音場計算手法としてCE-FDTD法を解説し,数千m^3の音響空間のレンダリング事例を紹介する。また,東北大学との共同研究による157chの包囲型スピーカアレイを用いたレンダリング結果の高精細可聴化についても紹介する。

16:55 - 17:25

GPUを用いた生体流れの計算バイオメカニクス

今井 陽介(東北大学)

例えば微小循環系の血流を解析する場合,血管径,流量,赤血球体積率などが領域によって異なるため幅広いパラメータ空間をカバーする大規模なパラメトリック計算が必須となる.単体でも高速な演算性能を有するGPUはこれに適しており,我々はGPUを用いた計算バイオメカニクスの研究を進めている.本講演では第一に,格子ボルツマン法を用いた肺内気流および吸入型薬剤分布の患者個別モデリング手法を紹介し,これを赤血球膜の有限要素法と連立することで微小循環系の血流計算へと応用した例を示す.第二に,より高精度な微小循環系の計算手法として境界要素法と有限要素法を連立する手法について紹介する.第三に,粒子法を用いた食物の嚥下および胃内部の食物攪拌の計算について述べる.

17:40 - 18:10

TSUBAME2.0の全ノードを用いた東京都心部10km×10kmの1m解像度による気流シミュレーション

小野寺 直幸(東京工業大学, JST-CREST)

東京都心部は高層ビルが立ち並ぶ複雑な形状をしており、詳細な気流を解析するためには高解像度格子による大規模気流計算が必要となる。また、ビル風に代表されるような突風を予測するためには、ラージエディ・シミュレーションに基づく乱流解析が必須である。本研究では格子ボルツマン法に対して乱流のコヒーレント構造スマゴリンスキーモデルを適用することで、高いレイノルズ数の大規模計算を可能とした。本発表では、GPUに適した計算アルゴリズムおよび大規模計算の高速化技術について議論すると共に、TSUBAME2.0の4,032台のGPUを用いた東京都心部10km四方の1m解像度の気流計算結果を示す。