スーパーコンピューティング研究分野 研究室紹介 · の研究. by M1/2&B4 in...

11
スーパーコンピューティング研究分野 研究室紹介 中島 (学術情報メディアセンター/情報学研究科・システム科学専攻)

Transcript of スーパーコンピューティング研究分野 研究室紹介 · の研究. by M1/2&B4 in...

Page 1: スーパーコンピューティング研究分野 研究室紹介 · の研究. by M1/2&B4 in 2019. 10. B4研究室紹介© 2020 H. Nakashima. 省電力並列計算. . 1800. 個のプロセッサ性能

スーパーコンピューティング研究分野研究室紹介

中島 浩(学術情報メディアセンター/情報学研究科・システム科学専攻)

Page 2: スーパーコンピューティング研究分野 研究室紹介 · の研究. by M1/2&B4 in 2019. 10. B4研究室紹介© 2020 H. Nakashima. 省電力並列計算. . 1800. 個のプロセッサ性能

スーパーコンピューティングとは

スーパーコンピュータ&それを使う高性能計算の研究

スーパーコンピュータ=(中島の)パソコン(640億演算/秒)の数万~数百万倍の性能を持つ超高性能コンピュータ

世界最速=20京演算/秒 (≒PC×300万) 京大最速=6500兆演算/秒 (≒PC×10万)

プロセッサ数=1,800+1,700+64 CPUコア数 =122,400+30,600+1,152 メモリ容量 =197TB+106TB+48TB

2

研究室紹介B4 © 2020 H. Nakashima

中島研用: 119兆演算/秒(≒PC×2000)2752 CPU

Page 3: スーパーコンピューティング研究分野 研究室紹介 · の研究. by M1/2&B4 in 2019. 10. B4研究室紹介© 2020 H. Nakashima. 省電力並列計算. . 1800. 個のプロセッサ性能

計算機アーキテクチャ: 6.1 はじめに

並列プロセッサとスループット

京大スパコンの演算スループット

3

研究室紹介B4 © 2020 H. Nakashima

名称 概要 演算スループット

Camphor 2 Laurel 2FMA (fusedmultiply-add)

a×b+cをパイプライン計算する命令

×2 ×2

SIMD (single instruction multiple data)

N組のデータに対して同じ操作を施す命令

×8 ×4

スーパースカラー N個の命令の同時実行機構 ×2 ×2SMT (simultaneousmultithreading)

N個のスレッドを1個のCPUコアで実行する機構

×1(×4)

×1(×2)

マルチコア・プロセッサ N個のCPUコアで構成されたマイクロプロセッサ

×68 ×18

SMP (shared-memorymultiprocessor)

主記憶を共有するN個のプロセッサからなるコンピュータ

×1 ×2

クラスタ N個のコンピュータをネットワークで結合したシステム

×1800 ×850

総計 ×3,916,800 ×489,600各階層の並列性を最大限に活用するプログラミング

Page 4: スーパーコンピューティング研究分野 研究室紹介 · の研究. by M1/2&B4 in 2019. 10. B4研究室紹介© 2020 H. Nakashima. 省電力並列計算. . 1800. 個のプロセッサ性能

スーパーコンピューティング@中島研

多数 (~数千万個) のCPUによる並列処理を

上手くやる方法の研究

並列アルゴリズム

... n 個のCPUを使って理想的には n 倍速くする

並列/高性能実装技術

... n 個のCPUを使って本当に (e.g.) 0.9n 倍速くする

上手くやれるようにする方法の研究

並列プログラミング言語

... 面倒な並列処理を簡単に記述する言語

並列化ライブラリ

... 面倒な並列処理を(e.g.) C で簡単にプログラムする

4

研究室紹介B4 © 2020 H. Nakashima

Page 5: スーパーコンピューティング研究分野 研究室紹介 · の研究. by M1/2&B4 in 2019. 10. B4研究室紹介© 2020 H. Nakashima. 省電力並列計算. . 1800. 個のプロセッサ性能

上手くやる方法の研究

B4 © 2020 H. Nakashima

研究室紹介

イオンビーム

中和用電子放出

イオンエンジン搭載衛星

電界強度コンター図

大規模な偏微分方程式の求解

惑星近傍磁場解析

大規模行列の

圧縮表現

巨大地震

サイクル解明

計算負荷の

自動均衡

宇宙プラズマ

シミュレーション

5

100億元連立方程式を数万回解くための高速計算手法

1兆個の粒子を数万回動かすための高速計算手法

100万×100万の行列を1万分の1に圧縮する計算手法

Page 6: スーパーコンピューティング研究分野 研究室紹介 · の研究. by M1/2&B4 in 2019. 10. B4研究室紹介© 2020 H. Nakashima. 省電力並列計算. . 1800. 個のプロセッサ性能

上手くやる方法の研究

B4 © 2020 H. Nakashima

研究室紹介

イオンビーム

中和用電子放出

イオンエンジン搭載衛星

電界強度コンター図

大規模な偏微分方程式の求解

惑星近傍磁場解析

大規模行列の

圧縮表現

巨大地震

サイクル解明

計算負荷の

自動均衡

宇宙プラズマ

シミュレーション

6

10億元連立方程式を数万回解くための高速計算手法1個の未知数の近似解更新 ... FMA+スーパースカラ8個の未知数の近似解更新 ... SIMD1003個の未知数の近似解更新 ... マルチコア+SMP1000個の未知数集合の近似解更新 ... クラスタ

Page 7: スーパーコンピューティング研究分野 研究室紹介 · の研究. by M1/2&B4 in 2019. 10. B4研究室紹介© 2020 H. Nakashima. 省電力並列計算. . 1800. 個のプロセッサ性能

上手くやる方法の研究

B4 © 2020 H. Nakashima

研究室紹介

イオンビーム

中和用電子放出

イオンエンジン搭載衛星

電界強度コンター図

大規模な偏微分方程式の求解

惑星近傍磁場解析

大規模行列の

圧縮表現

巨大地震

サイクル解明

計算負荷の

自動均衡

宇宙プラズマ

シミュレーション

7

1兆個の粒子を数万回動かすための高速計算手法1個の粒子移動 ... FMA+スーパースカラ8個の粒子移動 ... SIMD1003個の小領域中の粒子移動 ... マルチコア+SMP1000個の小領域集合の粒子移動計算+負荷均衡... クラスタ

Page 8: スーパーコンピューティング研究分野 研究室紹介 · の研究. by M1/2&B4 in 2019. 10. B4研究室紹介© 2020 H. Nakashima. 省電力並列計算. . 1800. 個のプロセッサ性能

上手くやる方法の研究

B4 © 2020 H. Nakashima

研究室紹介

イオンビーム

中和用電子放出

イオンエンジン搭載衛星

電界強度コンター図

大規模な偏微分方程式の求解

惑星近傍磁場解析

大規模行列の

圧縮表現

巨大地震

サイクル解明

計算負荷の

自動均衡

宇宙プラズマ

シミュレーション

8

100万×100万の行列を1万分の1に圧縮する計算手法1個の小行列要素計算 ... FMA+スーパースカラ8個の小行列要素計算 ... SIMD1000個の小行列の計算+負荷均衡 ... マルチコア+SMP1000個の小行列集合の計算+負荷均衡 ... クラスタ

Page 9: スーパーコンピューティング研究分野 研究室紹介 · の研究. by M1/2&B4 in 2019. 10. B4研究室紹介© 2020 H. Nakashima. 省電力並列計算. . 1800. 個のプロセッサ性能

上手くやれるようにする方法の研究

task prob {...}worker int search() {for(...) { ...search(); ...}prob(...){...}}

タスク並列言語

Tascell

B4 © 2020 H. Nakashima研究室紹介

9

~10億節点の木探索を自動的に並列処理するプログラミング言語

use qw (log limit core); use limit;limit::initialize(30);prepare_submit_sync {RANGE0=> [1..3000],exe0=> "hugesim",arg0_0@=> sub {"input-$VALUE[0].txt”};}

並列スクリプト言語

Xcrypt

~1万回のプログラム実行を自動的に並列処理するスクリプト

by D2行列構造(木構造)生成木を生成しながら再帰的並列計算計算負荷の動的均衡化

Page 10: スーパーコンピューティング研究分野 研究室紹介 · の研究. by M1/2&B4 in 2019. 10. B4研究室紹介© 2020 H. Nakashima. 省電力並列計算. . 1800. 個のプロセッサ性能

上手く ... の研究 by M1/2&B4 in 2019

10

研究室紹介B4 © 2020 H. Nakashima

省電力並列計算 1800個のプロセッサ性能計算:均一/電力:不均一 (±10%)

実行するプログラムによって不均一の程度が異なる

プログラムの電力消費傾向を予測し適切なプロセッサ群を割当 全体の消費電力削減

task prob {...}worker int search() {for(...) { ...search(); ...}prob(...){...}}

Tascell

イオンビーム

中和用電子放出

イオンエンジン搭載衛星

電界強度コンター図

宇宙プラズマ

単位小領域中の粒子=0~1000個かつ変動SIMD演算による粒子移動計算 ... ○配列 ×リスト単位小領域間の粒子移動 ........... ×配列 ○リスト

粒子集合を小規模配列を要素とするリストで表現

多数のクラスタノードを使う並列計算でのノード間通信の高速化

M2: 通信のマルチスレッド化M1: 通信と計算のオーバーラップによる遅延隠蔽

B4: 並列計算に関する記法の簡略化

by M1

by M1

Page 11: スーパーコンピューティング研究分野 研究室紹介 · の研究. by M1/2&B4 in 2019. 10. B4研究室紹介© 2020 H. Nakashima. 省電力並列計算. . 1800. 個のプロセッサ性能

メンバー

中島 浩 (教授), 深沢 圭一郎 (准教授), 平石 拓 (助教) D3 D2 M2 M1

場所: 総合研究5号館4F (本部構内北門東側) web: http://ais.sys.i.kyoto-u.ac.jp イベント

コンパは最近 Halal 料理が中心

何故か毎年2~3月に若狭にフグを食べに行く1泊旅行

近年の就職先

NTTデータ, 富士通研究所, JFEスチール, JR東海, Cisco, IHI, Yahoo, ...

Who, Where, ...

11

研究室紹介B4 © 2020 H. Nakashima