Post on 05-Sep-2019
AWSで実現する次世代シミュレーション環境
2015年11月26日
アマゾン ウェブ サービス ジャパン株式会社
Who am I
• 名前:小川 貴士 (おがわ たかし)
• 所属:アマゾン ウェブ サービス ジャパン株式会社ソリューションアーキテクト
• 主な担当エリア:CAE / HPC
アジェンダ
• AmazonとAWSについて
• Intel社とのパートナーシップ
• HPC分野におけるAWS利用のメリット
• 利用イメージ
• HPC on AWS 事例
AmazonとAWSについて
アマゾンについて
創業:1994年7月
本社:米国ワシントン州シアトル
創業者&CEO:ジェフ・ベゾス
なぜアマゾンがクラウドを?
数十億アイテムの管理を支えるIT基盤を構築運用
AWSクラウドの起源は、アマゾン社内の
ビジネス課題を解決するために生まれた
API
既存のインフラをサービス化して対応
データセンター
ストレージ機器
テープ装置
サーバー
API
2006年3月14日、Amazon S3発表
コア サービス
プラットフォームサービス
エンタープライズアプリケーション
インフラストラクチャー
セキュリティ&管理・運用
サーバー、ストレージ、DBから、アプリケーションまで50を超えるクラウドサービスを提供
世界中にクラウドサービス拠点を展開
11 のリージョン1. US EAST (Virginia)
2. US WEST (N. California)
3. US WEST 2 (Oregon)
4. EU WEST (Ireland)
5. JAPAN (Tokyo)
6. South America (Sao Paulo)
7. ASP 1 (Singapore)
8. ASP 2 (Sydney)
9. GovCloud
10. BJS 1 (Beijing China) limited preview
11. EU (Frankfurt)
30のアベイラビリティ・ゾーン
53のエッジロケーション
企業ユースの皆様の高い要望にお応えできる高いセキュリティ
数多くの第三者認証:セキュリティ・コンプライアンスに関する、多くの第三者認証を取得
データセンター:強固なデータセンターを複数利用可能
セキュリティ技術:堅牢なセキュリティ設定や暗号化、多要素認証
弾力性コスト削減俊敏性
AWSクラウドが選択される理由
グローバル展開幅広い機能
Intel社とのパートナーシップ
Amazon EC2(Elastic Compute Cloud)
• 数分で起動し、1時間ごとの従量課金で利用可能な仮想マシン
• ノード追加・削除、マシンスペック変更も数分で可能
• 管理者権限(root / Administrator) で利用可能
• 社内PCと同じIntelアーキテクチャ採用
1任意のゾーンに分散配置可能
リージョンアベイラビリティゾーンBアベイラビリティゾーンA
高性能インスタンスの変遷
CC1 CC2 C3 C4
vCPU 16 32 32 36
RAM (GiB) 23 60.5 60 60
CPU Xeon X5570
2.93GHz
(Nehalem)
Xeon E5-2670
2.6GHz
(Sandy Bridge)
Xeon E5-2680v2
2.8GHz
(Ivy Bridge)
Xeon E5-2666v3
2.9GHz
(Haswell)
NIC 10Gbps 10Gbps 10Gbps 10Gbps
Launch
Date
Jul, 2010 Nov, 2011 Nov, 2013 Jan, 2015
HPC分野におけるAWS利用のメリット
システムのコモディティ化は演算コストの低減を加速させ、設計、研究開発はシミュレーションが主体に
製品設計の例• 流体力学の演算• アンテナ出力• デジタル信号解析• 温度、電磁界• 有限要素解析• 不良要因解析
シミュレーションの世界はより身近に、より幅広いエリアに浸透。
広がるシミュレーションの世界
• 計算機利用者様のご要望
– コア数制限無く使いたい
– 最適な環境(OS/コンパイラ)を選びたい
– 待ち時間を短縮してほしい
– 最新のCPUを使いたい
– 計算機の運用を楽にしたい
計算機環境の課題
悩めるケース①多数のジョブをすぐに実行したい、短時間で完了したい
1日1週間
コア数コア数
従来は手持ちの限られたリソースで、逐次処理していたジョブもAWSなら必要な台数、インスタンスを起動して、一斉処理。しかも費用は「時間×台数」なのでどちらも同じ。
CAE/HPCアプリケーションの要件や規模に合わせて、最適なクラスターをオンデマンドで起動
悩めるケース②計算の用途の応じてクラスタを構成したい
ピーク稼働に合わせて用意されたシステムは稼働率が低く非効率→従来は計算機のリソースに合わせて仕事をする必要があった。
悩めるケース③刻々と変化する計算需要について行くのが大変
AWSなら日々変化する需要の増減にも対応。さらに計算需要の増加にも長期的に対応可能→その時の仕事に計算機側を合せる時代に!
Time
Time
従来だとシステム更新までは長い道のり
悩めるケース④計算機の更新が大変
システム企
画
ベンチマー
ク依頼RFP ベンダ決定
システム設
計
ファシリ
ティ準備設置・構築 テスト 運用開始
CC1 CC2 C3 C4
CPU Xeon X5570
(Nehalem)
Xeon E5-2670
(Sandy Bridge)
Xeon E5-2680v2
(Ivy Bridge)
Xeon E5-2666v3
(Haswell)
Launch Date Jul, 2010 Nov, 2011 Nov, 2013 Jan, 2015
AWSなら常に最新のCPUが利用可能。問題があれば元に戻すのも自由。
・ハードウェア保守・ネットワーク管理/保守・電源管理・空調管理・設置場所の費用/運用
計算機の規模が大きくなればなるほど大変に、、、
悩めるケース⑤計算機の管理が大変
面倒な物理的管理は全てAWSにお任せ。本来の仕事に集中できる。
AMIとmarketplace
• 一度作成したOS環境はAMIとして保存しておくことが可能。→AMIから何台でもEC2インスタンス
を起動することが可能
• AWS以外にサードパーティもAMIを提供→例えばLustreが導入済みのAMIや、
OpenFOAM導入済みのAMI etc.
インスタンス
Amazon S3
AMI
Availability Zone-1a Availability Zone-1b
カスタムAMI
AMIからインスタンスを起動
カスタムAMIを使って、インスタンスを複数台起動
カスタムAMIを作成必要に応じて共有設定
g2.2xlarge
8 vCPU
15GB RAM
1x NVIDIA GPU
1536 Cores
4GB Mem
G2.2xlarge ( 2013)
Intel® Intel Xeon E5-2670 2.6GHz (Sanday Bridge)
1 NVIDIA Kepler GK104 GPU
I/O Performance: High
G2.8xlarge
32 vCPU
60GB RAM
4x NVIDIA GPU
1536 Cores x 4
4GB Mem x 4
G2.8xlarge (2015)
Intel® Intel Xeon E5-2670 2.6GHz(Sanday Bridge)
4 NVIDIA Kepler GK104 GPU
I/O Performance: Very High (10 Gigabit Ethernet)
GPUインスタンスも選択可能
可視化もクラウド上で
• 特徴 (http://aws.amazon.com/jp/workspaces/)
– 任意のデバイスからアクセス可能– マネジメントコンソールを数回クリックするだ
けでデスクトップを展開– 社内ディレクトリとの統合
• 価格体系 (http://aws.amazon.com/jp/workspaces/pricing/)
– 起動したWorkSpaces数に応じた月額課金– インフラストラクチャ(コンピューティング、
ストレージ、ストリーミング用帯域幅)およびソフトウェアアプリケーションをふくむ
– プラスバンドルにはMicrosoft OfficeとTrend Micro Anti-Virusが付属
Amazon WorkSpaces:フルマネージド型 VDIサービス
AWS Cloud
Availability Zone
Availability Zone
Virtual Private Cloud
Internet
Gateway
Domain
Controller
VPC Subnet
VPC Subnet
Domain
Controller
WorkSpaces WorkSpaces
WorkSpaces WorkSpaces
Client
Mobile Client
Internet
HPC on AWS利用イメージ
自社オフィス環境
社内サーバルーム or データセンター環境
SSH/SCP
ssh端末で操作。データは scpで転送
ログインノード
従来のHPC環境
計算ノード
ライセンスサーバ
マスターサーバNFSサーバ
InternetVPN / 専用線
自社オフィス環境
AWSクラウド環境
SSH/SCP
ssh端末で操作。データは scpで転送
ログインノード
AWSでも基本的なシステム構成は同じ
計算ノード
ライセンスサーバ
マスターサーバNFSサーバ
InternetVPN / 専用線
Corporate
Data Center
Elastic Data
Center
M
AWSなら、必要な時に必要なだけ利用可能
従来のクラスタ構成は固定
ジョブが無ければ無駄発生
$ aws ec2 run-instances \
--image-id ami-5769f956 \
--key-name plc id_rsa \
--security-groups default \
--instance-type c4.8xlarge
Corporate
Data Center
Elastic Data
Center
M
必要に応じて必要な台数でクラスタを構成
AWSなら、必要な時に必要なだけ利用可能
従来のクラスタ構成は固定
ジョブが無ければ無駄発生
Corporate
Data Center
Elastic Data
Center
M
AWSなら、必要な時に必要なだけ利用可能
従来のクラスタ構成は固定
ジョブが無ければ無駄発生
処理が終了するとインスタンスを終了課金停
止
ツールでお手軽にクラスタ構成も可能
Placement Group
計算ノード
マスターノード
ジョブ管理
NFS共有ストレージ
http://star.mit.edu/cluster/index.html
$ starcluster start –s 16
コマンド発行
HPC on AWS事例
ドライブヘッド設計のための高スケールシミュレーション:
数百万もの並列パラメータスタディ従来1か月にも及ぶシミュレーションを8時間で完了
ピーク時に70,000以上のコア、 700TFlopsを超えるピーク性能
AWSスポットインスタンスを活用、掛かったコストは約 $5600
HGST様の設計シミュレーション事例
http://cyclecomputing.com/blog/hgst-buys-70000-core-cloud-hpc-cluster-breaks-record-8-hours/
本田技研工業様のシミュレーション事例
http://www.slideshare.net/AmazonWebServices/bdt201/
https://www.youtube.com/watch?v=G4SAgcacea4
• オンプレミスで運用しているレンダリングシステムの一部としてAWSのリソースを使用• Spotインスタンスの利用により合計40000coreのリソースを$0.47/node で利用
Walt Disney Animation Studios
http://www.slideshare.net/AmazonWebServices/cmp404-cloud-rendering-at-walt-disney-animation-studios
この後のセッションでも多数のソリューション、事例紹介
ナイトイベントで技術交流も
かつてグリッドコンピューティングで思い描いた、理想のシミュレーション環境を今一度AWSで、