ML/DL/AI - кому/как/зачем/почему. Все ли животные равны? ·...

Алексей Перевозчиков

Server Solutions Product Manager

82189117@ru.ibm.com

ML/DL/AI - кому/как/зачем/почему. Все ли животные равны?

Что такое ИИ?

Чем он отличается (и отличается ли) от

ML/DL?

Как создавать то, чему мы не можем дать

даже определение?

Несколько вопросов

Что это такое? Зачем и кому нужно? ML/DL/AI

Риск

возникновения

инцидентов

время

инспекцииs

количество

инспекций

Кластер из 22,000 узлов

716,000 процессоров Intel

20 часов

Кластер из 30 узлов

60 процессоров POWER

120 NVIDIA Tesla P100 GPUs

NVidia NVLink

92 минуты

Контроль использования Средств Индивидуальной Защиты (СИЗ).

Распознавание формы сотрудника.

Распознавание дефектов солнечных панелей

Классификация звуков

• Идентификация происхождения

городских звуков:

• Люди

• Природа

• Музыка

• …

• Идентификация источников

звукового загрязнения и их

интенсивности

• Обеспечение безопасности

сверление

играющие

дети

машина

лай собаки

кондиционер

“Экономический эффект систем ИИ на наше

общество к 2030 году составит 15 триллионов

долларов. Ни один сектор экономики не

останется в стороне.”

PwC, report “Sizing the prize”, Source: https://preview.thenewsmarket.com/Previews/PWC/DocumentAssets/476830.pdf

PwC report “Sizing the prize”

Другая Экономика

Дешевая разработка –

дорогое тиражирование и

эксплуатация

Относительно дорогая

разработка – очень

дешевая эксплуатация

Другая Экономика

Нейронная модель обученная

в дата центре с помощью

PowerAI

Inference

Engine tool

FPGA Accelerator

bit-file for edge

Чип FPGA стоимостью от $20 до $1000

ДРУГОЕ ЖЕЛЕЗО

УскорениеCPU → GPU

GPU → GPUвзаимодействия

Ускорение

GPU → GPU взаимодествия

ТОЛЬКО

Сравнение вариантов подключения GPU

• Прозрачное взаимодействие CPU/GPU

• когерентный доступ к памяти

• улучшенная трансляция виртуальных адресов

• разработано для эффективных моделей программирования

• ускорение сложных аналитических приложений

Design: Flat and Fat

Fabric

POWER9 DDR4

DDR4 POWER9

V100V100 NVLink V100V100 NVLink

170GB/s 170GB/s

150 GB/s 150 GB/s

Общая память объемом до 2ТБ

GoogLeNet – 1000 epochs

LOWER IS BETTER

3.8x faster

[9709]seconds

4xTesla

V100 GPUs

Chainer v3 – сокращение времени

обучения в 3,8 раза

Benchmark details in speaker notes.

[2622]seconds

4xTesla

V100 GP

NVLink 2.0

• Обе системы 2 сокета + 4хV100

• Ускорение обучения в 3,8 раза при 1000

итераций обучения на медицинских и

спутниковых снимках

• Важнейшие параметры машинного

обучения – регрессия, поиск

ближайшего соседа, система

рекомендаций, кластеризация и др.

требуют использования не только

памяти GPU

• NVLink 2.0 обеспечивает улучшенную

связь CPU ➔ GPU

• LMS от IBM для DL автоматически

использует этот механизм для улучшения

производительности

[2940]seconds

LOWER IS BETTER

4xTesla

V100 GP

NVLink 2.0

3.7x faster

[11215]seconds

4xTesla

V100 GPUs

GoogLeNet – 1000 epochs

Caffe – сокращение времени

обучения в 3,7 раза

• Ускорение обучения в 3,7 раза при 1000

итераций обучения на изображениях

2к х 2к

памяти GPU

2.3x faster

[2042]images /

second

4xTesla

V100 GPUs

TensorFlow обрабатывает в

2,3 раза больше изображений

[4763]images /

second

4xTesla

V100 GP

NVLINK 2.0

GoogLeNet – 1000 epochsHIGHER IS BETTER

• Увеличение в 2,3 раза количества

обрабатываемых изображений в

секунду

памяти GPU

[3093]

[5737]

“Filter Tweets by Geographic Area” Marketing Test80-600 concurrent users accessing 280M simulated tweets (queries/min)

85%faster

Performance is so low,

it’s not on the chart

[673]seconds

[917]seconds

POWER9 delivers 2.6x faster

CPMD simulation runs

with same NVIDIA GPU

LOWER IS BETTERHIGHER IS BETTER

[~10GB/s]PCIe G3

4xP100 GPUs

NVLink 1.0

POWER9 delivers ~5x faster data

movement CPU → GPU when

running CPMD simulations

PCIe G3

2.6xfaster

~5xfaster

4VP100 GPUs

NVLink 2.0

[351]seconds

[~50GB/s]NVLink 2.0

train more | build more | know more

4VP100 GPUs

NVLink 2.0

S822LCPOWER8

20 cores

4 - P100 GPUs

256GB RAM

Hardware List Price

$67,054

TCA Street Price

$53,654

TensorFlow

TCA Price/Performance

AC922POWER9

32 cores

4 – V100 GPUs

256GB RAM

Hardware List Price

$68,854

TCA Street Price

$55,083

TensorFlow

C4130x86 Broadwell

28 cores

4 – V100 GPUs

256GB RAM

Hardware List Price

$87,569

TCA Street Price

$70,055

TensorFlow

POWER / x86 Price

Hardware List Price Ratio

0.77 0.77

TCA Street Price Ratio

0.77 0.77

TCA Price Performance Ratio

0.77 0.39

• Getting questions on GPU pricing compared to on-line pricing? IBM’s net price is competitive!• Dell List price for a Tesla V100 GPU is $16,919 vs. $11,499 in AC922

• Drive home AC922 GPU efficiency versus commodity x86 servers … CPU→NVLink and LMS is a differentiator

• P8 to P9 accelerated computing servers are a price point replace at 256GB memory capacities HIGHLIGHTS

vs. Broadwell

ЕСТЬ ? ЭКСПЛУАТАЦИИ

Resource management layer (CPU/GPU/FPGA) (Docker, Kubernetes)

PowerAI Vision

Код ML – это малая часть систем на базе ML

“Hidden Technical Debt in Machine Learning Systems”, Google

Обеспечение возможности использования AI/DL

Создание команды с Deep Learningэкспертизой: 2 месяца ~ 1 год

Подготовка данных для обучения: ~ 10 чел-месяцев

Обучение новой модели:

1 час ~ неделя

Предоставление результата:

< 1 сек

Cognitive System – IBM PowerAI

Оптимизация стека SW + HW с целью улучшения

• Продуктивности

• Производительности

• Time to market

Cognitive System Stack (based on PowerAI)

Hardware

Cloud and Resource Management Software

AI Library Stack

AI Development Environment and Service Tools

AI Data Scientist AI Application Developer Data Engineers

Container Cloud : Kubernetes and Spark

Deep Learning Software Stack for Deep Learning, Spark ML, etc.

AI Vision, Data Scientist Experience, DL Insight, PowerAI Inference Engine, …

POWER + GPU/FPGACompute nodes for training,

inference and analyticsNetwork

GPU for IBM Cloud Private

Storage

Жизненный цикл нейросетевой модели

В типичном проекте машинного обучения нужно выполнить следующие шаги для обучения и использования нейронной сети

НачалоРазработка

приложения

Определить

задачи

обучения

Подготовить

данные для

обучения

Пред

обработка

Выбор

модели

нейронной

сети

Конфигурация

параметров

обучения

Обучение

модели

Упаковка

обученной

модели

Подготовка

платформы

для

тестирования

• Необходим опыт в разработке нейронных сетей

• Необходим опыт в технологиях распознавания образов

• Необходим опыт в построении платформы для поддержки машинного обучения

корпоративного уровня, включая подготовку данных, обучение и вывод результатов

В чем ценность PowerAI Vision?

• PowerAI Vision автоматизирует циклы машинного обучения для разработчиков.

• Технологии машинного/глубокого обучения уже встроены в продукт.

Start Inference

Эти шаги выполняются автоматически в PowerAI Vision

Можно пользоваться

API для распознавания!

Тестирование нейронной сети

• Категории

назначаются

пользователем

• Управление

наборами

тестовых данных

• Конвертация данных

• Поддержка наборов

обучения и проверки

• Поддержка плагинов

предобработки

• Основные модели для

разных сценариев

• Прогноз времени

обучения

• Визуализация

процесса

обучения

(параметры,

точность)

• Обучение с GPU

• Расширяемость и

высокая

доступность

Определить

задачи

обучения

Подготовить

данные для

обучения

Пред

обработка

Выбор

модели

нейронной

сети

Конфигурация

параметров

обучения

Обучение

модели

Упаковка

обученной

модели

Подготовка

платформы

для

тестирования

Классификация изображений в PowerAI Vision

Московский

Большая Синица: 0.907

Певчий дрозд: 0. 999

Певчий дрозд Колибри

Домовый воробей Речная ласточка

Категории в PowerAI Vision

Большая синица

Рэдиссон: 0. 987

> 20 категорий

5 категорий

Image Classification Object Detection

Изображения Видео

ML/DL/AI - кому/как/зачем/почему. Все ли животные равны? ·...

Documents

Transcript of ML/DL/AI - кому/как/зачем/почему. Все ли животные равны? ·...

КОНСТИТУЦИЯ - law.rkomi.rulaw.rkomi.ru/files/22/8718.pdf(в ред. законов РК от 26.10.1995 г. ... Общественные объединения равны

Agile scrum marketing: Что это такое и кому это нужно?

igor.htm Евгений Дмитриевич Федюнькин · "Слово о полку Игореве" (СПИ -- принятое в науке сокращение). История

Е ГОСТodz.gov.ua/lean_pro/standardization/files/...напряжения δUy на выводах приемников электрической энергии равны соответственно

WebCamp 2016: PHP. Александр Шкарбалюк: SSO: Кому оно нужно и как его готовить?

edu.semgu.kz€¦ · Web viewА. abbreviation 1. сокращение (напр., текста); 2. аббревиатура, сокращение. aboutness . тематика

5 ВВЕДЕН ВПЕРВЫЕ · 2018-02-02 · Введение Требования настоящего стандарта направлены на сокращение потребления

Использование пакета Matlab в научной и …Предисловие История развития системы MATLAB (сокращение от «Matrix

Wonderware в пищевой промышленности · 2018. 8. 7. · Avantis Asset Management solution. Belgium. Avantis Asset Management solution. United states • Сокращение

1190 27.03 - spolokvt226.narod.ruspolokvt226.narod.ru/zadanija_s_06.04.2020... · 1.193 E b l _ j Z l m j Z - Прочитать поэму Некрасова «Кому на Руси

1 1 productionmanager - PSI Metals...площадками и офисными помещениями общей площадью 3 700 кв. м. На данный Сокращение

Кому мешают лентяи: Бизнес-социометрия: как оценить вклад сотрудников

374 - fundamental-research.ru · ных на сокращение затрат при привлечении финансовых ресурсов и ускорение оборота

П B A > H E = H - International Monetary Fund...сокращение расходов. Другие, напротив, настаивают на том, что сокращение

Lubi sebya newerС Предисловие.Никогда не сдавайтесь..... О чем эта книга? Уйти, чтобы вернуться..... Кому ...

Kazakhstan MACC report 111125 FINAL -- Russian · Сентябрь 2011 г. Спрос на инвестиции в сокращение выбросов парниковых газов:

Приложение Сокращение разрыва ...admin.pit.su/file/dfdf/Obrazov_16-18.pdf · 1 Приложение - УТВЕРЖДЕНО наименее успешными

WebCamp2014:Internet Marketing Day: Кому и зачем нужен SERM - Оксана Торина

Календарно-тематическое планированиеsuper-mazeyka.ucoz.ru/MO/filologiya/RP/literatura/l-10.doc · Web viewПоэзия. «Кому на Руси

10 n*2 ь 2011 - OSEI · reducing foot-print of refineries ... сокращение capex; быстрое начало проекта; быструю окупаемость;