10 июня – 2 августа 2019 Алматы - Yessenov Foundation · 2019-05-13 ·...

12
В партнерстве с: 10 июня – 2 августа 2019 Алматы

Transcript of 10 июня – 2 августа 2019 Алматы - Yessenov Foundation · 2019-05-13 ·...

Page 1: 10 июня – 2 августа 2019 Алматы - Yessenov Foundation · 2019-05-13 · Введение в Python: переменные, списки Введение в Python,

В партнерстве с:

10 июня – 2 августа 2019Алматы

Page 2: 10 июня – 2 августа 2019 Алматы - Yessenov Foundation · 2019-05-13 · Введение в Python: переменные, списки Введение в Python,

Что такое летняя школа Yessenov data lab?

Программа обучения

Неделя 1. Язык программирования Python

Неделя 2. Линейные модели классификации и регрессии

  Неделя 3. Деревья и Boosting

Неделя 4. Обучение без учителя и нейронные сети

Неделя 5. Приложения ML

Неделя 6. Big Data - I

Неделя 7. Big Data - II

Неделя 6. Проектные задачи

Оглавление

Page 3: 10 июня – 2 августа 2019 Алматы - Yessenov Foundation · 2019-05-13 · Введение в Python: переменные, списки Введение в Python,

Что такое Yessenov Data Lab?

недельинтенсивного

обучения

8

7 недель учебы

1 неделя

решения бизнес-кейсов

Даты проведения: 10 июня – 2 августа 2019

ВЫПУСКНИКИ ШКОЛЫ ПРИОБРЕТУТ НАВЫКИ:

1. Программирования на языке Python в рамках анализа данных

2. Предварительной обработки данных, подготовки их для

последующего анализа (preprocessing)

3. Визуализирования данных и нахождения в них зависимости

4. Составления прогноза на основании исторических данных

5. Понимания различных алгоритмов обучения

6. Правильного выбора модели обучения

7. Фундаментальное понимание работы нейронных сетей

Летняя школа Yessenov data lab это 8-недельный интенсив, который позволяет

за 8 недель ознакомиться с профессией аналитика данных, решать реальные

задачи бизнеса и в дальнейшем самостоятельно совершенствовать полученные

знания.

Место проведения:

Almaty Management University

Page 4: 10 июня – 2 августа 2019 Алматы - Yessenov Foundation · 2019-05-13 · Введение в Python: переменные, списки Введение в Python,

Программа обучения Язык программирования Python Неделя 1.

Куаныш Абешев декан Школы инженерного менеджмента, AlmaU

Тимур Бакибаев Профессор, AlmaU

09:00 – 10:0010:00 – 11:3012:00 – 13:15 14:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

Регистрация участниковЧто такое Data Mining, Big Data, примерыВведение в Python: переменные, спискиВведение в Python, условия, циклыЛабораторная работа: основы Python

День 1

Работа со строкамиЗнакомство с библиотекой NumPyЛабораторная работа: задачи по NumPyЛабораторная работа: задачи по NumPy

День 2

День 3

Структуры данных: списки, множества, словариАлгоритмы на языке Python: сортировки, поискЛабораторная работа: структуры данных и NumPyЛабораторная работа: реализация алгоритмов

День 4

Закрепление материала по Pandas и MatplotLibЗнакомство с задачей регрессии, SciKitLearn.Лабораторная работа: Линейная регрессияЛабораторная работа: Линейная регрессия

День 5

Знакомство с библиотекой Pandas, MatPlotLibГруппировка данных. Фильтры, сортировка.Лабораторная работа: работа с Pandas.Лабораторная работа: работа с MatPlotLib.

11:30 – 11:4513:15 – 14:3016:00 – 16:15

Кофе-брейкОбедКофе-брейк

Page 5: 10 июня – 2 августа 2019 Алматы - Yessenov Foundation · 2019-05-13 · Введение в Python: переменные, списки Введение в Python,

Программа обучения Линейные модели классификации Неделя 2.

и регрессии

Дмитрий Русанов Data Scientist

10:00 – 11:3012:00 – 13:15 14:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

День 1

День 2

День 3

День 4

День 5

Задача оптимизации, метод градиентного спускаЛабораторная работаЛабораторная работаЛабораторная работа

Метрики качества.Лабораторная работаЛабораторная работаЛабораторная работа

Линейные модели классификации и регрессии.Лабораторная работаЛабораторная работаЛабораторная работа

Кросс-валидацияЛабораторная работаЛабораторная работаЛабораторная работа

Переобучение, генерализация.Лабораторная работаЛабораторная работаЛабораторная работа

11:30 – 11:4513:15 – 14:3016:00 – 16:15

Кофе-брейкОбедКофе-брейк

Page 6: 10 июня – 2 августа 2019 Алматы - Yessenov Foundation · 2019-05-13 · Введение в Python: переменные, списки Введение в Python,

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

Программа обучения Деревья и BoostingНеделя 3.

SVM, задачи оптимизацииПрактика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок

День 1

ДеревьяПрактика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок

День 2

Информативность признаков, SHAP (SHapley Additive exPlanations)Практика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок

День 3

Ансамбли решающих деревьев (bagging)Практика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок

День 4

Ансамбли решающих деревьев (bias-variance trade-off, XGBoost)Практика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок

День 5

Подробный обзор CatBoostПрактика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок

День 6

11:30 – 11:4513:15 – 14:3016:00 – 16:15

Кофе-брейкОбедКофе-брейк

Page 7: 10 июня – 2 августа 2019 Алматы - Yessenov Foundation · 2019-05-13 · Введение в Python: переменные, списки Введение в Python,

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

Программа обучения Обучение без учителя и нейронные сети Неделя 4.

Обучение без учителя (Unsupervised Learning)Практика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок

День 1

Unsupervised Learning, ч.2Практика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок

День 2

Сверточные нейронные сетиПрактика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок

День 3

Введение в нейронные сетиПрактика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок

День 4

Рекуррентные нейронные сетиПрактика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок

День 5

Приложения ML: RecSysПрактика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок

День 6

11:30 – 11:4513:15 – 14:3016:00 – 16:15

Кофе-брейкОбедКофе-брейк

Page 8: 10 июня – 2 августа 2019 Алматы - Yessenov Foundation · 2019-05-13 · Введение в Python: переменные, списки Введение в Python,

Программа обучения Приложения ML Неделя 5.

Марина Горлова Analyst

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:30

12:00 – 13:1514:30 – 16:0016:15 – 18:00

Рекомендательные системы. User/Item based. Коллаборативная фильтрацияРекомендательные системы. Гибридный рекоммендерЛабораторная работаЛабораторная работа

Анализ изображений. Как решали задачу до нейронных сетейАнализ изображений. Приложения нейронных сетейЛабораторная работаЛабораторная работа

Анализ текстов. Эмбеддинги Анализ текстов. ПриложенияЛабораторная работаЛабораторная работа

Временные ряды. Статистические подходыВременные ряды. Приложения нейронных сетейЛабораторная работаЛабораторная работа

Анализ графовЛабораторная работаUse casesUse cases

День 1

День 2

День 3

День 4

День 5

11:30 – 11:4513:15 – 14:3016:00 – 16:15

Кофе-брейкОбедКофе-брейк

Page 9: 10 июня – 2 августа 2019 Алматы - Yessenov Foundation · 2019-05-13 · Введение в Python: переменные, списки Введение в Python,

Валерий ЖукSenior Cloud Computing Engineer

Программа обучения Big Data - IНеделя 6.

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

Бизнес проблемыNoSQLHadoop: Yarn, MapReduce, Hive, Hdfs, SparkПродолжение

MapReduce Internals + HiveHiveQL Basics (UI or CLI?)Лабораторная работаЛабораторная работа

Spark Core Практические задания по pySpark + RDDПрактические задания по pySpark + RDDПрактические задания по pySpark + RDD

Spark SQL Практические задания по pySpark + DataFrameПрактические задания по pySpark + DataFrameПрактические задания по pySpark + DataFrame

Разница в использовании ресурсов Compute & StorageАналоги Инструментов Case studiesCase studies

День 1

День 2

День 3

День 4

День 5

11:30 – 11:4513:15 – 14:3016:00 – 16:15

Кофе-брейкОбедКофе-брейк

Page 10: 10 июня – 2 августа 2019 Алматы - Yessenov Foundation · 2019-05-13 · Введение в Python: переменные, списки Введение в Python,

Михаил Липкович Senior Data Scientist

Программа обучения Big Data - IIНеделя 7.

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00

День 1

День 2

День 3

День 4

День 5

Бизнес-проблемыПроблема применения Data Science на больших данныхОбзор инструментовЛабораторная работа

Spark MLlibSpark MLlib (продолжение)Практические задания по pySpark + MLlibПрактические задания по pySpark + MLlib

Анализ данных на графах Обзор GraphXПрактические задания по pySpark + GraphXПрактические задания по pySpark + GraphX

Data Science on Cloud Общие вопросы: откуда брать данные?Общие вопросы: внедрение решения Общие вопросы: работа аналитиком данных

Case studiesCase studiesCase studiesCase studies

11:30 – 11:4513:15 – 14:3016:00 – 16:15

Кофе-брейкОбедКофе-брейк

Page 11: 10 июня – 2 августа 2019 Алматы - Yessenov Foundation · 2019-05-13 · Введение в Python: переменные, списки Введение в Python,

Программа обучения Проектные задачиНеделя 8.

Проектная неделя предполагает

6 часов работы в день

Page 12: 10 июня – 2 августа 2019 Алматы - Yessenov Foundation · 2019-05-13 · Введение в Python: переменные, списки Введение в Python,

В партнерстве с: