10 июня – 2 августа 2019 Алматы - Yessenov Foundation · 2019-05-13 ·...
Transcript of 10 июня – 2 августа 2019 Алматы - Yessenov Foundation · 2019-05-13 ·...
В партнерстве с:
10 июня – 2 августа 2019Алматы
Что такое летняя школа Yessenov data lab?
Программа обучения
Неделя 1. Язык программирования Python
Неделя 2. Линейные модели классификации и регрессии
Неделя 3. Деревья и Boosting
Неделя 4. Обучение без учителя и нейронные сети
Неделя 5. Приложения ML
Неделя 6. Big Data - I
Неделя 7. Big Data - II
Неделя 6. Проектные задачи
Оглавление
Что такое Yessenov Data Lab?
недельинтенсивного
обучения
8
7 недель учебы
1 неделя
решения бизнес-кейсов
Даты проведения: 10 июня – 2 августа 2019
ВЫПУСКНИКИ ШКОЛЫ ПРИОБРЕТУТ НАВЫКИ:
1. Программирования на языке Python в рамках анализа данных
2. Предварительной обработки данных, подготовки их для
последующего анализа (preprocessing)
3. Визуализирования данных и нахождения в них зависимости
4. Составления прогноза на основании исторических данных
5. Понимания различных алгоритмов обучения
6. Правильного выбора модели обучения
7. Фундаментальное понимание работы нейронных сетей
Летняя школа Yessenov data lab это 8-недельный интенсив, который позволяет
за 8 недель ознакомиться с профессией аналитика данных, решать реальные
задачи бизнеса и в дальнейшем самостоятельно совершенствовать полученные
знания.
Место проведения:
Almaty Management University
Программа обучения Язык программирования Python Неделя 1.
Куаныш Абешев декан Школы инженерного менеджмента, AlmaU
Тимур Бакибаев Профессор, AlmaU
09:00 – 10:0010:00 – 11:3012:00 – 13:15 14:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
Регистрация участниковЧто такое Data Mining, Big Data, примерыВведение в Python: переменные, спискиВведение в Python, условия, циклыЛабораторная работа: основы Python
День 1
Работа со строкамиЗнакомство с библиотекой NumPyЛабораторная работа: задачи по NumPyЛабораторная работа: задачи по NumPy
День 2
День 3
Структуры данных: списки, множества, словариАлгоритмы на языке Python: сортировки, поискЛабораторная работа: структуры данных и NumPyЛабораторная работа: реализация алгоритмов
День 4
Закрепление материала по Pandas и MatplotLibЗнакомство с задачей регрессии, SciKitLearn.Лабораторная работа: Линейная регрессияЛабораторная работа: Линейная регрессия
День 5
Знакомство с библиотекой Pandas, MatPlotLibГруппировка данных. Фильтры, сортировка.Лабораторная работа: работа с Pandas.Лабораторная работа: работа с MatPlotLib.
11:30 – 11:4513:15 – 14:3016:00 – 16:15
Кофе-брейкОбедКофе-брейк
Программа обучения Линейные модели классификации Неделя 2.
и регрессии
Дмитрий Русанов Data Scientist
10:00 – 11:3012:00 – 13:15 14:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
День 1
День 2
День 3
День 4
День 5
Задача оптимизации, метод градиентного спускаЛабораторная работаЛабораторная работаЛабораторная работа
Метрики качества.Лабораторная работаЛабораторная работаЛабораторная работа
Линейные модели классификации и регрессии.Лабораторная работаЛабораторная работаЛабораторная работа
Кросс-валидацияЛабораторная работаЛабораторная работаЛабораторная работа
Переобучение, генерализация.Лабораторная работаЛабораторная работаЛабораторная работа
11:30 – 11:4513:15 – 14:3016:00 – 16:15
Кофе-брейкОбедКофе-брейк
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
Программа обучения Деревья и BoostingНеделя 3.
SVM, задачи оптимизацииПрактика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок
День 1
ДеревьяПрактика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок
День 2
Информативность признаков, SHAP (SHapley Additive exPlanations)Практика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок
День 3
Ансамбли решающих деревьев (bagging)Практика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок
День 4
Ансамбли решающих деревьев (bias-variance trade-off, XGBoost)Практика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок
День 5
Подробный обзор CatBoostПрактика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок
День 6
11:30 – 11:4513:15 – 14:3016:00 – 16:15
Кофе-брейкОбедКофе-брейк
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
Программа обучения Обучение без учителя и нейронные сети Неделя 4.
Обучение без учителя (Unsupervised Learning)Практика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок
День 1
Unsupervised Learning, ч.2Практика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок
День 2
Сверточные нейронные сетиПрактика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок
День 3
Введение в нейронные сетиПрактика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок
День 4
Рекуррентные нейронные сетиПрактика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок
День 5
Приложения ML: RecSysПрактика, мастер-классЛабораторная работаЛабораторная работа, Q&A, обсуждение стандартных ошибок
День 6
11:30 – 11:4513:15 – 14:3016:00 – 16:15
Кофе-брейкОбедКофе-брейк
Программа обучения Приложения ML Неделя 5.
Марина Горлова Analyst
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:30
12:00 – 13:1514:30 – 16:0016:15 – 18:00
Рекомендательные системы. User/Item based. Коллаборативная фильтрацияРекомендательные системы. Гибридный рекоммендерЛабораторная работаЛабораторная работа
Анализ изображений. Как решали задачу до нейронных сетейАнализ изображений. Приложения нейронных сетейЛабораторная работаЛабораторная работа
Анализ текстов. Эмбеддинги Анализ текстов. ПриложенияЛабораторная работаЛабораторная работа
Временные ряды. Статистические подходыВременные ряды. Приложения нейронных сетейЛабораторная работаЛабораторная работа
Анализ графовЛабораторная работаUse casesUse cases
День 1
День 2
День 3
День 4
День 5
11:30 – 11:4513:15 – 14:3016:00 – 16:15
Кофе-брейкОбедКофе-брейк
Валерий ЖукSenior Cloud Computing Engineer
Программа обучения Big Data - IНеделя 6.
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
Бизнес проблемыNoSQLHadoop: Yarn, MapReduce, Hive, Hdfs, SparkПродолжение
MapReduce Internals + HiveHiveQL Basics (UI or CLI?)Лабораторная работаЛабораторная работа
Spark Core Практические задания по pySpark + RDDПрактические задания по pySpark + RDDПрактические задания по pySpark + RDD
Spark SQL Практические задания по pySpark + DataFrameПрактические задания по pySpark + DataFrameПрактические задания по pySpark + DataFrame
Разница в использовании ресурсов Compute & StorageАналоги Инструментов Case studiesCase studies
День 1
День 2
День 3
День 4
День 5
11:30 – 11:4513:15 – 14:3016:00 – 16:15
Кофе-брейкОбедКофе-брейк
Михаил Липкович Senior Data Scientist
Программа обучения Big Data - IIНеделя 7.
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
10:00 – 11:3012:00 – 13:1514:30 – 16:0016:15 – 18:00
День 1
День 2
День 3
День 4
День 5
Бизнес-проблемыПроблема применения Data Science на больших данныхОбзор инструментовЛабораторная работа
Spark MLlibSpark MLlib (продолжение)Практические задания по pySpark + MLlibПрактические задания по pySpark + MLlib
Анализ данных на графах Обзор GraphXПрактические задания по pySpark + GraphXПрактические задания по pySpark + GraphX
Data Science on Cloud Общие вопросы: откуда брать данные?Общие вопросы: внедрение решения Общие вопросы: работа аналитиком данных
Case studiesCase studiesCase studiesCase studies
11:30 – 11:4513:15 – 14:3016:00 – 16:15
Кофе-брейкОбедКофе-брейк
Программа обучения Проектные задачиНеделя 8.
Проектная неделя предполагает
6 часов работы в день
В партнерстве с: