Data Science и Cognitive Science, алгоритмы и психология: четвертая...

Post on 19-Jan-2017

147 views 3 download

Transcript of Data Science и Cognitive Science, алгоритмы и психология: четвертая...

Как строить карьеру во времена четвертой промышленной революцииData Science и Cognitive Science, алгоритмы и психология

Андрей СебрантНовосибирский Академгородок, 25 марта 2016

Давос, ВЭФ, январь 2016

http://www.weforum.org/agenda/2015/11/what-is-the-theme-of-davos-2016 4

«Earlier Industrial Revolutions advanced human progress through new forms of power generation, mass production and information processing. Building on a ubiquitous and mobile internet, smaller, cheaper and more powerful sensors, as well as artificial intelligence and machine learning, the Fourth Industrial Revolution is distinct in the speed, scale and force at which it transforms entire systems of production, distribution, consumption – and possibly the very essence of human nature.»

DeepMind обыграл чемпиона в го

https://clck.ru/9mrpn Интервью Саши Крайнова 5

Сначала европейского, а потом и корейского.

Это куда более сложная задача, чем победа Deep Blue над Каспаровым в 1997 году.

Пришлось научить машину учиться самостоятельно и выработать интуицию.

Вы читали братьев Стругацких?«Не хватает, скажем, человеку рук – он создает себе дубля, безмозглого, безответного, только и умеющего, что паять контакты, или таскать тяжести, или писать под диктовку, но зато уж умеющего это делать хорошо. <...> Настоящие мастера могут создавать очень сложных, многопрограммных, самообучающихся дублей. Такого вот супера Роман отправил летом вместо меня на машине. И никто из моих ребят не догадался, что это был не я. Дубль великолепно вел мой "Москвич", ругался, когда его кусали комары, и с удовольствием пел хором.»

«Понедельник начинается в субботу»1965 год

Мы очень плохо справляемся с простейшими задачками ;)

Пожалуйста, быстро назовите последовательно месяцы года:

7

январь февраль март…

А теперь…

Не всё то интеллект, что требует мозгов

Нам бы с естественным интеллектом разобраться…

Мы научились создавать дублей в области «умственного труда»Дело в том, что мы часто путаем мозг и интеллект, и называем интеллектуальными задачи, которые не требуют, на самом деле, мышления.

Яркий пример - задачи классификации.Лягушка легко отличает пролетающую вблизи муху от пролетающего вдалеке самолета, и нас не удивляет, что она обходится без интеллекта.

Но почему мы считаем, что для того чтобы отличить полотно Шишкина от полотна Левитана, обязателен интеллект и художественное образование поверх него?

Нейронная сеть

A

B

11

ФлагЗданиеТекстЛицоАвтобус

+ =

+ =

Кроме зрения есть слух и речь

Распознавание речи

Речь Акустическая модель

Фонетическая транскрипция

ТекстЯзыковая модель

[й][a][н][д][e][к][с]

Человеческие функции?

Нужен ли эксперт-человек, если его компетенции сводятся к задачам классификации изображений и звуков?• Атрибуция произведений искусства• Медицинские анализы: гематология, цитология,

рентгенология…• Отбор фотографий в шорт-лист на фотоконкурсах• Понимание вопроса позвонившего в колл-центр…

Что еще меняет Data Scienceи Machine Learning?

Модные слова – или особенность текущего момента

Традиционный взгляд на науку

From ChaosBook.org & Wikipedia 18

“If someone could have a sufficient insight into the inner parts of things, and in addition had remembrance and intelligence enough to consider all the circumstances and to take them into account, he would be a prophet and would see the future in the present as in a mirror.”

Gottfried Wilhelm Leibniz

Чем отличается Data Science

Case Study: Data Science and Machine Learning

Data Science != Analytics

Классика:› Глубокое понимание› Человеческий разум› Построение моделей› Длительный процесс

(месяцы и годы)

Специфика:› Машинное обучение› Колоссальные вычисления› Алгоритмические прогнозы› Ответ в реальном времени

(доли секунды)20

Чёрный ящик!

Data Science != Analytics

21

Классика:помощник

ВМЕСТЕ

Специфика:заменитель

ВМЕСТО

Data Science != Analytics

22https://hbr.org/2014/08/the-question-to-ask-before-hiring-a-data-scientist/

Классика:Человекочитаемаявыдача

Специфика:Машиночитаемый ответ(API)

Как определить, смотрит ли человек телевизор, если мы знаем только то, что он делает в вебе?

Case study: Еще одна классификация - поведенческая

23

Light TV-viewers: методология

25

Анкетированиепользователей

› Анкета TNS (4 вопроса)

› Онлайн-панель OMI

› 28’000 чел.

Cookie matchingOMI-Yandex

› ПанелистыOMI <-> пользователиЯндекса

Особенности поведения людейв интернете

› Технология Crypta

› 200 факторовповедения людей

Чёрный ящик!

Heavy TV viewers Light TV viewers

«сбербанк», «коммунальный»,«шарлотка», «выкройка»,

«биглион», «irr», «заработать»

«книга», «переводчик»,«словарь», «формула»,

«японский», «французский», «немецкий», «такси»

Больше запросов кириллицей Много запросов латиницей

Heavy TV viewers Light TV viewers

«тнт», «дом-2», «телепрограмма», «стс»

«С++», «wi-fi», «фотошоп», «torrent»,

«adobe»

Heavy TV viewers Light TV viewers

«спартак», «цска», «пиво» «загранпаспорт», «авиабилет», «виза», «самолет», «аэропорт», «ржд»

“Any sufficiently advanced technology is indistinguishable from magic.”

Arthur C. Clarke, 1973

Black Boxes vs. Magic Wands and Canes

Невидимая магияперсональных рекомендаций(или манипуляций)

Case study Yandex.Music

Технологии таргетингаЧёрный ящик!

Переход от рекламы к продукту

Пока еще рекламная коммуникация оказывается более технологичной и гибкой, чем сайт или приложение.

Но это положение дел уже начинает меняться.

Весь интерактивный ответначинает формироватьсяалгоритмически.

Smart (AI)algorithms

Системы ИИ умеют учитывать сигналы от людей

Зачем нужно машинное обучениеСотни сигналов может обработать только машина

В традиционном продукте всего понемногу, чтоб нравиться всем

Технология Яндекса:MatrixNet

Важная разница: персонализация

Можно уйти от «похожести»

Традиционные рекомендации опираются на здравый смысл и заданные человеком связи и логику

Скучное решение: подобие Умная технология: ОТКРЫТИЕ

Работает тем лучше, чем больше человеческих сигналов учитывает алгоритм

Удержание на сервисе Яндекс.Музыка

37

1

1,5

2

2,5

3

апр.13 май.13 июн.13 июл.13 авг.13 сен.13 окт.13 ноя.13 дек.13 янв.14 фев.14 мар.14 апр.14 май.14 июн.14

logged-in

no login

Launch +19%Черный ящик!

Где это уже работает - рекомендации:• Какую книгу (пост, новость)

тебе стоит прочитать? – NEW MEDIA

• Какую музыку ты хочешь послушать? – NEW MEDIA

• Какой товар ты собираешься купить? – E-COMMERCE

• С какой девушкой тебя познакомить (или с кем из коллег)? – DATING & NETWORKING

• Готов ли ты сменить оператора? – OFFLINE SERVICE

• Можно ли тебе дать кредит? – OFFLINE SERVICE38

Покушение на традиционную науку? Нет, симбиоз с ней!

Case study: Гиперлокальная Яндекс.Погода

39

Метеум

80 метеорологических спутников

10 000 профессиональных станций

1 500 радиозондовыхстанций

Метеорологические исследования и прогнозирования

+1

…модель 1

-3 0

модель N

-1Метеонаблюдения Яндекс.КартыПрогноз

МатриксНет

Метеорологическиеисследованияи прогнозирования

+1

…модель 1

-3 0

модель N

Психология очень важна!

Технологизация коммуникации с людьми –

очень тонкое дело

Лирическое отступление

44

▌ Вам нравится антиспам на вашем почтовом сервисе?

▌ Вам нравится контекстная реклама в личной почте?

│ Если ответы на эти два вопроса не совпали, вы непоследовательны.

│ Зато похожи на человека ;) г

У алгоритмов свои иллюзии

Эту классику мы все знаем А вот это ученые только начинают исследовать ;)http://arxiv.org/abs/1412.1897

Black Box!

Важнейшие умения будущего

47

▌ Работа разных экспертов в единой команде: аналитиков, специалистов по общению с алгоритмами, программистов, психологов, творческих людей

▌ Встраивать технологии в продукт так, чтобы технология не была видна, а видная была магия ;)

▌ Умение отличать: какие решения лучше принимает человек, а какие – машина. Иметь мужество делегировать машине,а не только людям. И мудрость никогда не путать два этих класса ;)

Серьезное обстоятельство:

Алгоритмы, даже великолепно отвечающие на вопросы, покане умеют вопросы задавать и ставить цели

Чёрный ящик!

Домашнее чтение

Про data science и психологию - 1

Эрик Сигель

Просчитать будущее: Кто кликнет, купит, соврет или умрет

Билл Фрэнкс

Укрощение больших данных

Чарлз Дахигг

Сила привычки

Про data science и психологию - 2

Даниэль Канеман

Думай медленно… решай быстро

Нир Эяль, Райан Хувер

Покупатель на крючке

Paul Zikopoulos et al

Big Data Beyond the Hype

А еще есть Telegram ;)

52

@AddMeTo @NeuroScienceRu @TechSparks

Data ScienceCognitive ScienceПсихология

Три дисциплины, которые определят очень многое

Весь рассказ был о массовых сервисах для людей.Но это лишь малая часть современного цифрового мира

Совершенно необходимое послесловие

Напоминалка от GE

Прогноз от GE

IoT – отдельный мир, и он не про браслеты ;)

Industrial Internet – это совсем другая история, потенциально с не меньшими последствиями для экономики, чем интернет людей

ШАД в НГУ

58

2013 – запущена на базе ФИТ

2015 – совместная магистратура

2017 – своя магистерская программа

“When a distinguished but elderly scientist states that something is possible, he is almost certainly right. When he states that something is impossible, he is very probably wrong..”

Arthur C. Clarke

Спасибо! ;)

asebrant@yandex-team.ru

+7 (495) 739-7000 @asebrant

https://www.facebook.com/asebrant

Андрей Себрант