Мы уже рассказывали о том, кто такой Data Scientist — специалист в области данных — математик, аналитик, программист и даже трендспоттер местами. Обсудили навыки такого специалиста и составили гайд в мире науки о данных. Теперь пришла пора рассказать о профессии со стороны работодателя — человека, от которого зависит зарплата и сам найм на работу. Брали интервью и делали выводы Ксения Суворова, директор по развитию Фонтанки.ру, и Андрей Мирошниченко, координатор офлайн-программы «Data Scientist».
Сейчас всё сложилось таким образом, как когда-то история с продакт- и проджект-менеджментом: специалисты есть на рынке, у них уже достаточно устоявшаяся рыночная стоимость, существуют вакансии, но при этом не каждый знает, кто это такой и зачем этот человек вообще нужен бизнесу. Поэтому мы решили поговорить с компанией «Авито», HR-агентством «Spice IT» и Storia.me, чтобы понять, каково развитие профессии на самом деле.
Программа обучения: «Data Scientist»
Сейчас всё сложилось таким образом, как когда-то история с продакт- и проджект-менеджментом: специалисты есть на рынке, у них уже достаточно устоявшаяся рыночная стоимость, существуют вакансии, но при этом не каждый знает, кто это такой и зачем этот человек вообще нужен бизнесу. Поэтому мы решили поговорить с компанией «Авито», HR-агентством «Spice IT» и компанией Storia.me, чтобы понять, каково развитие профессии на самом деле.
Взгляд компании Avito с позиции прямого нанимателя — рассказывает Александра Головина
«Потребность в специалистах data science очень велика и в дальнейшем будет только расти. Однако, возможностей для обучения тоже много: любой человек, который понимает, что ему не хватает академического образования, может пройти курсы и получить необходимую базу.
Вопрос, скорее, в том, кто и почему приходит в профессию. На собеседовании соискатели говорят, что интересуются машинным обучением, а когда начинаешь спрашивать почему, отвечают: «Это модно». И всё. Понимания, как применить знания, нет.
А в бизнесе все не так. Здесь есть задача, для которой необходимо найти оптимальный метод решения. Специфика в том, чтобы это решение было практически реализуемо. И это, наверное, основная проблема, с которой мы сталкиваемся при отборе людей.
Некоторые соискатели считают, что достаточно придумать красивый алгоритм, а то, что его нельзя будет нигде применить — дело десятое.
Экспертизу, в свою очередь, можно разделить. Есть люди, которые проработали в близкой нам сфере — классифайдах и IT. Они прекрасно понимают, где и как применять знания. Люди, которые приходят из другой сферы — из банков, вчерашние выпускники или проработавшие в лаборатории — в этом плане проигрывают, но для нас это не показатель. Они уходят в deep learning, глубинные сети, пытаются найти что-то посложнее. Хотя на самом деле модель, которая будет работать, может быть намного проще.
Скиллы можно разделить на хард и софт. Что касается хард: образование обязательно математическое. Специалист должен понимать, как работают математические модели.
Приходят к нам, как правило, из ведущих вузов: МФТИ, ВШЭ, МГУ. Среди выпускников последнего в шутку даже идет соревнование, кого в компании больше — окончивших мехмат или ВМК.
Также есть условное разделение на продуктовых аналитиков и ML-аналитиков. Задача первых — искать возможность улучшения продукта, генерируя гипотезы о возможных проблемах пользователей и способах их быстрого решения, а вторые автоматизируют решения, найденные продуктовыми аналитиками, и задачи с помощью различных ML-методов: персональные рекомендации, ценообразование и так далее.
Базовые навыки проверяем на тестовом задании. Департамент большой, он состоит из нескольких отделов, поддерживающих разные системы. Поэтому в каждом отделе разработан собственный кейс, максимально приближенный к тому, чем предстоит заниматься в будущем. При решении такого кейса навыки кандидата становятся очевидны. После этого мы смотрим код и решаем, кого пригласить на встречу.
Про софт-скиллз. Это часть, на которую мы обязательно обращаем внимание при личном общении с кандидатом. Так как специалисты по data science задействованы в кроссфункциональных проектах, для нас очень важно, чтобы человек разделял ценности компании, мог работать в команде и выстраивать коммуникацию с коллегами».
Spice IT — с позиции HR-агентства
«Вакансий Data Scientist все больше и больше. Данные — самый ценный на рынке продукт. Спада в ближайшее время не будет. Специалистов уже не хватает, особенно если речь идет о таких вакансиях, как Head of Predictive Analytics или Lead/Chief data scientist. Кандидаты заняты на серьезных проектах и не хотят бросать начатое. Плюс эти позиции подразумевают наличие специальных качеств, необходимых той или иной компании. Со стажерами и джунами проще: data science начинает набирать обороты, и многие рады попробовать свои силы в этой сфере.
Вакансии, где soft skills — одно из ключевых требований, встречаются достаточно редко, если это не руководящая позиция. В связи с тем, что сильных специалистов на рынке пока не очень много, упор идет именно на техническую составляющую.
При этом компании готовы обучать, принимая кандидатов в качестве стажеров или младших аналитиков. Готовы смотреть ребят, которые ведут проекты на фрилансе или делают что-то для себя с целью получения опыта. У нас в работе вакансии разного уровня, где нужны специалисты с минимальным опытом или сильным техническим. Вариантов масса, каждому можно что-то подобрать».
Опыт работы с Data Scientist экс-директора по маркетингу Storia.me — Алины Гашинской
«В Storia в один период было два специалиста по работе с большими данным. Мы нанимали их под конкретные задачи: нужно было работать с предиктивным анализом в целях улучшения маркетинговых показателей и исправлять ситуацию с высоким churn rate. Кроме этого, мы хотели построить собственную рекомендательную систему внутри площадки, не беря для этого готовое решение.
Языки для сбора данных, запросов, обработки информации, работе с базами данных, определенные знания в статистике — этот пул навыков на выходе применятся под конкретную задачу, и в любой ситуации Data Scientist должен понимать, каким образом он будет решать ту или иную проблему.
Не имеет смысла нанимать специалиста по работе с большими данными для того, чтобы он просто сидел в офисе — это будет достаточно дорого. Выгоднее нанимать проектно в случае отсутствия стороннего решения или если продукт нуждается во внутренней разработке.
Работа с большими данными может быть полезна и для UX, и для разработки, и для маркетинга. Нужно смотреть, действительно ли необходим специалист такого формата.
Я бы сказала, что будущее действительно за работой с большими данными, но с некоторыми оговорками. Мало получить данные, надо еще понять, как их можно использовать. Специалисты по работе с данными могут заниматься многими задачами, но обычно они все-таки необходимы именно для большой компании — там для них есть и задачи, и бюджеты.
Для больших компаний в условиях остановившегося роста специалист в data science — это возможность найти новый путь развития, путь привлечения платежеспособных клиентов. Работа с Big Data — это не то, что способен сделать человек, потому что наш мозг просто не в состоянии обработать такое количество данных.
Сейчас только вырабатывается понимание необходимых компетенций и образ специалиста по работе с большими данными. Слишком уж новое это направление для российского рынка и наших реалий. У нас к остальным-то специалистам не всегда правильно сформулированы требования, что уж говорить о Data Scientist.
Кроме того, надо понимать, что работа с большими данными дает результат только в долгосрочной перспективе и не решает вопросы, которые должны быть решены сегодня или завтра. К примеру, вы планируете редизайн через год, и вы хотите сделать полноценный дружелюбный интерфейс. В этом случае вы нанимаете специалиста по работе с большими данными, он проводит A\B-тесты и предиктивный анализ. Такие данные более точные, поскольку это машинное обучение, которое не допускает ошибок. И еще это более грамотные и широкие возможности для рекламных компаний, целевой аудитории и ее анализа».
Советы, которые может дать работодатель специалисту в области больших данных
1. Курсы, конечно, нужны. Но они должны наслаиваться на знание языков программирования: R или Python.
2. Без понимания принципов машинного обучения — никуда.
3. Математика и статистика должны быть вашими друзьями.
4. Данные — это цифры, числа, математический анализ. Поэтому сделайте их своими богами.
5. Мало знать теорию, надо понимать практическую составляющую. Идти работать в бизнес и думать, что там необходим ангельский горн данных — ошибка. Там необходимо решение конкретной задачи.
6. В России большие данные — это, прежде всего, аналитика. Поэтому если вы хотите заниматься чем-то иным, тогда искать работу придется дольше.
Читать ещё: «Как Big Data влияет на нашу жизнь»
7. Вам может попасться «тугой» работодатель, который сам слабо будет понимать роль Data Science — это нормально. Вы не маркетолог, не трафик-менеджер, и даже не аналитик, вы — это нечто большее.
8. Задача любого Data Scientist — обработать данные и предоставить результат. С помощью ваших знаний и навыков по миру летают беспилотники, скоро будут ездить такси и машины без управления человеком, работают нейронные сети, обрабатываются миллионы рекламных кампаний в Гугле и Яндексе. Вы — бесценны, но всё имеет свою цену и имя ей — зарплата. Цените себя и успехов вам.
Полное интервью с Авито и Spice IT о специалистах Data Scientist читайте в нашем следующем материале.
Мнение автора и редакции может не совпадать. Хотите написать колонку для «Нетологии»? Читайте наши условия публикации.