Эти люди создают искусственный интеллект — 4 истории специалистов по ИИ и ML

Эти люди создают искусственный интеллект — 4 истории специалистов по ИИ и ML

Карьера Личный опыт

Четыре опытных специалиста о том, как занялись искусственным интеллектом, с какими сложностями столкнулись и какие задачи решают.

«Поначалу всегда было страшно, но я ни разу не пожалел»

Григорий Сапунов, CTO, Intento

Сооснователь и технический директор в стартапе, отвечает за технологическое развитие, архитектуру решений и оценку их качества, применение AI и другие технические вопросы, занимается управлением, разработкой и наймом сотрудников.

Начало пути. Сложно сказать, что именно привело меня в профессию: ещё с детства мне было интересно программирование. Параллельно я интересовался психологией, биологией, математикой, радиоэлектроникой, читал журналы «Юный техник» и «Юный натуралист».

Долгое время всё, что связано с искусственным интеллектом, было для меня скорее хобби, чем профессией. В какой-то момент я понял, что эти темы составляют и заметную часть моих рабочих задач. Можно сопоставить это с моим приходом в Яндекс в 2007 году.

Первые трудности. В моём случае переход был постепенным: моя профессиональная деятельность началась с разного рода ИТ-проектов, а первым «коммерческим» проектом стала поисковая система для «Московской коллекции рефератов», написанная на Perl. Не всегда удавалось разобраться в новых темах с первого раза, приходилось перечитывать по несколько разных книг, чтобы что-то понять, а также много экспериментировать.

Я неоднократно ввязывался в совершенно новые проекты, где на старте у меня полностью отсутствовали нужные знания — приходилось осваивать по ходу дела. Поначалу всегда было страшно, но я ни разу не пожалел.

Чтобы разобраться, как всё работает, практически всегда я начинал программировать с самого низкого уровня. Так было и с алгоритмом рисования линии Брезенхема, затенением по Фонгу или Гуро — когда изучал компьютерную графику, и с созданием простой нейросети, реализацией метода опорных векторов или генетического алгоритма— когда глубже погружался в ИИ. Потом я долго перебарывал себя: не хотел пользоваться готовыми библиотеками и старался написать всё своё с нуля.

Профессиональные задачи. Искусственный интеллект стал довольно универсальной технологией. За последние несколько лет с помощью ML или Software Engineering я вместе с коллегами делал очень разные задачи:

  • распознавание изображений: дорожных знаков с видеокамеры смартфона или товаров на полке магазина;
  • структуризацию новостного потока: кластеризацию новостей по общим темам, аннотирование получившихся кластеров и выделение важных фактов, ранжирование потока по важности и тому подобное;
  • прогнозирование в образовании: кто из студентов бросит онлайн-курс в ближайшее время;
  • realtime-аналитику по колл-центру: определение темы телефонного разговора и эмоций людей;
  • анализ геномных данных: для определения структуры хроматина;
  • работу с текстами: нахождение соответствующих друг другу предложений между параллельными текстами на двух разных языках;
  • и многое другое ?

Сейчас я определяю слабые и сильные стороны моделей и сервисов на базе искусственного интеллекта. Это помогает выбрать, какие из них подходят под конкретную бизнес-задачу.

Планы на будущее. Что планирую делать дальше? Буду применять свои наработанные навыки в сферах медицины и биологии, изучать «психологию» естественных и искусственных сложных систем, пытаться создать ИИ-ученого или, как минимум, ассистента, чтобы повысить свою эффективность. Планирую также освоить несколько новых для себя языков программирования: Rust, Swift, Kotlin, Julia или Elixir. А также попробую сделать больше «железных» проектов с искусственным интеллектом на базе Jetson Nano, Google Edge TPU или с FPGA.

Эти люди создают искусственный интеллект — 4 истории специалистов по ИИ и ML

редакция нетологии

Дмитрий Коробченко, Deep Learning R&D Engineer and Manager, NVIDIA

Руководитель R&D группы, занимается обработкой изображений: применением нейросетей для обработки изображений, компьютерной графики, анимации и физической симуляции.

Начало пути. Во время учёбы в университете я увлекался компьютерным зрением и поэтому решил вступить в Лабораторию компьютерной графики и мультимедиа на факультете вычислительной математики и кибернетики МГУ.

Работая в Samsung после университета, я вернулся к компьютерному зрению: одним из первых моих проектов стал анализ медицинских изображений с применением свёрточных нейронных сетей. А когда в 2012 году нейронные сети активно распространились и на другие области, спектр моих проектов значительно расширился.

Профессиональные задачи. Будучи Deep Learning R&D Engineer, я занимаюсь как исследованиями, так и разработкой: от создания новых алгоритмов и проведения различных экспериментов до реализации конечных продуктов с последующей оптимизацией. Кроме того, последние несколько лет я выступаю с мастер-классами и являюсь преподавателем на курсах по машинному обучению и нейронным сетям в различных школах дополнительного образования.

Сейчас большинство моих задач связаны со сложными типами данных — изображениями, звуками, полигональными моделями, тензорные данными и так далее. В том числе я продолжаю заниматься компьютерным зрением: классификацией изображений, детектированием объектов, семантической сегментацией; создаю нейросетевые фреймворки.

Планы на будущее. В моих ближайших планах усилить R&D группу, специализирующуюся на нейронных сетях в московском офисе NVIDIA, а также продолжить развиваться в образовательной сфере в области искусственного интеллекта: делать контент для лекций, курсов и личного YouTube-канала.

курс

Машинное обучение

Узнать больше

  • Научитесь выдвигать идеи и гипотезы и составлять план решения задачи
  • Узнаете, как подбирать алгоритмы и метрики под задачу для разных моделей
  • Получите прикладной опыт создания работающих нейронных сетей вместо «обзора по верхам»

«На заре 2000-х термина Data Scientist не существовало, но по сути я занималась именно этим»

Анна Костикова, Director Data Science and Bioinformatics в Novartis

Руководит командой, в задачи которой входит создание персонализированной медицины при разработке новых лекарств. Суть работы группы заключается в том, что лекарства разрабатываются и подбираются на основе анализа цифровой информации о ДНК, белках и клинических данных пациентов. Для этого Анна и её команда используют машинное обучение, биоинформатику и статистику.

Эти люди создают искусственный интеллект — 4 истории специалистов по ИИ и ML
Анна Костикова

Начало пути. На заре 2000-х термина Data Scientist не существовало, но по сути я занималась именно этим. Например, в университете я нашла подработку, где должна была собрать данные для базы данных, придумать структуру и сделать так, чтобы с базой можно было работать. Всё это я делала в MS Access на компьютере с 512 Мб оперативный памяти и 1 Гб места на жестком диске ?

На третьем курсе я устроилась на стажировку в некоммерческую компанию, где занимались анализом космических снимков. Именно тогда я впервые попробовала применить нейронные сети, классификацию без обучения и с ним, fuzzy logic и так далее. Тогда компьютеры с 4 гигабайтами оперативной памяти были сравнимы чуду, и мы не выключали их на выходные — чтобы они «досчитывали», пока мы отдыхали.

Первые трудности. Впервые работа с официальным «титулом» Data Scientist появилась у меня в 2014 году. Тогда я устроилась в Booking.com и узнала, каково работать в этой сфере в промышленных масштабах: с выборками данных в миллиарды строк.

В любой области первые два года самые сложные: вся терминология для тебя новая, непонятно, что важно, а что нет.

Обучение новому — это всегда сигмоидная функция: надо преодолеть первое плато, когда кажется, что ты никогда не разберешься. Например, в аспирантуре в Швейцарии мне нужно было научиться анализировать геномные данные и написать скрипт на Perl для масштабного анализа. На тот момент я ничего из этого не знала, но как-то выкрутилась. Главное — не бояться и пробовать.

Профессиональные задачи. В моей практике было очень много разных задач: от анализа космических снимков для WWF до оптимизации процесса пивоварения в Heineken, от предсказания поведения пользователей в интернете для Booking.com до предсказания работы лекарств в Novartis.

Сейчас я работаю директором по анализу данных и биоинформатики в Novartis. Еще у меня своя компания в области диагностики рака. Я бы очень хотела максимально использовать Data Science и машинное обучение для здравоохранения и медицины — от разработки лекарств до диагностики. Я верю, что следующие 2050 лет львиная доля усилий аналитиков во всем мире будет направлена на решение именно биомедицинских задач, изменение качества жизни человечества, а не только на оптимизацию в интернете и на производстве.

«Тогда я был уверен, что уже знаю всё, хотя ещё вообще ничего не знал»

Никита Семенов, NLP team lead, центр искусственного интеллекта МТС

Руководит командами NLP и занимается всем, что связано с обработкой и пониманием естественного языка.

Эти люди создают искусственный интеллект — 4 истории специалистов по ИИ и ML
Никита Семенов

Начало пути. Ещё на первых курсах института я начал факультативно изучать машинное обучение: учился по специальности «Компьютерная безопасность», но постепенно понял, что не хотел бы связать с ней свою жизнь. Мой научный руководитель закончил Миланский политех по программе Computer Science, и с ним мы начали развивать факультативный курс по машинному обучению. Подобного термина тогда не существовало, и во всём мире говорили только об элементах статического обучения, которые мы и изучали. К сожалению, в России до сих пор нет подобных программ по Computer Science.

Найти работу после вуза именно по профилю машинного обучения было крайне сложно — сфера только зарождалась. Поэтому я вышел в небольшой стартап, который занимался автоматизацией ставок на сайтах контекстной рекламы по типу Google AdWords. Моей первой задачей было разработать механизм исходя из статистики и предиктивной способности цели таким образом, чтобы мы всегда занимали не первую ставку, а вторую или третью — эти строки тоже показывают в топе выдачи, но они значительно дешевле. Тогда я был уверен, что уже знаю всё, хотя ещё вообще ничего не знал.

Первые трудности. Для меня большую трудность составляли софт-скиллы: нужно было объяснить, чем я занимаюсь, что это всё значит, как и что интерпретировать, и какой будет эффект, людям, которые вообще ничего не понимали в моей сфере. Тогда процессы взаимного обучения ещё не были мейнстримом, поэтому взаимодействовать с командой было очень сложно. Я постоянно практиковался: пробовал доносить свои мысли и объяснять команде даже самые простые метрики. Думаю, если бы сейчас я только начинал свою карьеру, то не смог бы так сильно прокачаться в общении — подобные вопросы уже практически никто не задает.

С хард-скиллами проблем не было: тогда мои задачи опирались на статистическое обучение и математику, в которых я хорошо разбирался. Несмотря на это, я всё равно читал книги: в Data Sience нужно постоянно развиваться, чтобы разбираться в инструментах и трендах. Вообще, весь мой опыт работы — это один большой челлендж. Каждое место требовало новых инструментов и знаний, поэтому развиваться самостоятельно приходилось всегда.

После работы в стартапе была компания, где я стал первым Data Scientist и R&D: помогал настраивать первые инструменты аналитики, занимался компьютерным зрением и построением предиктивных моделей на основе данных с космических спутников.

Профессиональные задачи. В МТС я пришел на позицию Senior computer vision engineer, а потом дорос до тимлида двух команд. Мне особенно важно прокачивать soft-скиллы, ведь тимлид — это играющий тренер. Если говорить о задачах, то здесь я занимаюсь всем, что связано с обработкой и пониманием естественного языка. Сейчас это уже своеобразный тренд, который задаёт новые тренды, направленные на упрощение жизни человека в будущем.

Со временем я понял, что предметная область не так сильно влияет на область твоих знаний. В моем случае предметная область всегда затрагивает то, как обработать и применить данные к какому-либо решению. А подходы всегда остаются одинаковыми. И когда в предметной области специалисты придумывают инновационное решение, например, в компьютерном знании, со временем оно перетекает в другие области. В связи с этим грань между областями постепенно стирается, а подходы и базы становятся похожи.

Главная проблема нашей сферы заключается в том, что она развивается очень неравномерно. Приведу пример: в Data Science долгое время всё может быть спокойно, а потом кто-то резко придумывает решение, и через короткое время эти прорывные вещи становятся стандартом для всех. В плане работы это и хорошо, и плохо одновременно: с одной стороны, ты постоянно прокачиваешь скиллы и «бежишь» в 10 раз быстрее, чем остальные, с другой стороны, твой профиль работы постоянно меняется.

Планы на будущее. Пока у меня нет понимания, в каких сферах я хочу развиваться дальше. Мне хочется ещё больше погрузиться в то, чем я занимаюсь сейчас.


На YouTube-канале Нетологии рассказали об ошибках искусственного интеллекта и главных проблемах, связанных с его применением.

От редакции Нетологии

Большинство опытных специалистов в ИИ пришли в профессию одним из двух способов:

  • перешли из другой сферы деятельности, профессии;
  • работали по другим специальностям в ИТ, и в какой-то момент погрузились в задачи, связанные с искусственным интеллектом и анализом данных.

В любом случае, даже опытные специалисты непрерывно учатся новому, изучают полезные ресурсы и статьи, проходят курсы повышения квалификации.

Несмотря на то, что российские университеты ещё не внедрили соответствующие образовательные программы, сейчас стать Data Scientist проще, чем во времена героев нашей статьи.

Если вам интересна сфера искусственного интеллекта, машинного обучения и аналитики — приглашаем изучить программы наших курсов «Deep Learning» и «Машинное обучение».


Хотите написать колонку для Нетологии? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.

Оцените статью

Средняя оценка 4.9 / 5. Всего проголосовало 22