Пользуясь нашим сайтом, вы соглашаетесь с тем, что мы используем cookies
Фоновое изображение

Data Scientist

Научитесь преобразовывать сырые данные в полезную информацию для принятия стратегических решений
Когда
28 октября 2020 — 31 октября 2021
Формат обучения

Вебинары и очные лекции в Москве

Акция

Первый платёж через полгода

документ

Диплом о профессиональной переподготовке

40%
с 15.10 по 25.10

Горящие туры к переменам

Скидка уже включена в стоимость.

Оплатите до 25 октября, чтобы скидка не сгорела.

Условия акции

Лучшая онлайн-программа по Data Science в 2019 году

Онлайн-университет «Нетология» с программой «Профессия Data Scientist» в 2019 году получил премию «Знак качества» в номинации «Подготовка профессионалов цифровой индустрии».

Обучение на курсе поможет вам

Перейти в профессию с высоким окладом, которая не устареет через 10 лет

Положите начало своему развитию в востребованной во всех отраслях бизнеса профессии

Освоить ключевые технологии и опередить запрос рынка

Станете востребованным специалистом сразу после обучения и не растеряете накопленные знания и навыки

Прожить опыт 2-3 лет самостоятельного изучения сферы Data Science

Получите знания в концентрированном формате и с обратной связью от экспертов-практиков ведущих компаний

А ещё вы получите

Больше 10 кейсов в портфолио

Выполните 80 домашних работ с фидбеком эксперта, а также онлайн-лабораторные и тесты

Доступ в профессиональные сообщества

Поможем вам найти единомышленников и будущих коллег

Помощь в трудоустройстве

Поможем составить резюме, подготовиться к собеседованию, проконсультируем по релокации

Чем занимается Data Scientist

Data Scientist создаёт и обучает предиктивные модели с помощью алгоритмов машинного обучения и нейросетей, помогая бизнесу находить скрытые закономерности, прогнозировать развитие событий и оптимизировать ключевые бизнес-процессы.

Кому будет полезен этот курс

Новичкам в Data Science

С нуля овладете знаниями и навыками, необходимыми для работы Data Scientist, и получите новую востребованную профессию.

Разработчикам

Курс даёт хорошую базу для перехода из программирования в Data Science и анализ больших данных. Вас ждёт много практической работы, разбор кейсов и новые полезные знакомства.

Аналитикам

Вы научитесь извлекать максимум из больших массивов данных для быстрой проверки гипотез и построения прогнозов. Систематизируете знания и углубитесь в сферу Data Science.

Чему вы научитесь

Работать SQL

Научитесь писать запросы, работать с данными в базе без переноса в таблицы, загружать данные и сохранять историю, работать с разными форматами файлов

Использовать Python и библиотеки

Автоматизировать работу с большими массивами, получать данные из внешних источников, обосновывать выводы, сделанные на основании данных

Проверять данные и определять проблемы

Обрабатывать текстовые данные, чтобы передавать их в алгоритмы машинного обучения, генерировать новые значимые признаки

Строить модели машинного обучения

Быстро строить модели и проверять гипотезы, строить рекомендательную систему и нейронную сеть, выявлять скрытые аномалии в данных

Применять математику

Освоите необходимый математический аппарат для продуктивной работы с моделями данных, машинным обучением и нейронными сетями

Лидировать DS-проект

Структурировать результаты, формулировать гипотезы, выявлять потребности, находить области применения машинного обучения

Вас ждёт много практики

  • Практика на занятии

    Написание кода — ошибки и проблемы преподаватель разбирает прямо на занятии
    1
  • Домашние работы

    Преподаватель даёт фидбек и рекомендации по работе, можно переделать работу до отличного результата

    2
  • Лабораторные работы

    Решение комплексного кейса по каждому тематическому блоку

    3
  • Проектные работы

    Работа, выполнение которой влияет на  допуск к защите дипломного проекта

    4

И главное

  • 1
  • 2
  • 3
  • 4

Дипломный проект

Создание собственной модели машинного обучения — в сопровождении ментора, который выбирает ваш проект и заинтересован в успешной защите

Финальный хакатон

Групповая работа с одногруппниками по решению кейса — 5 часов с перерывом на пиццу

Сомневаетесь, что вам подойдёт профессия Data Scientist?

Скачайте бесплатный пошаговый план от специалистов онлайн-университета Нетология «С чего начать погружение в сферу работы с данными».

Структура программы

Часть 1. Получение и подготовка данных (SQL и Python)

Программа построена от простого к сложному. Первый модуль научит вас понимать, где взять данные, и находить между ними связи. 

Узнаете, как писать SQL запросы, чтобы получать данные из хранилищ — и не тратить время разработчиков или администраторов на поиск информации. 

Научитесь быстро создавать материалы исследований, чтобы получать инсайты для принятия решений. Познакомитесь с основами статистических проверок гипотез — чтобы больше ни один вывод не был сделан «потому что так было всегда» или «так кажется».

Часть 2. Обработка данных и создание признаков для моделей (Feature Engineering)

Научитесь проверять данные на полноту, целостность, наличие шумов, ошибок, выбросов и пропусков и работать с проблемами, делая качество предсказаний достаточным для принятия решений. Обрабатывать текстовые данные, чтобы передавать их в алгоритмы машинного обучения и экономить время заказчика. 

Строить деревья решений, модель логистической регрессии, использовать Random Forest в задачах классификации, строить линейную и полиномиальную регрессию — одним словом, знать где применять и что ожидать от работающих и математически обоснованных методов решения бизнес-задач.

Часть 3. Суперсила: машинное обучение для 5 ключевых областей применения

В этом модуле вы научитесь строить рекомендательную систему, чтобы решить проблему нехватки данных, возвращать клиентов и увеличивать средний чек.

Решать задачу распознавания и преобразования изображений, чтобы узнавать наиболее привлекательные товары на полках. 

Выделять признаки для анализа изображений: лиц, почерка, особенностей предметов, чтобы конвертировать рукописный текст в электронный или узнавать постоянных покупателей. 

Обучать нейронную сеть там, где стандартным машинным обучением уже не обойтись.

Полная программа курса

SQL и получение данных
В идеальном мире data scientist получает готовые данные, чтобы строить модели, но мир неидеален. Вы научитесь с помощью SQL получать данные из БД, фильтровать, агрегировать, а также импортировать и экспортировать.
В идеальном мире data scientist получает готовые данные, чтобы строить модели, но мир неидеален. Вы научитесь с помощью SQL получать данные из БД, фильтровать, агрегировать, а также импортировать и экспортировать.
Архитектура и структура баз данных (БД)
Простые запросы, join`ы, агрегаты
Базовые команды в SQL и встроеные аналитические функции
Импорт и экспорт данных посредством SQL и ETL программ
Принципы работы с разными конкретными БД
Основные библиотеки для подключения к БД из Python
Функции SQL и их аналоги в pandas
Подготовка и сдача итогового проекта
10 часов теории25 часа практики
Навыки, которые вы получите
составление SQL запросов к БД
создание новых таблиц с помощью джоинов
группировка и фильтрация данных из БД
импорт и экспорт данных в БД
изучение характеристик данных с помощью аналитических функций SQL
использование PostgreSQL, MongoDB
подключение к БД из Python
работа с разными форматами файлов

Python, статистика и математика для анализа данных

Вы научитесь пользоваться базовыми инструментами и подходами в Python, чтобы начать работать с данными. Повторите основы линейной алгебры, теории множеств, методов математической оптимизации, описательной статистики, статистического анализа данных, а также научитесь реализовывать это на языке Python.
Вы научитесь пользоваться базовыми инструментами и подходами в Python, чтобы начать работать с данными. Повторите основы линейной алгебры, теории множеств, методов математической оптимизации, описательной статистики, статистического анализа данных, а также научитесь реализовывать это на языке Python.
Основы Python и Git (арифметика)
Базовые типы данных и циклы
Функции и классы
Продвинутые типы данных: массивы, множества, словари
Python для анализа данных: numpy и scipy
Python для анализа данных: pandas
Лабораторная работа по Python
Основы линейной алгебры и теории множеств + реализация в Python
Методы математической оптимизации + реализация в Python
Основы описательной статистики + реализация в Python
Статистический анализ данных + реализация в Python
Лабораторная работа по матстатистике
Подготовка и сдача итогового проекта
20 часов теории30 часов практики
Навыки, которые вы получите
работа в Jupyter-ноутбук
работа с pandas в таблицах
работать с матрицами и векторами в python
понимание основных математических понятий, лежащих в основе анализа данных
работа с библиотекой numpy
понимание основ описательной статистики
проведение основных статистических тестов (z-test, f-test, chi-2 test)
проектирование экспериментов
Feature engineering и предобработка данных
Когда данные получены, нужно изучить их, выявить закономерности, а также подготовить для создания модели. Вы научитесь визуализировать данные, проверять их на целостность, валидность, полноту, очищать от шумов, пропущенных значений, работать с размерностью, а также создавать фичи для моделей.
Когда данные получены, нужно изучить их, выявить закономерности, а также подготовить для создания модели. Вы научитесь визуализировать данные, проверять их на целостность, валидность, полноту, очищать от шумов, пропущенных значений, работать с размерностью, а также создавать фичи для моделей.
Выбор способа визуализации под задачу
Инструменты matplotlib, seaborn для визуализации
Проверка и очищение данных с помощью pandas и numpy
Проведение одномерного и рекурсивного Feature Selection и Feature Selection на базе моделей
Методы оценки значимости и отбора признаков и их использование
«Проклятие размерности», основные алгоритмы и принципы их работы
Использование алгоритмов sklearn
15 часов теории22 часа практики
Навыки, которые вы получите
визуализация данных с помощью библиотек seaborn, plotly
описание основных проблемы данных
проверка данных на полноту, целостность, валидность, наличие шумов, ошибок и пропусков
очистка данных с помощью numpy и pandas
сокращение размерности данных алгоритмами PCA, LDA, NMF

Математика для анализа данных

Чтобы увидеть в больших объёмах данных закономерности, аналитик опирается на линейную алгебру, математический анализ и теорию вероятности. Если специалист не разбирается в этих направлениях — гипотезы и выводы будут неточными.

Чтобы увидеть в больших объёмах данных закономерности, аналитик опирается на линейную алгебру, математический анализ и теорию вероятности. Если специалист не разбирается в этих направлениях — гипотезы и выводы будут неточными.

Линейная алгебра

Математический анализ

Теория вероятности

18 часов теории

18 часов практики

Навыки, которые вы получите

основные операции с векторами и их реализация в python

матричные операции

матрицы как инструмент преобразования пространства

генетические алгоритмы, алгоритм дифференциальной эволюции

определение вероятности, свойства вероятности

математическое ожидание, дисперсия и моменты старших порядков

центральная предельная теорема

закон больших чисел

Построение модели
Вы научитесь строить основные модели обучения с учителем и без, а также ансамбли моделей. Кроме этого, сможете подбирать метрики, чтобы оценивать качество модели, итерационно повышать его и бороться с переобучением.
Вы научитесь строить основные модели обучения с учителем и без, а также ансамбли моделей. Кроме этого, сможете подбирать метрики, чтобы оценивать качество модели, итерационно повышать его и бороться с переобучением.
Линейные методы, логистическая регрессия и SVM
Деревья решений
Линейная и полиноминальная регрессия
Алгоритмы кластеризации
Способы повышения качества модели

Функции потерь и оптимизация
Оценка точности модели, борьба с переобучением, регуляризация
Улучшение качества модели
40 часов теории21 час практики
Навыки, которые вы получите
построение деревьев решений
построение моделей логистической, линейной и полиноминальной регрессии
использование Random Forest в задачах классификации
использование алгоритмов кластеризации, построение ансамблей моделей
оценка точности модели и работа с переобучением
использование GridSearch и RandomizedSearch, Model Specific CV, Out of Bag approach

Менеджмент data-проектов

Вы научитесь планировать разработку data science-проектов, а также грамотно рассказывать заказчикам о результатах исследований.
Вы научитесь планировать разработку data science-проектов, а также грамотно рассказывать заказчикам о результатах исследований.
Организация проекта
Составление отчётов по исследованиям
2 часа теории6 часов практики
Навыки, которые вы получите
структурное отражение результатов работы
владение методологиями управления data-science проектами
формулирование идей и гипотез
выбор подходящих методов и алгоритмов
планирование решения задачи
Рекомендательные системы
В этом и следующих блоках вы будете применять полученные знания в разных областях машинного обучения. Во время этого блока научитесь строить персонализированные и неперсонализированные рекомендательные системы, а также комбинировать их.
В этом и следующих блоках вы будете применять полученные знания в разных областях машинного обучения. Во время этого блока научитесь строить персонализированные и неперсонализированные рекомендательные системы, а также комбинировать их.
Неперсонализированные рекомендательные системы
Сontent-based-рекомендации
Collaborative Filtering
Гибридные алгоритмы
12 часов теории8 часов практики
Навыки, которые вы получите
построение универсальной рекомендательной системы на основе содержания рекомендуемых объектов
построение user-based и item-based коллаборативных моделей
построение production-scale рекомендательных моделей с помощью пакета implicit
построение рекомендательных систем, менее подверженных проблеме холодного старта
создание рекомендательных сервисов, отвечающих на запросы пользователей
Распознавание изображений, машинное зрение
Вы освоите основные техники машинного зрения — извлечение признаков, поиск по картинкам, сегментирование, детекция объектов — а также научитесь строить нейросети.
Вы освоите основные техники машинного зрения — извлечение признаков, поиск по картинкам, сегментирование, детекция объектов — а также научитесь строить нейросети.
Поиск по картинкам
Сегментация изображений, детекция объектов
Применение свёрточных нейронных сетей для задач сегментации и детекции
Применение рекуррентных сетей в задачах обработки изображений
Генеративные конкурирующие сети (GAN)
20 часов теории12 часов практики
Навыки, которые вы получите
сегментировать изображения
искать похожие картинки по контенту
создавать fine-tuning сети
определять положение и форму объекта, отделять его от фона с помощью свёрточных нейросетей
распознавать текст на изображении
генерировать изображения
Обработка естественного языка (NLP)
Вы освоите морфологический и синтаксический анализ, дистрибутивную семантику и информационный поиск, научитесь снижать размерность в векторной модели, классифицировать, извлекать информацию и генерировать тексты.
Вы освоите морфологический и синтаксический анализ, дистрибутивную семантику и информационный поиск, научитесь снижать размерность в векторной модели, классифицировать, извлекать информацию и генерировать тексты.
Морфологический и синтаксический анализ

Методы снижения размерности в векторной модели. Информационный поиск
Тематическое моделирование (LSA, LDA, HDP)
Дистрибутивная семантика (word2vec, GloVe, AdaGram)
Счётные языковые модели и вероятностные языковые модели. LSTM. Машинный перевод
Генерация текстов (Natural Language Generation)
Задача классификации в АОТ
18 часов теории10 часов практики
Навыки, которые вы получите
вычисление частоты слов и определение части речи, классификация текстов
работа с деревьями зависимостей
обучение и визуализация тематических моделей и моделей дистрибутивной семантики
использование языковых моделей для генерации текстов
разработка простых чат-ботов
размещение данных на Яндекс.Толоке
Итоговый хакатон
Завершим обучение состязанием с товарищами по курсу: в составе мини-команды, за ограниченное время и на основе датасетов крупных игроков рынка, вам придётся решать задачи по прогнозированию продаж или оптимизации производства, задействуя все знания и навыки, полученные на курсе.
Интеграция и использование machine learning решений в бизнесе, как правило, подразумевает командную игру, поэтому хакатон полезен ещё и как тренировка необходимых soft skills.
Завершим обучение состязанием с товарищами по курсу: в составе мини-команды, за ограниченное время и на основе датасетов крупных игроков рынка, вам придётся решать задачи по прогнозированию продаж или оптимизации производства, задействуя все знания и навыки, полученные на курсе.
Интеграция и использование machine learning решений в бизнесе, как правило, подразумевает командную игру, поэтому хакатон полезен ещё и как тренировка необходимых soft skills.
8 часов практики
Дипломная работа
В рамках дипломного проекта вы сможете построить ML-модель для решения своих текущих профессиональных задач: это может быть система прогнозирования продаж, распознавание объектов на фото или видео, анализ временных рядов, анализ больших объёмов текста и т. д.
Если в моменте у вас нет идей для своего проекта (или доступа к необходимым данным), мы предложим вам учебный кейс в интересной вам области на основе реального датасета других компаний.

Дипломная работа выполняется самостоятельно под руководством экспертов курса и позволяет закрепить весь спектр знаний и навыков, полученных на программе.

В рамках дипломного проекта вы сможете построить ML-модель для решения своих текущих профессиональных задач: это может быть система прогнозирования продаж, распознавание объектов на фото или видео, анализ временных рядов, анализ больших объёмов текста и т. д.
Если в моменте у вас нет идей для своего проекта (или доступа к необходимым данным), мы предложим вам учебный кейс в интересной вам области на основе реального датасета других компаний.

Дипломная работа выполняется самостоятельно под руководством экспертов курса и позволяет закрепить весь спектр знаний и навыков, полученных на программе.

60 часов практики

Если вы уже прошли курс, входящий в профессию, учитесь дальше со скидкой в размере стоимости курса

Остались вопросы? Запишитесь на консультацию по программе обучения

Как проходит обучение

  • Занятия онлайн и в Кампусе

    Учитесь в своем темпе, если так комфортнее. Мы подготовили гибкие форматы обучения: видеолекции, статьи, вебинары, индивидуальные и групповые задания.

    1
  • Практика

    Вас ждут домашние, лабораторные и финальные работы после модулей, а также дипломный проект. Если мало — дадим индивидуальные задания.

    2
  • Сопровождение

    Кураторы, аспиранты и эксперты программы всегда на связи в закрытом студенческом канале курса. Также предусмотрены 4 персональные консультации с ментором.
    3
  • Дипломная работа

    Пройдёте все этапы: от проектирования модели данных до реализации пайплайна в облачной среде и упаковки в него искусственного интеллекта.
    4

Факультет Нетологии «Аналитика и Data Science» — обладатель «Премии Рунета» в номинации «Образование и кадры» в 2019 году

Учитесь у лучших экспертов

Преподаватель

Алексей Кузьмин

Технический директор и Data Scientist в ДомКлик.ру. В ABBYY занимался распознаванием языков со сложной письменностью

Руководит направлением машинного обучения и работы с данными

Научу вас понимать принципы, лежащие в основе DS. Мир меняется, конкретные модели и алгоритмы — тоже, а принципы остаются неизменными. Опираясь на них, вы сможете провести качественное исследование или построить модель — как сейчас, так и в будущем.

Научу вас понимать принципы, лежащие в основе DS. Мир меняется, конкретные модели и алгоритмы — тоже, а принципы остаются неизменными. Опираясь на них, вы сможете провести качественное исследование или построить модель — как сейчас, так и в будущем.

Олег Булыгин
IT-аудитор в Сбербанке
Константин Башевой
Яндекс, аналитик-разработчик
Вячеслав Мурашкин
Data Scientist в Google
Ирина Хомутова
Разработчик в Eltex LTD
Алексей Кузьмин
Директор разработки в ДомКлик.ру
Константин Гусев
Старший аналитик-моделист в Bi.zone (кибер-безопасность), Ех-аналитик в McKinsey & Co.
Юстина Иванова
Специалист по анализу данных в ОЦРВ
Денис Кирьянов
Сбербанк, руководитель направления
Артур Сапрыкин
Data Scientist
Олег Булыгин
IT-аудитор в Сбербанке

Учиться онлайн дешевле

Мы впервые даём возможность пройти программу исключительно в онлайн-формате. Лекции и воркшопы будут проходить два раза в неделю на учебной платформе: сможете участвовать онлайн или смотреть записи в удобное время.

Важная часть программы, помимо обучения, — это общение и нетворкинг. Обучаясь онлайн, вы сможете обмениваться идеями в закрытой учебной группе в Slack и получать быстрые ответы от экспертов-преподавателей. Чтобы вы быстрее нашли работу, предусмотрены персональные и групповые консультации с Центром развития карьеры и карьерным коучем.

Очный формат остаётся доступен для третьего модуля — о машинном обучении.

Что говорят о программе выпускники

Алексей Миронов
Ведущий инженер по разработке в  Data Science, ДомКлик

Что вы получите в результате обучения

Data Scientist
Достигнутые результаты
Построена полносвязная нейросеть
Создан чат-бот для поиска авиабилетов
Построен классификатор изображений
Созданы рекомендательные системы для музыкального и киносайта
Создан готовый к внедрению ml-проект
Ключевые навыки
Сбор и подготовка данных для анализа

Создание нейросетей
Генерация текстов и изображений

Создание рекомендательных систем

Выбор и реализация алгоритма под задачу
Выбор и создание фич для модели
Инструменты, которые вы освоите

scikit-learn

Базовая библиотека в Python для построения алгоритмов машинного обучения.
Вашу квалификацию подтвердят документы установленного образца

Мы поможем с трудоустройством

Курс входит в программу трудоустройства Центра развития карьеры. Вас ждут hr-консультации, практические задания и сопровождение по поиску работы
Оформите резюме и сопроводительное письмо
Научитесь выгодно презентовать свои сильные стороны, чтобы получать больше откликов компаний
Узнаете, как найти работу
Познакомитесь с площадками для поиска работы, получите доступ к бирже проектов Нетологии, стажировкам и вакансиям партнёров
Подготовитесь к собеседованию
Научитесь рассказывать о себе последовательно и без стресса, правильно реагировать на вопросы работодателя и завершать беседу
Создадите портфолио
Научитесь оформлять портфолио так, чтобы работодателю было удобно изучать ваши работы и у него осталось хорошее впечатление
Научитесь работать на себя
Узнаете, где искать первых заказчиков, как выстраивать с ними коммуникацию и защитить свои права
Мы помогаем нашим выпускникам получитьстажировку и работу в ведущих компаниях
Рамблер
Mail.ru
Лаборатория Касперского
Агима
Skyeng
Билайн
Ламода
и многих других

И ещё немного отзывов

Ксения Михайлова
ПАО Сбербанк, старший инженер по разработке
Программа была очень насыщенной. Получила те знания, которые и ожидала. Очень довольна, что прошла обучение на курсе. Хотела поменять профессию. Преподаватели отличные, за редким исключением. Удобно, что можно и офлайн, и онлайн лекции смотреть. Ещё круто, что возникающие вопросы решаются и навстречу тебе идут.
Ксения Михайлова
ПАО Сбербанк, старший инженер по разработке
Программа была очень насыщенной. Получила те знания, которые и ожидала. Очень довольна, что прошла обучение на курсе. Хотела поменять профессию. Преподаватели отличные, за редким исключением. Удобно, что можно и офлайн, и онлайн лекции смотреть. Ещё круто, что возникающие вопросы решаются и навстречу тебе идут.
40%
с 15.10 по 25.10

Горящие туры к переменам

Скидка уже включена в стоимость.

Оплатите до 25 октября, чтобы скидка не сгорела.

Условия акции
Оставьте заявку на обучение
При оплате частями
от5 000 ₽ / мес.
Одним платежом
120 000 ₽
200 000 ₽
До 25 октября скидка 80 000 ₽
У меня есть промокод
Нажимая кнопку, принимаю условия политики и пользовательского соглашения
Уже есть аккаунт? Войти
Как учиться сейчас, а платить потом?
На этот курс действует акция: первый платеж через 6 месяцев. Уточните подробности у нашего менеджера. Срок действия акции до 31 июля.
Как оплатить частями?
Мы предоставляем беспроцентный кредит от Тинькофф или Сбербанка. Вы разделите платеж и ничего не переплатите
Оплатить от юрлица
Запишитесь на курс от имени того, кто будет учиться, а затем выберите способ оплаты «По счету от юрлица»
Сэкономьте еще 13%
Вы можете вернуть 13% денег через налоговый вычет. Спросите об этом менеджера, когда запишетесь на курс, или прочитайте в нашей статье
Есть еще вопросы?
Звоните нам 8 (800) 301-39-69
Открыть урок
Свернуть