Каталог курсов
Избранное

Data Scientist

Освоите профессию с нуля и начнёте работать по специальности через 7 месяцев

Получите возможность пройти стажировку у наших партнёров

Дополнительно сможете освоить специализацию: ML-инженер, CV-инженер или NLP-разработчик

Поможем подобрать обучение
Нажимая кнопку, принимаю условия политики и пользовательского соглашения
Когда
21 марта 2024 — 24 января 2025
Стартует через 2 дня
Не подходит дата старта? Запишитесь сейчас, а учитесь со следующим набором

Формат

Онлайн, потребуется от 10 часов в неделю

Гибкий график

Подберём индивидуальный темп обучения

Документ

Диплом о профессиональной переподготовке

40%
с 16.03 по 19.03

Пока снег исчезает с улиц

Скидка уже включена в стоимость. Оплатите до 19 марта, чтобы скидка не сгорела.

Условия акции

Чем занимается Data Scientist

Дата-сайентисты работают с большими объёмами данных, находят закономерности и делают прогнозы. Они создают модели машинного обучения и нейросети, такие как системы распознавания лиц, голосовые помощники и ChatGPT.

В банковской сфере Data Scientist может спрогнозировать реакцию клиента на кредитное предложение. В ритейле — создать модель, которая будет выбирать удачное место для торговой точки — в зависимости от района, арендной платы и близости конкурентов.

Зарплата Data Scientist

по данным hh.ru в среднем составляет

  • Junior-специалист

    Опыт до 1 года

  • Middle-специалист

    Опыт 1–3 года

  • Senior-специалист

    Опыт более 3 лет

В Data Science есть разные специализации

Вот самые востребованные:

CV-инженер

Работает с изображениями и видео. Например, может создать модель, которая по снимкам предсказывает развитие заболевания

NLP-разработчик

Анализирует и генерирует текст и звуки. Например, создаёт чат-боты и обучает нейросети писать стихи

ML-инженер

Строит модели машинного обучения и внедряет их в продукт. Например, интегрирует на сайт рекомендательную систему для подбора фильмов

Специалисты с профильными знаниями и навыками в каждой из областей ценятся на рынке

На курсе вы сможете углубиться в одну из трёх специализаций, чтобы быстрее развиваться в профессии

Варианты обучения

Мы предлагаем вам пройти базовую программу по Data Science или продвинутую — чтобы сразу получить специализацию

Быстрый старт в профессии

Освоите ключевые навыки: Python и аналитические библиотеки, SQL и математику, машинное обучение и основы нейросетей. Сможете стартовать в профессии на младшей позиции через 7 месяцев обучения

Быстрый старт и развитие в одной из специализаций

Углубитесь в Data Science и освоите одну из трёх специализаций на выбор. После получения специализации сможете претендовать на более высокие позиции

Мы станем вашим надёжным проводником в мир данных

Неважно, чем вы занимались до этого и какой у вас опыт. Программа подойдёт тем, кто начинает с нуля и без технического образования. Мы вас поддержим на этом пути: будем регулярно встречаться на вебинарах, вместе прорабатывать сложные вопросы. Вы сможете учиться в своём темпе — на курсе предусмотрены заморозки и индивидуальные траектории.

Программа курса

Обновлена в 2023 году

Чтобы программа соответствовала запросам рынка труда, мы проводим 3 этапа исследований

Вебинары с экспертами в прямом эфире проходят 1–2 раза в неделю, начинаются между 18:00 и 20:00 МСК

На лекции и практические задания понадобится 10–15 часов в неделю

Записи  вебинаров, митапов и хакатонов, видеолекции, презентации, лонгриды, тесты, тренажёры и другие полезные материалы хранятся в личном кабинете

Базовый тариф. Старт в профессии

Обучение 10 месяцев

Сделаете первые шаги в профессию дата-сайентиста. Научитесь получать данные, очищать и анализировать их с помощью Python, проверять гипотезы и строить модели машинного обучения.

Основы аналитики

Дополнительный модуль

Узнаете, как аналитик формулирует гипотезы и визуализирует результаты исследований. Познакомитесь с базовыми инструментами аналитиков на всех этапах работы с данными: от сбора до построения прогнозных моделей на их основе.

20 часов теории


Что такое аналитическое мышление

Продвинутые Google Таблицы

Откуда берутся данные

Python как инструмент анализа данных

Введение в Google Таблицы

Основы статистики

Продвинутая визуализация данных

Машинное обучение для жизни

SQL и получение данных

Этап 1. Погружение в работу с данными

Научитесь с помощью SQL получать информацию из базы данных, фильтровать, агрегировать, импортировать и экспортировать — без помощи разработчиков.

20 часов теории

32 часа практики

Введение в SQL.Установка и знакомство

Основы SQL

Работа с базой данных PostgreSQL

Основы и работа с базами данных

Углубление в SQL

Python для анализа данных

Этап 1. Погружение в работу с данными

Научитесь получать и очищать данные, находить связи и проверять гипотезы.
Сможете работать с главными аналитическими библиотеками.

66 часов теории

83 часа практики

Основы Python: Jupiter Notebook, комментарии в коде, арифметические операции

Управляющие конструкции и коллекции

Функции и работа с данными, основы парсинга

Работа с файловой системой и модули

Исключения и обработка ошибок

Функции и понятие класса

Регулярные выражения и основы синтаксического разбора

Бонусные видеолекции по Git

Библиотека NumPy: вычислительные задачи

Библиотека Pandas: возможности и оптимизация

Функции и работа с данными

Методы оптимизации pandas

Основы вебскрапинга

Базовые понятия статистики. Изучение данных: статистика и исследовательский анализ

Случайные события. Случайные величины

Корреляция и корреляционный анализ

Задачи классификации и кластеризации

Доверительные интервалы. Статистическая проверка гипотез для несвязанных выборок

Статистическая проверка гипотез для связанных выборок.
A/B тесты и как их проводить 

Математика для анализа данных

Этап 2. Необходимая математика

Освоите математический аппарат Data Science. Начнёте понимать принципы работы существующих методов анализа данных. Сможете выбирать подходящие алгоритмы и корректно интерпретировать результаты.

9 часов теории

37 часов практики

Основные математические понятия для Data Science

Продвинутая линейная алгебра

Математический анализ. Производные функции нескольких переменных

Теория оптимизации

Линейная алгебра. Матрицы

Основы статистики

Математический анализ. Производные функции одной переменной

Продвинутая оптимизация

Теория вероятностей

Работа с признаками и построение моделей

Этап 3. Построение классических ML-моделей

Сможете проверять данные на полноту, целостность, валидность, наличие шумов, ошибок и пропусков. Узнаете, как очищать данные с помощью NumPy и pandas и сокращать размерности данных алгоритмами PCA, LDA, NMF. Научитесь строить деревья решений и модели логистической, линейной и полиномиальной регрессии. Начнёте использовать Random Forest в задачах классификации.

42 часа теории

37 часов практики

Регрессионный анализ. Линейная, полиномиальная и логарифмическая регрессия

Функции потерь и оптимизация

Проблема качества данных

Работа с переменными

Ансамблирование

Feature selection

Алгоритмы кластеризации

Классификация: Логистическая регрессия и SVM

Оценка точности модели, переобучение, регуляризация

Работа с пропусками

Деревья решений

Поиск выбросов и генерация новых признаков

Метрики близости. Работа с текстовыми данными. Наивный Байес

Улучшение качества модели

Введение в нейронные сети

Этап 3. Обучение первых нейросетей

Научитесь строить простые полносвязные сети уровня LeNet и AlexNet и экспериментировать с их обучением. Получите теоретическую и практическую базу для использования нейронных сетей в блоках CV и NLP.  

10 часов теории

6 часов практики

Введение в нейронные сети и библиотеку Keras

Введение в свёрточные нейронные сети

Углубление в нейронные сети и библиотеку Keras

Введение в рекуррентные нейронные сети

Английский для специалистов по работе с данными

Научитесь разбираться в аналитических терминах и читать иностранную техническую документацию. Сможете презентовать результаты анализа с помощью графиков и диаграмм на английском языке. Узнаете, как эффективно готовиться к собеседованиям в зарубежные компании. Научитесь составлять убедительное резюме и писать сопроводительное письмо.

7 часов теории

7 часов практики

Словарь терминов аналитика с примерами употребления и типичными словосочетаниями

Важная лексика для работы с датасетами
Презентация результатов анализа 
Чтение технической документации
Самопрезентация. Elevator Pitch
Прохождение собеседований
Резюме и сопроводительное письмо (CV & сover letter) 
Email-переписка
Общение в технических чатах
Как вести звонки и встречи
Как учить лексику
Как учить грамматику

Программа трудоустройства

Входит в профессию

Поможем с поиском работы.


Объясним, как составить резюме, оформить портфолио и написать сопроводительное письмо так, чтобы попасть на собеседование

Научим самопрезентации и расскажем про самые каверзные вопросы на интервью

Предложим вакансии и стажировки от наших партнёров

Расскажем, как и на каких площадках ищут работу IT-специалисты

Пригласим в сообщество выпускников, чтобы вы делились своими успехами, получали советы и поддержку

Итоговый проект

Можно делать на своих данных

Построите ML-модель для решения ваших текущих профессиональных задач или выполните предложенное итоговое задание.

40 часов практики

Продвинутый тариф. Специализация на выбор

Обучение от 2 до 5 месяцев

После того как освоите базу, сможете углубиться в одно из направлений машинного обучения: работу с текстом и звуком — NLP, изображениями — CV, или научитесь проектировать инфраструктуру для запуска и стабильной работы ML-моделей. Осталось лишь выбрать свою траекторию.

ML-инженер

5 месяцев

Познакомитесь с основным инструментом обработки разных видов данных. Узнаете, что такое оркестратор и какие задачи он решает. Поймёте, как эффективно преобразовывать данные в хранилищах.

64 часа теории

135 часов практики

DevOps: автоматизация развёртывания

Пайплайн разработки ML-моделей

Продвинутые методы работы с данными

MLOps

Data Lake & Hadoop

Работа с потоковыми данными

CV-инженер

2,5 месяца

Освоите основные техники машинного зрения — извлечение признаков, поиск по картинкам, сегментирование, детекция объектов.

22 часа теории

12 часов практики

Введение в компьютерное зрение

Обучение свёрточной сети на практике

Выделение признаков и поиск похожих изображений

Задачи детекции и сегментации

Свёрточные нейронные сети

Рекуррентные нейронные сети в задачах компьютерного зрения: Image Captioning

Сегментация и детекция объектов

Порождающие модели

NLP-разработчик

2,5 месяца

Программа состоит из двух модулей: работа с текстом и звуком.

Освоите морфологический и синтаксический анализ, дистрибутивную семантику и информационный поиск, научитесь снижать размерность в векторной модели, классифицировать, извлекать информацию и генерировать тексты.

Разберёте, как работать со звуком. На практике рассмотрите 5 кейсов, связанных с распознаванием, генерацией, переводом из текста в аудио и обратно, созданием диалоговых систем.

35 часов теории

36 часов практики

Обработка естественного языка:

Введение в автоматическую обработку текста

Тематическое моделирование

Дистрибутивная семантика

Классификация в АОТ

Извлечение информации

Трансформеры. Токенизация: BPE. BERTя

Словари. Подкрепление знаний

Языковые модели

Sequence-to-sequence алгоритмы

Информационный поиск

Синтаксический анализ

Работа со звуком:

Специфика данных и актуальные фреймворки

Извлечение из аудио текста речи, связь с языковыми моделями. SOTA нейронные сети для Speech to text

Проблемы извлечения признаков и современные подходы к их решению

Биометрия голоса. Методы обработки сигналов, распознавание естественной речи, идентификационные признаки голоса, речевые декодеры

Основные методы поиска аудиоинформации

Технологии интеллектуального поиска музыки

Этапы построения систем Text to speech

Технологии на стыке SR и NLP. Основные подходы к созданию диалоговых систем, платформы для создания ИИ-ассистентов

Мини-курсы в подарок — при покупке продвинутого тарифа

Рекомендательные системы

Научитесь строить персонализированные и неперсонализированные рекомендательные системы, а также комбинировать их

Временные ряды

Изучите элементарные алгоритмы обработки временных рядов, модели ARIMA и GARCH, прогнозирование значений на их основе. Узнаете, что такое марковские случайные процессы и марковские модели для временных рядов

Выполните от 10 масштабных проектов для портфолио

Вот только некоторые примеры

SQL

Развернёте и проанализируете базу данных об авиаперевозках

Партнёры по трудоустройству

В процессе обучения сможете пройти стажировку у наших партнёров

Гринатом

IT-интегратор госкорпорации «Росатом». Поддерживает и развивает корпоративные IT-системы, разрабатывает программных роботов, применяет искусственный интеллект и машинное обучение.

40%
с 16.03 по 19.03

Пока снег исчезает с улиц

Скидка уже включена в стоимость. Оплатите до 19 марта, чтобы скидка не сгорела.

Условия акции

Мы регулярно проводим внутренние митапы

Это неформальные встречи выпускников и студентов Нетологии с экспертами и потенциальными работодателями

На них можно узнать, каких специалистов ищут компании, послушать, как проходят собеседования, поделиться опытом, обменяться контактами или найти команду на проект. Также мы разбираем решение сложных задач и обсуждаем тренды.

Митапы проходят раз в две недели по вечерам.

Преподаватели — ведущие эксперты

Как проходит обучение
.01

Изучаете материалы в личном кабинете

Занятия включают в себя видеолекции и вебинары, практические задания, тесты и квизы. Вы занимаетесь по расписанию, но всегда можете вернуться к началу. Записи занятий хранятся в личном кабинете 3 года.

Ваше резюме после обучения

Data Scientist

    Достигнутые результаты

  • Построена полносвязная нейросеть

  • Создан готовый к внедрению ml-проект

  • Проанализирован уровень удовлетворённости сотрудников работой

  • Построена модель LDA, предсказывающая увольнение сотрудника

  • Получен опыт работы с реальными датасетами

  • Использованы аналитические функции SQL для изучения характеристики данных

  • Получено понимание архитектуры и структуры баз данных

  • Построен классификатор изображений

  • Созданы рекомендательные системы для музыкального и киносайтов

    Ключевые навыки

  • Работа с сырыми данными и их подготовка для анализа
  • Создание нейросетей
  • Написание простых SQL-запросов для получения данных 
  • Выбор и реализация алгоритма под задачу 
  • Выбор и создание фич для модели
  • Работа с аналитическими библиотеками numpy, scipy, pandas

  • Группировка и фильтрация данных

  • Автоматизация процессов получения данных для отчётов

  • Генерация текстов и изображений

  • Создание рекомендательных систем

Инструменты, которые вы освоите

scikit-learn

scikit-learn

Базовая библиотека в Python для построения алгоритмов машинного обучения

PostgreSQL

PostgreSQL

Одна из самых популярных реляционных баз данных с открытым исходным кодом. На её основе работает множество приложений для анализа геопространственных данных и мобильных приложений

Tensorflow

Tensorflow

Открытая программная библиотека для машинного обучения, разработанная компанией Google для решения задач построения и тренировки нейронной сети

Pandas

Pandas

Наиболее продвинутая и быстроразвивающаяся библиотека для обработки и анализа данных в Python

DBeaver

DBeaver

Универсальный инструмент для управления базами данных

Keras

Keras

Открытая нейросетевая библиотека на языке Python

Numpy

Numpy

Библиотека для математических исчислений

OpenCV

OpenCV

Библиотека алгоритмов компьютерного зрения, обработки изображений и численных алгоритмов общего назначения с открытым кодом. Мы будем использовать её на Python

NLTK

NLTK

Набор библиотек и программ Python для символьной и статистической обработки естественного языка

Вs4 (Beautiful Soup)

Вs4 (Beautiful Soup)

Библиотека для извлечения данных из файлов HTML и XML

PyTorch

PyTorch

Библиотека глубокого обучения для решения задач компьютерного зрения и NLP

Docker (на траектории ML-инженер)

Docker (на траектории ML-инженер)

Популярная программа для автоматизации, развёртывания и управления приложениями в средах с поддержкой контейнеризации

Вашу квалификацию подтвердит диплом о профессиональной переподготовке

Мы обучаем по государственной лицензии и выдаём документ установленного образца, который можно показать работодателю.

Выгодно презентовать себя также поможет характеристика с рекомендательным письмом от эксперта.

Поможем найти
ту самую работу
Центр развития карьеры
помогает трудоустроиться студентам Нетологии
1
Научим составлять резюме и проходить интервью
Разберём ваш предыдущий опыт, определим сильные стороны и поможем составить успешное резюме. Научим презентовать себя и проведём тест-драйв интервью.
2
Поможем наработать практику и оформить портфолио
Приобретёте практический опыт и наполните портфолио ещё во время обучения. Разберёте тестовые задания от работодателей и сможете принять участие в их проектах.
3
Предложим стажировки и проекты от партнёров
Предоставим доступ к карьерной странице со стажировками и вакансиями от партнёров Нетологии. Будем делиться подборками с новыми интересными вакансиями.
header
Воркшопы и много практики
Вы сможете сформировать портфолио, выполняя задания компаний-партнёров Нетологии или проходя у них стажировки. Сфокусируетесь на практике, откликах и результате. Поработаете над реальными заданиями, защитите свои решения и получите развивающую обратную связь.
84%
студентов нашли работу с помощью Центра развития карьеры
4 075
компаний-партнёров в базе Нетологии для отработки практики
skyenglamodaramblerraiffeisenvkozonagimakasperskyalfa2gisgettaic

Предложение для компаний

Вы можете обучить сотрудников на этом курсе. Адаптируем программу под ваш бизнес и предоставим отчёты об успеваемости. При обучении сразу нескольких сотрудников — более выгодная стоимость.

Оставьте заявку, и мы вышлем вам индивидуальное предложение.

Вернём деньги, если обучение не подойдёт

Деньги можно вернуть в любой момент. В течение первых трёх занятий вернём вам полную сумму, а начиная с четвёртого — рассчитаем сумму возврата или поможем выбрать другой курс взамен.

Подробные условия

40%
с 16.03 по 19.03

Пока снег исчезает с улиц

Скидка уже включена в стоимость. Оплатите до 19 марта, чтобы скидка не сгорела.

Условия акции
10 месяцев обучения, старт 21 марта
Запишитесь на курс или получите консультацию
Частями без переплат
3 216 ₽/месяц
5 361 на 36 месяцев
Одним платежом
со скидкой 5%
110 000
 ₽
193 000
-40%
акция действует
до 19 марта
Нажимая кнопку, принимаю условия политики и пользовательского соглашения
Нашли дешевле? Сделаем скидку
Вернём деньги, если обучение не подойдёт
Возможность получить налоговый вычет — 13%
10 месяцев обучения, старт 21 марта
Data Scientist
Частями без переплат
3 216 ₽/месяц
5 361 на 36 месяцев
Одним платежом
со скидкой 5%
110 000
 ₽
193 000
-40%
акция действует
до 19 марта
Нашли дешевле? Сделаем скидку
Вернём деньги, если обучение не подойдёт
Возможность получить налоговый вычет — 13%
Запишитесь на курс или получите консультацию
Нажимая кнопку, принимаю условия политики и пользовательского соглашения

Расширенная программа «Data Scientist: расширенный курс»

Вы освоите продвинутые технологии работы с нейросетями и большими данными. На выходе станете универсальным специалистом.

• Сможете строить модели машинного обучения, в том числе рекомендательные системы и временные ряды, работать с изображениями и текстом

• Плавный вход: основы аналитики и визуализации, статистика в Google Таблицах

• Участие в соревновании Kaggle с ментором, что даст преимущество при трудоустройстве

Отвечаем на вопросы

  • Я гуманитарий, смогу ли учиться на дата-сайентиста?

  • Я плохо знаю математику. Получится ли у меня освоить профессию?

  • Смогу ли я найти работу дата-сайентистом после обучения на этой программе?

  • Я уже слишком взрослый, чтобы менять профессию. До скольки лет можно учиться аналитике и Data Science?