Профессия

Data Scientist

Научитесь строить и обучать предиктивные модели
с помощью алгоритмов машинного обучения и нейросетей
Когда
9 сентября 2019 — 16 июля 2020
Формат обучения
Онлайн-вебинары и очные лекции в Москве
МЕСТО ПРОВЕДЕНИЯ
Кампус Нетологии
Запишитесь на курс и получите консультацию по программе обучения
170 000 ₽200 000 ₽
полная стоимость курса
от 16 667 ₽ / месяц
оплата частями
Data Scientist создаёт и обучает предиктивные модели с помощью алгоритмов машинного обучения и нейросетей, помогая бизнесу находить скрытые закономерности, прогнозировать развитие событий и оптимизировать ключевые бизнес-процессы.
~140 000 ₽
средняя зарплата Data Scientist (по данным hh.ru)

Программа курса

SQL и получение данных
В идеальном мире data scientist получает готовые данные, чтобы строить модели, но мир неидеален. Вы научитесь с помощью SQL получать данные из БД, фильтровать, агрегировать, а также импортировать и экспортировать.
В идеальном мире data scientist получает готовые данные, чтобы строить модели, но мир неидеален. Вы научитесь с помощью SQL получать данные из БД, фильтровать, агрегировать, а также импортировать и экспортировать.
Архитектура и структура баз данных (БД)
Простые запросы, join`ы, агрегаты
Базовые команды в SQL и встроеные аналитические функции
Импорт и экспорт данных посредством SQL и ETL программ
Принципы работы с разными конкретными БД
Основные библиотеки для подключения к БД из Python
Функции SQL и их аналоги в pandas
Подготовка и сдача итогового проекта
10 часов теории25 часа практики
Навыки, которые вы получите
составление SQL запросов к БД
создание новых таблиц с помощью джоинов
группировка и фильтрация данных из БД
импорт и экспорт данных в БД
изучение характеристик данных с помощью аналитических функций SQL
использование PostgreSQL, MongoDB
подключение к БД из Python
работа с разными форматами файлов
Python и математика для анализа данных
Вы научитесь пользоваться базовыми инструментами и подходами в Python, чтобы начать работать с данными. Повторите основы линейной алгебры, теории множеств, методов математической оптимизации, описательной статистики, статистического анализа данных, а также научитесь реализовывать это на языке Python.
Вы научитесь пользоваться базовыми инструментами и подходами в Python, чтобы начать работать с данными. Повторите основы линейной алгебры, теории множеств, методов математической оптимизации, описательной статистики, статистического анализа данных, а также научитесь реализовывать это на языке Python.
Основы Python и Git (арифметика)
Базовые типы данных и циклы
Функции и классы
Продвинутые типы данных: массивы, множества, словари
Python для анализа данных: numpy и scipy
Python для анализа данных: pandas
Лабораторная работа по Python
Основы линейной алгебры и теории множеств + реализация в Python
Методы математической оптимизации + реализация в Python
Основы описательной статистики + реализация в Python
Статистический анализ данных + реализация в Python
Лабораторная работа по матстатистике
Подготовка и сдача итогового проекта
20 часов теории30 часов практики
Навыки, которые вы получите
работа в Jupyter-ноутбук
работа с pandas в таблицах
работать с матрицами и векторами в python
понимание основных математических понятий, лежащих в основе анализа данных
работа с библиотекой numpy
понимание основ описательной статистики
проведение основных статистических тестов (z-test, f-test, chi-2 test)
проектирование экспериментов
Feature engineering и предобработка данных
Когда данные получены, нужно изучить их, выявить закономерности, а также подготовить для создания модели. Вы научитесь визуализировать данные, проверять их на целостность, валидность, полноту, очищать от шумов, пропущенных значений, работать с размерностью, а также создавать фичи для моделей.
Когда данные получены, нужно изучить их, выявить закономерности, а также подготовить для создания модели. Вы научитесь визуализировать данные, проверять их на целостность, валидность, полноту, очищать от шумов, пропущенных значений, работать с размерностью, а также создавать фичи для моделей.
Выбор способа визуализации под задачу
Инструменты matplotlib, seaborn для визуализации
Проверка и очищение данных с помощью pandas и numpy
Проведение одномерного и рекурсивного Feature Selection и Feature Selection на базе моделей
Методы оценки значимости и отбора признаков и их использование
«Проклятие размерности», основные алгоритмы и принципы их работы
Использование алгоритмов sklearn
15 часов теории22 часа практики
Навыки, которые вы получите
визуализация данных с помощью библиотек seaborn, plotly
описание основных проблемы данных
проверка данных на полноту, целостность, валидность, наличие шумов, ошибок и пропусков
очистка данных с помощью numpy и pandas
сокращение размерности данных алгоритмами PCA, LDA, NMF
Построение модели
Вы научитесь строить основные модели обучения с учителем и без, а также ансамбли моделей. Кроме этого, сможете подбирать метрики, чтобы оценивать качество модели, итерационно повышать его и бороться с переобучением.
Вы научитесь строить основные модели обучения с учителем и без, а также ансамбли моделей. Кроме этого, сможете подбирать метрики, чтобы оценивать качество модели, итерационно повышать его и бороться с переобучением.
Линейные методы, логистическая регрессия и SVM
Деревья решений
Линейная и полиноминальная регрессия
Алгоритмы кластеризации
Способы повышения качества модели

Функции потерь и оптимизация
Оценка точности модели, борьба с переобучением, регуляризация
Улучшение качества модели
40 часов теории21 час практики
Навыки, которые вы получите
построение деревьев решений
построение моделей логистической, линейной и полиноминальной регрессии
использование Random Forest в задачах классификации
использование алгоритмов кластеризации, построение ансамблей моделей
оценка точности модели и работа с переобучением
использование GridSearch и RandomizedSearch, Model Specific CV, Out of Bag approach
Работа с заказчиком
Вы научитесь планировать разработку data science-проектов, а также грамотно рассказывать заказчикам о результатах исследований.
Вы научитесь планировать разработку data science-проектов, а также грамотно рассказывать заказчикам о результатах исследований.
Организация проекта
Составление отчётов по исследованиям
2 часа теории6 часов практики
Навыки, которые вы получите
структурное отражение результатов работы
владение методологиями управления data-science проектами
формулирование идей и гипотез
выбор подходящих методов и алгоритмов
планирование решения задачи
Рекомендательные системы
В этом и следующих блоках вы будете применять полученные знания в разных областях машинного обучения. Во время этого блока научитесь строить персонализированные и неперсонализированные рекомендательные системы, а также комбинировать их.
В этом и следующих блоках вы будете применять полученные знания в разных областях машинного обучения. Во время этого блока научитесь строить персонализированные и неперсонализированные рекомендательные системы, а также комбинировать их.
Неперсонализированные рекомендательные системы
Сontent-based-рекомендации
Collaborative Filtering
Гибридные алгоритмы
12 часов теории8 часов практики
Навыки, которые вы получите
построение универсальной рекомендательной системы на основе содержания рекомендуемых объектов
построение user-based и item-based коллаборативных моделей
построение production-scale рекомендательных моделей с помощью пакета implicit
построение рекомендательных систем, менее подверженных проблеме холодного старта
создание рекомендательных сервисов, отвечающих на запросы пользователей
Распознавание изображений, машинное зрение
Вы освоите основные техники машинного зрения — извлечение признаков, поиск по картинкам, сегментирование, детекция объектов — а также научитесь строить нейросети.
Вы освоите основные техники машинного зрения — извлечение признаков, поиск по картинкам, сегментирование, детекция объектов — а также научитесь строить нейросети.
Поиск по картинкам
Сегментация изображений, детекция объектов
Применение свёрточных нейронных сетей для задач сегментации и детекции
Применение рекуррентных сетей в задачах обработки изображений
Генеративные конкурирующие сети (GAN)
20 часов теории12 часов практики
Навыки, которые вы получите
сегментировать изображения
искать похожие картинки по контенту
создавать fine-tuning сети
определять положение и форму объекта, отделять его от фона с помощью свёрточных нейросетей
распознавать текст на изображении
генерировать изображения
Обработка естественного языка (NLP)
Вы освоите морфологический и синтаксический анализ, дистрибутивную семантику и информационный поиск, научитесь снижать размерность в векторной модели, классифицировать, извлекать информацию и генерировать тексты.
Вы освоите морфологический и синтаксический анализ, дистрибутивную семантику и информационный поиск, научитесь снижать размерность в векторной модели, классифицировать, извлекать информацию и генерировать тексты.
Морфологический и синтаксический анализ

Методы снижения размерности в векторной модели. Информационный поиск
Тематическое моделирование (LSA, LDA, HDP)
Дистрибутивная семантика (word2vec, GloVe, AdaGram)
Счётные языковые модели и вероятностные языковые модели. LSTM. Машинный перевод
Генерация текстов (Natural Language Generation)
Задача классификации в АОТ
18 часов теории10 часов практики
Навыки, которые вы получите
вычисление частоты слов и определение части речи, классификация текстов
работа с деревьями зависимостей
обучение и визуализация тематических моделей и моделей дистрибутивной семантики
использование языковых моделей для генерации текстов
разработка простых чат-ботов
размещение данных на Яндекс.Толоке
Итоговый хакатон
Завершим обучение состязанием с товарищами по курсу: в составе мини-команды, за ограниченное время и на основе датасетов крупных игроков рынка, вам придётся решать задачи по прогнозированию продаж или оптимизации производства, задействуя все знания и навыки, полученные на курсе.
Интеграция и использование machine learning решений в бизнесе, как правило, подразумевает командную игру, поэтому хакатон полезен ещё и как тренировка необходимых soft skills.
Завершим обучение состязанием с товарищами по курсу: в составе мини-команды, за ограниченное время и на основе датасетов крупных игроков рынка, вам придётся решать задачи по прогнозированию продаж или оптимизации производства, задействуя все знания и навыки, полученные на курсе.
Интеграция и использование machine learning решений в бизнесе, как правило, подразумевает командную игру, поэтому хакатон полезен ещё и как тренировка необходимых soft skills.
8 часов практики
Дипломная работа
В рамках дипломного проекта вы сможете построить ML-модель для решения своих текущих профессиональных задач: это может быть система прогнозирования продаж, распознавание объектов на фото или видео, анализ временных рядов, анализ больших объёмов текста и т. д.
Если в моменте у вас нет идей для своего проекта (или доступа к необходимым данным), мы предложим вам учебный кейс в интересной вам области на основе реального датасета других компаний.
Дипломная работа выполняется самостоятельно под руководством экспертов курса и позволяет закрепить весь спектр знаний и навыков, полученных на программе.
В рамках дипломного проекта вы сможете построить ML-модель для решения своих текущих профессиональных задач: это может быть система прогнозирования продаж, распознавание объектов на фото или видео, анализ временных рядов, анализ больших объёмов текста и т. д.
Если в моменте у вас нет идей для своего проекта (или доступа к необходимым данным), мы предложим вам учебный кейс в интересной вам области на основе реального датасета других компаний.
Дипломная работа выполняется самостоятельно под руководством экспертов курса и позволяет закрепить весь спектр знаний и навыков, полученных на программе.
60 часов практики
Запишитесь на курс и получите консультацию по программе обучения
170 000 ₽200 000 ₽
полная стоимость курса
от 16 667 ₽ / месяц
оплата частями

Кому идеально подойдет этот курс

Разработчикам
Аналитикам
Топ-менеджерам в ИТ
1
Разработчикам
Курс даёт хорошую базу для перехода из программирования в data science и анализ больших данных.
2
Аналитикам
Вы научитесь извлекать максимум из больших массивов данных для быстрой проверки гипотез и построения прогнозов.
3
Топ-менеджерам в ИТ
Вы получите системный взгляд на возможности и ограничения машинного обучения и сможете разрабатывать и внедрять ML-проекты в различных бизнесах.

Учитесь у лучших экспертов

Павел Клеменков
Chief Data Scientist в NVIDIA, основатель Moscow Spark
Учебная программа получилась насыщенной, и это большой плюс курса. Кроме того, авторам удалось подобрать хороший состав преподавателей. В результате студенты научатся уверенно решать ключевые задачи data science / машинного обучения и получат важный опыт работы в команде.
Учебная программа получилась насыщенной, и это большой плюс курса. Кроме того, авторам удалось подобрать хороший состав преподавателей. В результате студенты научатся уверенно решать ключевые задачи data science / машинного обучения и получат важный опыт работы в команде.
Олег Булыгин
Руководитель бюро планирования и управления в АО "НПО автоматики"
Мария Мансурова
Аналитик Яндекс.Метрики
Никита Кузнецов
Руководитель команды диалогового движка в Сбербанк
Константин Башевой
Яндекс, аналитик-разработчик
Вячеслав Мурашкин
Яндекс, Руководитель исследовательской группы
Жанна Узалова
AJ Technology & Financial Group
Екатерина Артемова
Доцент Факультета компьютерных наук НИУ ВШЭ
Ирина Хомутова
Разработчик в Eltex LTD
Александр Сербул
Руководитель направления контроля качества интеграции и внедрений, 1С-Битрикс
Алексей Кузьмин
Директор разработки в ДомКлик.ру
Александр Кондрашкин
CTO & Co-founder в LoyaltyLab
Константин Гусев
Старший аналитик-моделист в Bi.zone (кибер-безопасность), Ех-аналитик в McKinsey & Co.
Юстина Иванова
Специалист по анализу данных в ОЦРВ
Денис Кирьянов
Сбербанк, руководитель направления
Олег Булыгин
Руководитель бюро планирования и управления в АО "НПО автоматики"

Как проходит обучение

  • Занятия онлайн и в Кампусе
    Первые модули программы проходят в формате вебинаров. Модуль по машинному обучению — очный, с занятиями в Кампусе Нетологии в Москве
    1
  • Практика
    Каждое занятие включает в себя практические задания, индивидуальные и командные. Также есть возможность оттачивать навыки на лабораторных занятиях и хакатоне.
    2
  • Общение с экспертами
    Эксперты курса, преподаватели и менторы, всегда открыты для дополнительных вопросов — как в процессе обучения, так и после окончания программы.
    3
  • Карьера
    Центр развития карьеры поможет с составлением резюме, подготовит к собеседованию, предложит вакансии и будет сопровождать на всех этапах поиска работы.
    4

Что вы получите в результате обучения

Data Scientist
Достигнутые результаты
Построена полносвязная нейросеть
Создан чат-бот для поиска авиабилетов
Построен классификатор изображений
Созданы рекомендательные системы для музыкального и киносайта
Создан готовый к внедрению ml-проект
Ключевые навыки
Сбор и подготовка данных для анализа

Создание нейросетей
Генерация текстов и изображений

Создание рекомендательных систем

Выбор и реализация алгоритма под задачу
Выбор и создание фич для модели
Инструменты, которые вы освоите
scikit-learn
Базовая библиотека в Python для построения алгоритмов машинного обучения.
Вашу квалификацию подтвердят документы установленного образца

Стажировки и трудоустройство

Каждый выпускник получает помощь
и поддержку Центра развития карьеры
Помощь в подготовке резюме и прохождении собеседования
Консультация с HR-специалистом по поиску работы и развитию карьеры
Возможность прохождения стажировки в проектах «Нетологии-групп»: в Фоксфорде, Нетологии, EdMarket
Информирование о вакансиях, открытых в компаниях-партнёрах
Доступ к подборке видеокурсов по поиску работы и soft skills
Мы трудоустроили своих выпускников в компании
Оставьте заявку на обучение
При оплате частями
16 667 ₽ / мес.
Одним платежом
170 000 ₽
200 000 ₽
До 31 августа скидка 30 000 ₽
У меня есть промокод
Сэкономьте еще 13%
Вы можете вернуть 13% денег через налоговый вычет. Спросите об этом менеджера, когда запишетесь на курс
Нажимая кнопку, принимаю условия политики и пользовательского соглашения
Как оплатить частями?
Мы предоставляем беспроцентный кредит от Сбербанка, Тинькофф или от Яндекс.Кассы. Вы разделите платеж и ничего не переплатите
Как оплатить от юрлица?
Запишитесь на курс от имени того, кто будет учиться, а затем выберите способ оплаты «По счету от юрлица»
Есть еще вопросы?
Звоните нам — 8 (800) 301-39-69
Кампус Нетологии
Ул. Нижняя Красносельская, д. 35, стр. 59. «Гастроферма». Метро «Бауманская»
Даты курса
С 9 сентября 2019 по 16 июля 2020
Расписание занятий
2 раза в неделю
пн, чт вечером
Мы используем файлы cookie
Чтобы улучшить работу сайта и предоставить вам больше возможностей для обучения. Продолжая использовать сайт, вы соглашаетесь с условиями использования файлов cookie.