Каталог курсов
Такого курса сейчас нет
К сожалению, сейчас невозможно записаться на курс. Вы можете посмотреть похожие программы обучения.
Перейти в каталог курсов
К сожалению, курс сейчас недоступен
Избранное
Курс

Big Data с нуля

Научитесь работать с большими данными
Расширьте знания в аналитике
Перейдите на новый уровень в профессии
Когда
28 марта — 29 апреля
Формат обучения

Видеолекции, вебинары и практические задания

Для кого

Для всех, кто готов повышать свою грамотность в IT-технологиях

Документ

Удостоверение о повышении квалификации установленного образца

Big Data — инструменты, подходы и методы обработки огромных объёмов данных

По сути это альтернатива традиционным системам обработки данных.

Если вам требуется общее расширение кругозора в теме технологий работы с данными и необходимость апгрейда на текущем месте работы, курс даст возможность расширить профессиональные навыки, работать с новыми задачами и быстро приносить результаты в проектах.

Зачем изучать Big Data

Up skill профессии

Вас ждёт апгрейд навыков в аналитике данных и понимание, зачем и где нужна big data, новая траектория развития карьеры и более сложные рабочие проекты

Расширение кругозора

Вы расширите свой кругозор, освоите технологии для перехода на уровень middle и сможете быстрее выполнять свои рабочие задачи

Переход в новую область

Курс даёт ключевые технологии и навыки для старта погружения в самую горячую профессиональную область. Вы получите практику, достойную включения в резюме

Направление Нетологии «Аналитика и Data Science» — обладатель «Премии Рунета» в номинации «Образование и кадры» в 2019 году

Что вы узнаете на курсе

  • Как собрать и управлять командой big data проекта

    Освоите подход CRISP-DM: межотраслевой стандартный процесс для исследования данных. Определите компетенции и состав команды.

  • Как создать стратегию работы с большими данными

    Определите, сколько данных вам нужно для нахождения инсайтов. Найдёте задачи под биг дату в своей компании.

  • Как улучшить результаты обработки данных

    Поймёте, как и по каким правилам хранить данные. Сможете обосновывать влияние на сбор данных, мониторинг и отчётность.

Акцент на практику

За время обучения вы выполните 8 домашних работ и итоговый проект, в котором систематизируете полученные знания.

Примеры практических задач

Построить модель данных из разных неструктурированных источников: таблиц, сайтов и баз данных

Создать классификатор и провести оценку результатов его работы на отложенной выборке

Построить прогнозы на основе данных в MapReduce

Нетологию чаще советуют знакомым

Каждый второй студент готов рекомендовать обучение в Нетологии своим друзьям и знакомым. Мы гордимся таким результатом и постоянно работаем над качеством наших программ.

Forbes Education

Выпускники Нетологии чаще других довольны обучением

У нас самый большой процент выпускников, удовлетворённых своим обучением — 85%. В понятие удовлетворённости студенты включают высокое качество учебных программ, вовлечённость преподавателей и уровень обратной связи.

Forbes Education

Программа курса

Аналитика больших данных

Часто аналитик данных нужен именно в тех компаниях, которые накопили «какую-то свою» Big data. Чтобы понимать, как он может принести пользу для бизнеса, нужно владеть не только стандартными инструментами вроде Excel и SQL, но и знать характерные только для больших данных принципы обработки, иметь представление о компонентах экосистемы Hadoop и облачных платформах для реализации решений по Big data. Мы не только поговорим об этом, но и попрактикуемся работать с главными инструментами.

12 часов теории

22 часа практики

Традиционные аналитические подходы. Причины выбора Big data среди многообразия подходов
Машинные методы для обработки данных. Как перестать реагировать и начать прогнозировать
Культура сбора и источники данных. Дорожная карта и главное правило аналитика
Предобработка и визуализация данных в pandas для отчётности на примере международного ритейлера
Улучшение качества работы с данными. Основы архитектуры хранения и обработки больших данных, виды обработки и масштабирования
Основы работы в Hadoop и MapReduce. Обзор облачных платформ: AWS, EMR, Azure и прочих

Продвинутые подходы в MapReduce. Работа в pyspark, доступная каждому

Организация команды для работы с данными. CRISP-DM

Итоговый проект

В итоговом задании на основе предложенных данных решите бизнес-кейс по построению системы рекомендаций.

15 часов практики

Итоговый проект — бизнес-кейс по построению системы рекомендаций фильмов для пользователей

На основе датасета онлайн-кинотеатра вы создадите работающую модель классификации: опишете найденные в данных инсайты, разработаете стратегию внедрения хранилища данных и работы с большими данными в реальной компании. Сформулируете цели проекта внедрения больших данных и ключевые метрики, на которые будете влиять.

Итоговая работа выполняется самостоятельно под руководством экспертов курса.

Преподаватель курса

Алексей Кузьмин
Директор разработки и руководитель Data Science и работы с данными, «ДомКлик»

Что вы получите в результате обучения

Аналитик больших данных
    Реализованные проекты
  • Классификатор и оценка результатов его работы на отложенной (train_test_split) выборке

  • Коллаборативная фильтрация (прогнозы на основе данных) в MapReduce

    Мои навыки
  • Сбор и подготовка данных для анализа
  • Понимание бизнес-требований заказчика и организация эффективной команды
  • Преобразование неструктурированных данных в простые для восприятия и ценные для бизнеса сведения
  • Построение моделей данных из разных неструктурированных источников: таблиц, сайтов и баз данных
  • Определение и выбор оптимальной архитектуры для Big Data проекта
  • Основы работы с Hadoop и MapReduce: фильтры, сортировки, поиск, группировки, определение мин-макс значений и частоты
  • Определение результатов обработки и инсайтов в данных и улучшение качества принятия решений на их основе

Инструменты, которые вы освоите
Hadoop и MapReduce
Hadoop и MapReduce
Инструмент и фреймворк для вычисления распределённых задач с использованием большого количества компьютеров («ноды») в кластере.
NoSQL, MongoDB
NoSQL, MongoDB
Нереляционные базы данных для работы с Big Data на примере MongoDB.
Apache Spark
Apache Spark
Фреймворк с открытым исходным кодом для реализации распределённой обработки неструктурированных и слабоструктурированных данных.
Google Colab
Google Colab

Сервис, который позволяет запускать библиотеки Python в облаке.

PySpark
PySpark
Пакет распределённого управления данными и машинным обучением в Apache Spark.
Pandas
Pandas
Продвинутая и быстроразвивающаяся библиотека для обработки и анализа данных в Python.
Excel
Excel
Программа для работы с электронными таблицами.

Как проходит обучение

Вебинары дважды в неделю. Раз в три занятия — практика на отработку новых знаний.

После каждого занятия — тестирование или практическое домашнее задание с проверкой и обратной связью.

Каждый студент может пообщаться с экспертами курса, получить помощь координатора и наставников.

Центр развития карьеры поможет с составлением резюме, предложит вакансии и будет сопровождать на всех этапах поиска работы.

Что нужно знать и уметь для успешного обучения на программе?

Не бояться осваивать базовые команды в Python / SQL

Мы поможем с трудоустройством

Вас ждёт бесплатная программа трудоустройства Центра развития карьеры
Оформите резюме
Научитесь выгодно презентовать свои сильные стороны
Узнаете, как найти работу
Познакомитесь с площадками для поиска работы и получите доступ к бирже проектов
Подготовитесь к собеседованию
Научитесь рассказывать о себе без стресса и правильно реагировать на вопросы
Соберёте портфолио
Оформите портфолио так, чтобы работодатель убедился в ваших навыках
Научитесь работать на себя
Узнаете, где искать первых заказчиков и как выстраивать с ними коммуникацию
Мы трудоустроили своих выпускников в компании

Вернём деньги, если обучение не подойдёт

Деньги можно вернуть в любой момент. В течение первых трёх занятий вернём вам полную сумму, а начиная с четвёртого — рассчитаем сумму возврата или поможем выбрать другой курс взамен.

Подробные условия