Аналитика и Data Science Книги Программирование

Что почитать и посмотреть для старта в Data Science: книги, словари и курсы

Сделали подборку ресурсов по математике, статистике и программированию для начинающих дата-сайентистов. Ознакомьтесь с материалами, если вы планируете учиться на онлайн-курсах. Так вы опередите одногруппников, а заодно прокачаете полезный навык — изучать дополнительные материалы самостоятельно.

Первым делом — технический английский

Большинство материалов из подборки — на английском языке. Поэтому в первую очередь нужно разобраться в технической лексике и научиться понимать сложные термины. Эти ресурсы помогут сориентироваться в технической литературе, если ваш уровень английского — средний или ниже среднего.

Редакция Нетологии

Знает, как сделать первый шаг в изучении Data Science 

Математика

В первую очередь научитесь быстро осваивать любые математические концепции. В этом поможет обучающий ролик How to Learn Mathematics Fast

Прокачайте математическое мышление и изучите:

Чтобы осознать универсальность математики, посмотрите серию семинаров Эдварда Френкела Mathematics: the language of nature.

Дополнительная теория и практика по математике

Освежить в памяти базовые понятия математики помогут следующие ресурсы:

Курс «Теория вероятностей» на Coursera

Задание со звездочкой 🧐

Чтобы ещё больше прокачать знания по матричной алгебре, пройдите сложный курс Linear Algebra от MIT.

курс

Математика для анализа данных 🔢

Узнать больше

  • Освойте математические концепции: видеть взаимосвязь в массивах данных и делать точные прогнозы
  • Выполните итоговую работу, которая поможет использовать математический аппарат в практике

Статистика

Для обучения на курсе «Data Scientist» Нетологии достаточно базовых знаний статистики. Их можно получить на курсе «Основы статистики» от Stepik. Ознакомиться с полным списком тем по статистике, которые будем рассматривать во время обучения, можно в подборке The 10 Statistical Techniques Data Scientists Need to Master. Для поступления разбираться в них детально не нужно, но лучше получить общее представление.

Задание со звездочкой 🧐

Дополнительно стоит пройти курс Statistics for Applications от MIT, но для этого нужно понимать:

  • что такое выборка и генеральная совокупность;
  • меры центральной тенденции и изменчивости;
  • сравнение средних.

Программирование

Студенты курса «Data Scientist» пишут код на языке Python. Чтобы писать код во время обучения, достаточно освоить основные понятия языка: операторы, типы данных, переменные, циклы, функции, классы. Быстро разобраться в основах и попрактиковаться самостоятельно помогут следующие ресурсы:

Если вы хотите разобраться в Python подробнее и под руководством наставника, можете параллельно проходить курс «Python для работы с данными».

Базы данных

Чтобы мыслить в контексте данных, нужно разобраться, как устроены и работают базы реляционных данных. Для этого достаточно освоить основы SQL — пройти третью неделю курса по основам анализа данных для бизнеса от Колорадского университета в Боулдере. Отработать знания на практике можно в следующих заданиях:

Углубленные знания по базам данных можно получить на курсе «SQL для аналитика».

Резюмируем

  • Если вы планируете освоить профессию Data Scientist на курсах, прокачайте технический английский. Это понадобится для изучения дополнительных материалов и документации.
  • Изучите или освежите в памяти основы математики, статистики, Python и SQL.
  • Читайте гайды, смотрите обучающие лекции и выполняйте практические задания для закрепления информации.

Профессия

Data Scientist 🔗

Узнать больше

  • Научитесь строить и обучать предиктивные модели с помощью алгоритмов машинного обучения и нейросетей
  • Сможете находить скрытые закономерности, прогнозировать развитие событий и оптимизировать ключевые бизнес-процессы

Хотите написать колонку для Нетологии? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.