Что почитать и посмотреть для старта в Data Science: книги, словари и курсы

20.09.2019
855
Подпишитесь, чтобы получать новые статьи на почту

Подборка ресурсов по математике, статистике и программированию для начинающих Дата Сайентистов. Ознакомьтесь с материалами, если вы планируете учиться на онлайн-курсах. Так вы опередите одногруппников, а заодно прокачаете полезный навык — изучать дополнительные материалы самостоятельно.

Технический английский

Большинство материалов из подборки — на английском языке. Поэтому в первую очередь нужно разобраться в технической лексике и научиться понимать сложные термины. Эти ресурсы помогут сориентироваться в технической литературе, если ваш уровень английского — средний или ниже среднего.


Cambridge Dictionary

Математика


В первую очередь научитесь быстро осваивать любые математические концепции. В этом поможет обучающий ролик How to Learn Mathematics Fast

Прокачайте математическое мышление и изучите:

Чтобы осознать универсальность математики, посмотрите серию семинаров Эдварда Френкела Mathematics: the language of nature.

Дополнительная теория и практика по математике

Освежить в памяти базовые понятия математики помогут следующие ресурсы:


Курс «Теория вероятностей» на Coursera

Задание со звездочкой. Чтобы еще больше прокачать знания по матричной алгебре, пройдите сложный курс Linear Algebra от MIT.

Статистика

Для обучения на курсе Нетологии Data Scientist, достаточно базовых знаний статистики. Их можно получить из раздела Statistics and probability в «Академии Хана». Ознакомиться с полным списком тем по статистике, которые будем рассматривать во время обучения, можно в подборке The 10 Statistical Techniques Data Scientists Need to Master. Для поступления разбираться в них детально не нужно, но лучше получить общее представление.


Курс Data Scientist в Нетологии

Задание со звездочкой. Дополнительно стоит пройти курс Statistics for Applications от MIT, но для этого нужно понимать:
  • что такое выборка и генеральная совокупность;

  • меры центральной тенденции и изменчивости;

  • сравнение средних.

Программирование

Студенты курса Data Scientist пишут код на языке Python. Чтобы писать код во время обучения, достаточно освоить основные понятия языка: операторы, типы данных, переменные, циклы, функции, классы. Быстро разобраться в основах и попрактиковаться самостоятельно помогут следующие ресурсы:

Если вы хотите разобраться в Python подробнее и под руководством наставника, можете параллельно проходить курс «Python для анализа данных».

Базы данных

Чтобы мыслить в контексте данных, нужно разобраться, как устроены и работают базы реляционных данных. Для этого достаточно освоить основы SQL — пройти третью неделю курса по основам анализа данных для бизнеса от Колорадского университета в Боулдере. Отработать знания на практике можно в следующих заданиях:

Углубленные знания по базам данных можно получить на курсе «SQL для аналитика».

Резюмируем: ключевые рекомендации

  • Если вы планируете освоить профессию Data Scientist на курсах, прокачайте технический английский. Это понадобится для изучения дополнительных материалов и документации.
  • Изучите или освежите в памяти основы математики, статистики, Python и SQL.
  • Читайте гайды, смотрите обучающие лекции и выполняйте практические задания для закрепления информации.

Читать еще: «Data Science для начинающих: обзор сферы и профессий»


Мнение автора и редакции может не совпадать. Хотите написать колонку для «Нетологии»? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.

Университет интернет-профессий