Сделали подборку ресурсов по математике, статистике и программированию для начинающих дата-сайентистов. Ознакомьтесь с материалами, если вы планируете учиться на онлайн-курсах. Так вы опередите одногруппников, а заодно прокачаете полезный навык — изучать дополнительные материалы самостоятельно.
Первым делом — технический английский
Большинство материалов из подборки — на английском языке. Поэтому в первую очередь нужно разобраться в технической лексике и научиться понимать сложные термины. Эти ресурсы помогут сориентироваться в технической литературе, если ваш уровень английского — средний или ниже среднего.
- Cambridge Dictionary — толковый словарь, который поможет понять смысл слов и выражений.
- Подборка аббревиатур, которые часто используют в Data Science, с расшифровкой.
- Словарь терминов Data Science и Machine Learning.
Математика
Прокачайте математическое мышление и изучите:
- книгу Кейт Дэвлин «Introduction to Mathematical Thinking»;
- гайды How to Develop a Mindset for Math и Learning to Learn: Math Abstraction;
- тред на Quora How do math geniuses understand extremely hard math concepts so quickly?;
- публикацию Devlin’s Angle What is conceptual understanding?
Чтобы осознать универсальность математики, посмотрите серию семинаров Эдварда Френкела Mathematics: the language of nature.
Дополнительная теория и практика по математике
Освежить в памяти базовые понятия математики помогут следующие ресурсы:
- по производным — урок Derivatives introduction от «Академии Хана»;
- по векторной алгебре — курс по линейной алгебре «Высшей школы экономики» от Coursera (седьмая неделя), уроки Vectors в «Академия Хана»;
- по матричной алгебре — курс по линейной алгебре «Высшей школы экономики» от Coursera (шестая неделя), уроки из раздела Matrices в «Академия Хана»;
- по тригонометрии — задания из раздела Trigonometry в «Академии Хана»;
- по теории вероятностей — курс по теории вероятности для начинающих от МФТИ на Coursera, задания из раздела Probability в «Академии Хана».
Задание со звездочкой ?
Чтобы ещё больше прокачать знания по матричной алгебре, пройдите сложный курс Linear Algebra от MIT.
- Освойте математические концепции: видеть взаимосвязь в массивах данных и делать точные прогнозы
- Выполните итоговую работу, которая поможет использовать математический аппарат в практике
Статистика
Для обучения на курсе «Data Scientist» Нетологии достаточно базовых знаний статистики. Их можно получить на курсе «Основы статистики» от Stepik. Ознакомиться с полным списком тем по статистике, которые будем рассматривать во время обучения, можно в подборке The 10 Statistical Techniques Data Scientists Need to Master. Для поступления разбираться в них детально не нужно, но лучше получить общее представление.
Задание со звездочкой
Дополнительно стоит пройти курс Statistics for Applications от MIT, но для этого нужно понимать:
- что такое выборка и генеральная совокупность;
- меры центральной тенденции и изменчивости;
- сравнение средних.
Программирование
Студенты курса «Data Scientist» пишут код на языке Python. Чтобы писать код во время обучения, достаточно освоить основные понятия языка: операторы, типы данных, переменные, циклы, функции, классы. Быстро разобраться в основах и попрактиковаться самостоятельно помогут следующие ресурсы:
- руководство Beginner Python3 Tutorials на Udemy;
- руководство по базовым концепциям языка Learning Python: From Zero to Hero от FreeCodeCamp;
- курс с теорией и практическими заданиями Google’s Python Class от Google;
- подборка задач от Pythontutor на русском и английском;
- обзор библиотеки Pandas, которую будем использовать для обработки и анализа данных в программе.
Если вы хотите разобраться в Python подробнее и под руководством наставника, можете параллельно проходить курс «Python для работы с данными».
ЧИТАТЬ ТАКЖЕ
Базы данных
Чтобы мыслить в контексте данных, нужно разобраться, как устроены и работают базы реляционных данных. Для этого достаточно освоить основы SQL — пройти третью неделю курса по основам анализа данных для бизнеса от Колорадского университета в Боулдере. Отработать знания на практике можно в следующих заданиях:
- SQL Exercises;
- SQL Movie-Rating Query Exercises;
- SQL Movie-Rating Query Exercises Extras;
- SQL Social-Network Query Exercises;
- SQL Social-Network Query Exercises Extras;
- SQL Movie-Rating Modification Exercises;
- SQL Social-Network Modification Exercises.
Углубленные знания по базам данных можно получить на курсе «SQL для аналитика».
Резюмируем
- Если вы планируете освоить профессию Data Scientist на курсах, прокачайте технический английский. Это понадобится для изучения дополнительных материалов и документации.
- Изучите или освежите в памяти основы математики, статистики, Python и SQL.
- Читайте гайды, смотрите обучающие лекции и выполняйте практические задания для закрепления информации.
- Научитесь строить и обучать предиктивные модели с помощью алгоритмов машинного обучения и нейросетей
- Сможете находить скрытые закономерности, прогнозировать развитие событий и оптимизировать ключевые бизнес-процессы
Хотите написать колонку для Нетологии? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.