Основные хард-скиллы, которые нужны профессионалу:
- Применение математической статистики и теории вероятностей. Навык необходим для получения корректных данных и работы с ними, поиска закономерностей, проверки гипотез.
- Использование языка запросов к базам данных SQL и языка программирования Python. Для сбора данных из разных источников, их обработки и визуализации результатов.
- Анализ данных. Скилл позволяет определять логику событий, случайные величины и важные показатели.
- Выполнение математических вычислений с помощью библиотек Python. Умение помогает быстро проводить операции с большими объёмами данных. Популярные инструменты для анализа массивов информации — Pandas и NumPy, для машинного обучения — scikit-learn, также в работе применяются нейросетевые библиотеки Keras и PyTorch.
- Построение предсказательных моделей и обучение нейросетей. Навык нужен для автоматизации рекомендательных систем.
- Визуализация данных. Для наглядного отображения показателей, которые важны заказчику.
- Внедрение моделей машинного обучения в бизнес-процессы.
Ключевым мягким навыком специалиста считается умение в понятной форме презентовать работу руководству и другим заинтересованным лицам. Сотрудник должен уметь разговаривать с ними на понятном языке — в первую очередь, чтобы понимать задачу.
На примере вакансии в компании «Строительный двор» посмотрим, какие скиллы ожидает увидеть в Data Scientist реальный работодатель: