Привет, меня зовут Владимир, я работаю аналитиком в фармацевтической компании и уже более шести лет занимаюсь анализом данных. А ещё — веду свой блог-проект «Футбол в цифрах», в рамках которого собираю футбольную статистику и рассказываю аудитории о самом интересном в виде коротких заметок и подробных статей.
Расскажу, как решил изучить Data Science и совместить его с давним увлечением футболом.
Я всегда любил работать с цифрами, но дорога к тому, чтобы освоить Data science, была долгой. Я работал в фармацевтической компании представителем, но понял, что мне этого недостаточно. Начал искать работу и ходить по собеседованиям, чтобы понять, чего ждут работодатели от сотрудника-аналитика.
Собеседования и тестовые задания показали, что мне нужно учиться. У меня было понимание математики, опыт работы в Excel и с оболочкой QlikView с точки зрения пользователя, но не хватало умения программировать и знания инструментов аналитики. Изучение рынка образовательных программ привело в Нетологию.
Я хотел получить от курса максимум, поэтому был готов к тому, что свободное время, энергию и концентрацию направлю на учёбу.
Занимался не меньше 10–12 часов в неделю. Аналитика данных — область точных наук, в этой сфере нельзя без глубокого понимания темы и деталей.
К счастью, в Нетологии со мной никто не нянчился и не сюсюкался, нагружали по полной: домашние задания, вебинары, практики, материалы для самостоятельного обучения.
Конечно, совмещать работу, семью и курсы было непросто, я почти закрылся от внешнего мира на полтора года. Иногда не получалось, хотелось разбить компьютер. Но я понимал, что в итоге получу доступ к науке, которая определяет политику корпораций.
В итоге я ещё не окончил курс, но уже устроился в фармацевтическую компанию именно аналитиком.
Главное, чему я научился — это программирование, работа с аналитическими инструментами и культура обращения с данными. Всё это я каждый день применяю на работе. И на этих же знаниях построил проект о футболе.
- Освоите навыки для построения карьеры в анализе данных и обучении нейронных сетей
- Получите знания в концентрированном формате и с обратной связью от экспертов-практиков
- Научитесь извлекать максимум из больших массивов данных для быстрой проверки гипотез и построения прогнозов
Как начинался проект «Футбол в цифрах»
Я всегда интересовался футболом и 12 лет играл на серьёзном уровне. У меня появилась идея сделать что-то полезное для любителей футбола и индустрии в целом, потому что результаты наших клубов оставляют желать лучшего в последнее время.
Для меня истина кроется в цифрах, поэтому и футбол я стал рассматривать с точки зрения обработки данных.
Решения на основе данных принимают лишь единичные футбольные клубы: в отличие от зарубежных коллег, наши аналитические отделы только начинают внедрять. Мне хочется развить эту культуру и обратить внимание на точечные вещи.
Мне любопытно рассматривать, на каком уровне находится наш футбол в сравнении с другими странами. Например, недавно я загрузил в базу данные по более чем 30 странам и постарался провести между ними параллели. Любопытнее всего находить в данных инсайты: раньше ты о чём-то и не подозревал, а потом увидел график и понял, что это существует.
Сейчас я использую простую аналитику и пишу понятным языком для юных футболистов, их родителей и тренеров — подписчиков блога. Есть два формата: портреты и персональные публикации.
Персональные публикации нужны для анализа отдельных футболистов. Для этого я изучаю массив данных по каждому игроку, выделяю группу по определённым признакам и пишу обзор на того, кто выделяется среди всех по определённой метрике.
Портреты — более сложные публикации, где мы с аудиторией разбираем сущности в футболе в целом и находим общие тенденции. Для этого я собираю данные обо всех командах и анализирую их по определённому признаку. Например, по году рождения — это очень важно в юношеском футболе. Или по месяцу: вы удивитесь, но футболистов, рождённых в январе, феврале и марте в юношеском футболе целых 50%.
Я стараюсь адаптировать контент под аудиторию блога и придерживаюсь правила о простоте графика: он должен быть понятен каждому, но при этом нести серьёзную мысль. То есть нужно визуализировать неожиданное открытие настолько, чтобы люди без сомнений поняли, о чём идёт речь.
Техническая сторона проекта
Для проекта я постоянно использую инструменты и техники, о которых впервые услышал на курсах по Data Science и веб-аналитике.
Сбор и подготовка данных занимают много времени и составляют большую часть успеха. Часть информации я собираю автоматически из открытых источников с помощью скриптов-парсеров, которые написал самостоятельно. Сейчас я так собираю данные по юношескому, молодёжному и взрослому футболу из 30 стран, включая Китай, Австралию, Нигерию — неочевидные направления.
Некоторых сведений нет в свободном доступе, их приходится запрашивать. И у меня на это уходят недели.
Например, сведения об антропометрии юношеских команд я собирал вручную: искал игроков в социальных сетях и писал им с просьбой откликнуться и помочь. Так я охватил в аналитике 95% юношеских команд, игроки которых могут стать профессиональными футболистами.
Все собранные данные уходят в облако. Я долго выбирал платформу, которая позволит работать с нужным мне количеством данных и при этом останется недорогой. Одним из самых сложных моментов был перенос данных из таблицы Excel, в которой закончились строки, в облако. Я разрабатывал решение около двух недель — и всё-таки справился.
Я вижу вызов во всём, даже в том, чтобы просто сделать обзор. Мне интересно собирать данные, визуализировать их на графике и видеть, что там происходит.
Для развития проекта мне бы хотелось пополнить базу данными о передвижениях игроков во время матчей для более прогрессивной аналитики.
Интересные инсайты
Один из факторов, которые я рассматривал, — взаимосвязь между антропометрией футболистов и количеством забитых голов. Так вот, коротко говоря, её нет.
Но российская футбольная школа устроена так, что при наборе в футбольные клубы габаритам игроков придают большое значение: тренеры даже готовы познакомиться с дедушками и бабушками, чтобы предположить, как будет сложен спортсмен. Кажется, что генетика играет большую роль, хотя обращать внимание нужно на способности ребят и их вовлечённость в игру. Решения лидеров часто бывают субъективными, и придать им рациональность помогает как раз аналитика.
Кроме того, я решил сравнить количество футболистов российских и зарубежных команд в разрезе амплуа и пришёл к выводу, что в нашей стране самая маленькая доля нападающих — около 20%. В то же время в странах с более успешными командами процент нападающих значительно выше, и это сказывается на качестве игры. Однако нужно понимать, что аналитика лишь указывает на различия по разным параметрам и даёт шанс подумать, что мы можем изменить.
Получается, анализ данных расширяет мировоззрение и помогает находить истины, которые очень-очень воодушевляют. Это касается не только проекта, но и моей основной работы: я лучше понимаю, как ведёт себя потребитель, каким процессам в компании нужны перемены и многое другое.
Планы на будущее
Проект «Футбол в цифрах» — не работа, а хобби, хотя есть планы со временем его монетизировать. Моя работа может стать основой для аналитики, адресованной профессиональной аудитории: футбольным клубам, спортсменам и тренерам. Подробными шорт-листами и закономерностями в юношеском и молодёжном футболе уже интересовались люди из Российского футбольного союза. Надеюсь, что мои наработки могут использовать для смены стиля тренировок в отечественных клубах. Вполне возможно, что они станут и основой для научных исследований.
Мне важно развиваться и расширять своё видение инструментов и источников. Например, я уже закончил ещё один курс Нетологии и освоил веб-аналитику, чтобы понимать поведение пользователей в интернете и уметь извлекать и использовать эти данные.
Мне часто пишут подписчики в возрасте 15–16 лет: они самостоятельно выгружают данные из InStat, интересуются процессом и делают первые шаги в аналитике — это замечательно! Нужно развиваться как можно больше, потому что никогда не знаешь, чего ждать от своей профессии.
Мнение автора и редакции может не совпадать. Хотите написать колонку для Нетологии? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.