Как соединить увлечение футболом и Data Science в успешный pet-проект: история выпускника Нетологии и блога «Футбол в цифрах»
Личный опыт

Как соединить увлечение футболом и Data Science в успешный pet-проект: история выпускника Нетологии и блога «Футбол в цифрах»

Привет, меня зовут Владимир, я работаю аналитиком в фармацевтической компании и занимаюсь анализом данных уже более 6 лет. А ещё — веду свой блог-проект «Футбол в цифрах», в рамках которого собираю футбольную статистику и рассказываю аудитории о самом интересном в виде коротких заметок и подробных статей.

Расскажу, как решил изучить Data Science и совместить его с давним увлечением футболом.

Я всегда любил работать с цифрами, но дорога к тому, чтобы освоить Data science, была долгой. Я работал в фармацевтической компании представителем, но понял, что мне этого недостаточно. Начал искать работу и ходить по собеседованиям, чтобы понять, чего ждут работодатели от сотрудника-аналитика.

Собеседования и тестовые задания показали, что мне нужно учиться.

У меня было понимание математики, опыт работы в Excel и с оболочкой QlikView с точки зрения пользователя — но не хватало умения программировать и знания инструментов аналитики. Изучение рынка образовательных программ привело в Нетологию.

Я хотел получить от курса максимум, поэтому был готов к тому, что свободное время, энергию и концентрацию направлю на учёбу.

Занимался не меньше 10–12 часов в неделю. Аналитика данных — область точных наук, в этой сфере нельзя без глубокого понимания темы и деталей.

К счастью, в Нетологии со мной никто не нянчился и не сюсюкался, нагружали по полной: домашние задания, вебинары, практики, материалы для самостоятельного обучения.

Конечно, совмещать работу, семью и курсы было непросто, я почти закрылся от внешнего мира на полтора года. Иногда не получалось, хотелось разбить компьютер. Но я понимал, что в итоге получу доступ к науке, которая определяет политику корпораций.

Как соединить увлечение футболом и Data Science в успешный pet-проект: история выпускника Нетологии и блога «Футбол в цифрах»
Без поддержки жены я бы не смог сделать всё, что хотел, она тоже понимала, сколько сил я трачу на освоение профессии

В итоге я ещё не окончил курс, но уже устроился в фармацевтическую компанию именно аналитиком.

Главное, чему я научился — это программирование, работа с аналитическими инструментами и культура обращения с данными. Всё это я каждый день применяю на работе. И на этих же знаниях построил проект о футболе.

Как начинался проект «Футбол в цифрах»

Я всегда интересовался футболом и 12 лет играл на серьёзном уровне. У меня появилась идея сделать что-то полезное для любителей футбола и индустрии в целом, потому что результаты наших клубов оставляют желать лучшего в последнее время.

Для меня истина кроется в цифрах, поэтому и футбол я стал рассматривать с точки зрения обработки данных.

Решения на основе данных принимают лишь единичные футбольные клубы: в отличие от зарубежных коллег, наши аналитические отделы только начинают внедрять. Мне хочется развить эту культуру и обратить внимание на точечные вещи.

Мне любопытно рассматривать, на каком уровне находится наш футбол в сравнении с другими странами. Например, недавно я загрузил в базу данные по более чем 30 странам и постарался провести между ними параллели. Любопытнее всего находить в данных инсайты: раньше ты о чём-то и не подозревал, а потом увидел график и понял, что это правда.

На текущий момент я использую простую аналитику и пишу понятным языком для юных футболистов, их родителей и тренеров — подписчиков блога. Есть два формата: портреты и персональные публикации.

Персональные публикации нужны для анализа отдельных футболистов. Для этого я изучаю массив данных по каждому игроку, выделяю группу по определённым признакам и пишу обзор на того, кто выделяется среди всех по определённой метрике.

Портреты — более сложные публикации, где мы с аудиторией разбираем сущности в футболе в целом и находим общие тенденции. Для этого я собираю данные обо всех командах и анализирую их по определённому признаку. Например, по году рождения — это очень важно в юношеском футболе. Или по месяцу: вы удивитесь, но футболистов, рождённых в январе, феврале и марте в юношеском футболе целых 50%.

Я стараюсь адаптировать контент под аудиторию блога и придерживаюсь правила о простоте графика: он должен быть понятен каждому, но при этом нести серьёзную мысль. То есть нужно визуализировать неожиданное открытие настолько, чтобы люди без сомнений поняли, о чём идёт речь.

Техническая сторона проекта

Для проекта я постоянно использую инструменты и техники, о которых впервые услышал на курсах по Data Science и веб-аналитике.

Сбор и подготовка данных занимают много времени и составляют большую часть успеха. Часть информации я собираю автоматически из открытых источников с помощью скриптов-парсеров, которые написал самостоятельно. Сейчас я так собираю данные по юношескому, молодёжному и взрослому футболу из 30 стран, включая Китай, Австралию, Нигерию — неочевидные направления.

Некоторые сведения не представлены в открытом пространстве, их приходится запрашивать. И у меня на это уходят недели.

Например, сведения об антропометрии юношеских команд я собирал вручную: искал игроков в социальных сетях и писал им с просьбой откликнуться и помочь. Так я охватил в аналитике 95% юношеских команд, игроки которых могут стать профессиональными футболистами.

Все собранные данные уходят в облако. Я долго выбирал платформу, которая позволит работать с нужным мне количеством данных и при этом останется недорогой. Одним из самых сложных моментов был перенос данных из таблицы Excel, в которой закончились строки, в облако. Я разрабатывал решение около двух недель — и всё-таки справился.

Как соединить увлечение футболом и Data Science в успешный pet-проект: история выпускника Нетологии и блога «Футбол в цифрах»
Я очень увлечён тем, чем занимаюсь: часто сижу до полуночи и что-нибудь с интересом доделываю

Я вижу вызов во всём, даже в том, чтобы просто сделать обзор. Мне интересно собирать данные, визуализировать их на графике и видеть, что там происходит.

Для развития проекта мне бы хотелось пополнить базу данными о передвижениях игроков во время матчей для более прогрессивной аналитики.

Интересные инсайты

Один из факторов, которые я рассматривал, — взаимосвязь между антропометрией футболистов и количеством забитых голов. Так вот, коротко говоря, её нет.

Но российская футбольная школа устроена так, что при наборе в футбольные клубы габаритам игроков придают большое значение: тренеры даже готовы познакомиться с дедушками и бабушками, чтобы предположить, как будет сложен спортсмен. Кажется, что генетика играет большую роль, хотя обращать внимание нужно на способности ребят и их вовлечённость в игру. Решения лидеров часто бывают субъективными, и придать им рациональность помогает как раз аналитика.

Кроме того, я решил сравнить количество футболистов российских и зарубежных команд в разрезе амплуа и пришёл к выводу, что в нашей стране самая маленькая доля нападающих — около 20%. В то же время в странах с более успешными командами процент нападающих значительно выше, и это сказывается на качестве игры. Однако нужно понимать, что аналитика лишь указывает на различия по разным параметрам и даёт шанс подумать, что мы можем изменить.

Получается, анализ данных расширяет мировоззрение и помогает находить истины, которые очень-очень воодушевляют. Это касается не только проекта, но и моей основной работы: я лучше понимаю, как ведёт себя потребитель, каким процессам в компании нужны перемены и многое другое.

Планы на будущее

Проект «Футбол в цифрах» — не работа, а хобби, хотя есть планы со временем его монетизировать. Моя работа может стать основой для аналитики, адресованной профессиональной аудитории: футбольным клубам, спортсменам и тренерам. Подробными шорт-листами и закономерностями в юношеском и молодёжном футболе уже интересовались люди из Российского футбольного союза. Надеюсь, что мои наработки могут использовать для смены стиля тренировок в отечественных клубах. Вполне возможно, что они станут и основой для научных исследований.

Мне важно развиваться и расширять своё видение инструментов и источников. Например, я уже закончил ещё один курс Нетологии и освоил веб-аналитику, чтобы понимать поведение пользователей в интернете и уметь извлекать и использовать эти данные.

Мне часто пишут подписчики в возрасте 15–16 лет: они самостоятельно выгружают данные из InStat, интересуются процессом и делают первые шаги в аналитике — это замечательно! Нужно развиваться как можно больше, потому что никогда не знаешь, чего ждать от своей профессии.

Как соединить увлечение футболом и Data Science в успешный pet-проект: история выпускника Нетологии и блога «Футбол в цифрах»

Владимир Герингер

Аналитик, автор проекта «Футбол в цифрах»


Хотите написать колонку для Нетологии? Читайте наши условия публикации.

Как соединить увлечение футболом и Data Science в успешный pet-проект: история выпускника Нетологии и блога «Футбол в цифрах»