Что такое когортный анализ, когда и как его используют

02.07.2019
1131
Подпишитесь, чтобы получать новые статьи на почту

Специалисты компании AppsFlyer рассказали, как когортный анализ помогает отсеивать лишние данные, чтобы точнее оценить эффективность рекламной кампании или провести А/Б-тест.

Обучение в онлайн-университете: курс «Аналитик данных»

Существует заблуждение, что только глобальный анализ с максимальным охватом данных дает полный результат. На самом деле иногда слишком большие объемы данных и выборка могут стать причиной неверных выводов. Чтобы понять — что работает, а что нет — нужно правильно выбрать масштабы, разделить группы данных и сортировать их.

Данные нужно рассматривать в правильном контексте.

Почему при работе с данными важно отсеивать лишнее

Одно из первых правил статистики звучит так. Данные определяют не причинно-следственные связи, а только корреляцию между вещами и событиями — то, как они связаны в статистике. Чтобы понять эту корреляцию, нужно отсечь как можно больше «шума», лишних данных. Естественно, отсечь все лишнее невозможно. Но чтобы провести анализ правильно, нужно подобрать фильтры.

Рассмотрим простой пример — задачку о яблоках. 

Дано: две семьи из четырех человек каждая, которые покупают одинаковое количество яблок — дюжину. Семья А покупает в воскресенье, семья Б — в среду.

Цель: сравнить привычки потребления двух семей.


Привычки потребления в семьях, несгруппированные данные


Привычки потребления в семьях, сгруппированные данные

Если рассматривать только графики, не группируя данные, выходит, что в субботу потребление яблок было максимальным. Это единственный факт, который можно понять из несгруппированных данных. Сделать другие полезные выводы сложно. Но, если сгруппировать данные по дате покупки яблок, можно увидеть определенные тенденции.

  • Семья А ест яблоки медленно, но регулярно, хотя к третьему дню темпы потребления перестали расти.
  • Семья Б сначала ела мало яблок, но в третий и четвертый день темпы потребления резко увеличились. 

Теперь вернемся от яблок к рекламным технологиям. Суть эффективного анализа в том, что недостаточно просто сравнить ARPU (средний доход на одного пользователя) одного дня с другим. Нужно учитывать «шум» и отфильтровывать его:

  • сравнивать ARPU в одни и те же дни недели;
  • сравнивать их с учетом количества пользователей, их активности и наличия/отсутствия акций, которые могли бы позитивно повлиять на продажи.

При анализе любых KPI нужно сравнивать данные одного порядка, то есть условные яблоки с такими же яблоками, а не с лимонами.

Что такое когортный анализ и когда он нужен

Когда нужно сравнить KPI и оценить успешность стратегии, стоит воспользоваться когортным анализом. Его смысл в том, чтобы анализировать группы пользователей (когорты), которые объединены по общим признакам и времени выполнения действий.

Метод применяют, чтобы:

  • проводить А/Б тестирование;
  • точнее оценивать эффективность рекламных кампаний;
  • выявлять лояльных клиентов;
  • определять эффективность мобильных приложений по версиям.

Как применять когортный анализ

Метод может показаться сложным, но освоить его легко — достаточно разбить процесс анализа на шаги.

Выбор запроса

Сначала определитесь, что хотите узнать. В зависимости от искомой информации, выберите KPI. Например, задачи могут быть такими:

  • сравнить сразу несколько кампаний и проанализировать данные с разных каналов;
  • оценить успех одной и той же кампании в разных регионах.

Здесь же нужно решить, как вы будете определять, что кампания успешная. Для эффективного анализа важно понимать: какой вопрос будете задавать и какие показатели помогут найти на него ответ.

Вот простая формула для запросов в когортном анализе: группировать нужно пользователей с общими характеристиками, чтобы сравнить их поведение и показатели в определенное время.


Примеры фильтров и групп для когортного анализа

Характеристики задают масштаб, в рамках которого вы проводите анализ. Например, это может быть отдельная страна или рекламная кампания. KPI — это те самые показатели, которые будете анализировать. Временные рамки помогут обозначить интересующий период.

Анализ результатов

Рассмотрим пример, где хотим оценить успешность кампании в разных регионах. Нас интересует поведение пользователей в день установки приложения, на следующий день после установки и несколько дней спустя. В таком случае анализируем поведение и активность пользователей, приведя их всех к общему знаменателю — дню установки приложения. Это нужно, чтобы сравнивать данные одного порядка и избежать того самого сравнения условных яблок с лимонами.  

В примере видим информацию по двум показателям: среднему количеству сессий и среднему доходу на одного пользователя.


Так выглядит среднее количество сессий на графике

Российские пользователи в приложении очень активны, но что именно это значит? На первый взгляд, в России (RU) кампания проходит успешно, а в Индонезии (ID) — плохо. Также из таблицы видно, что в Индии (IN) и Китае (CN) наблюдается постепенный рост. В России на тридцатый день происходит всплеск среднего количества сессий на одного пользователя.


Среднее количество сессий на одного пользователя в табличных данных. День 0 — день установки приложения

Эти данные не дают полной картины происходящего. Мы видим, что в России активность выше по сравнению с другими странами, где показатель растет постепенно. Значит ли это, что в России кампания была самой успешной? Вряд ли. Если рассмотрим показатель среднего дохода на одного пользователя, получим другую информацию. 


Доход от одного пользователя по странам

Хотя российские пользователи активны, они не тратят деньги в рамках кампании. А вот китайские пользователи в среднем тратят за каждую сессию больше других. То есть можно сделать вывод, что на российском рынке кампанию нужно оптимизировать. Например, поощрять пользователей — предлагать им скидки или купоны. В то же время у китайских пользователей показатель доходов прекращает расти примерно на четвертый день. Поэтому для них можем как раз на это время запланировать кампанию по ретаргетингу. Индийские пользователи демонстрируют устойчивый рост — это именно то, чего нужно добиться в кампании.

Еще один интересный вывод касается необычного поведения пользователей из Индонезии. 249 пользователей установили приложение, но его почти не запускали и не делали покупки. Это может быть признаком мошенничества, который стоит детальнее проанализировать. Для такого анализа мы разработали сервис Protect360.

Резюмируем

  • Когортный анализ помогает проанализировать отдельные группы пользователей, сгруппированные по общим признакам и времени выполнения действий.
  • Метод подходит для оценки эффективности рекламных кампаний, выявления лояльных клиентов, А/Б-тестов.
  • Сначала нужно решить, ответ на какой вопрос ищете и какие показатели нужно для этого сравнивать.

Читать еще: «7 сервисов для визуализации данных: не привлекая дизайнеров и программистов»


Мнение автора и редакции может не совпадать. Хотите написать колонку для «Нетологии»? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.

Университет интернет-профессий
Мы используем файлы cookie
Чтобы улучшить работу сайта и предоставить вам больше возможностей для обучения. Продолжая использовать сайт, вы соглашаетесь с условиями использования файлов cookie.