Мы научились предсказывать поведение клиентов. Такой способ может увеличить ваш доход в два раза
Все о возможностях предиктивной аналитики
Дмитрий Лучкин, экс-директор по онлайн-маркетингу «Биглион», рассказывает о том, как компания выстроила систему предиктивной аналитики и смогла предсказывать поведение клиентов на 99,5%.
Зачем нам предиктивная аналитика?
Как и большинству проектов в сфере e-commerce, нам нужно одновременно выполнять две задачи.
- Во-первых, удерживать самые доходные сегменты пользователей.
Для этого необходимо знать ответы на ряд вопросов. Например, кто из них недавно совершал покупки? Кто с большей вероятностью уйдет с сервиса, а кто, скорее всего, останется? Если вы знаете, что доходный пользователь с вероятностью 85% уйдет от вас, вы можете направить на него коммуникации для удержания: уведомление с приглашением снова зайти на сервис, рассылку с подборкой интересных предложений, сообщение с промокодом и так далее.
- Во-вторых, пользователей важно склонять на дополнительные покупки, используя сross sale и up sale.
Для этого мы должны выдавать ему предложение, конверсия которого будет выше, чем в случае, если бы он искал товар сам. Здесь все предельно ясно: если пользователь видит больше интересных ему товаров и услуг, он больше покупает.
Первую задачу можно решить, используя предиктивную аналитику: умея предсказывать, когда пользователь, вероятнее всего, уйдет, можно предпринимать попытки его удержать. Чем сильнее удается снизить отток пользователей, тем выше заработок бизнеса. Решение второй задачи – рекомендательная система с достаточно высокой конверсией.
Как мы строили предиктивную аналитику
Сбор данных
Особенность нашей компании состоит в том, что у каждой категории товаров есть своя специфика, средний чек и частота покупок. Взаимодействие пользователя с товарами различных категорий может в корне отличаться. Если на маникюр наша клиентка может ходить раз в неделю, то на концерты – уже раз в пару недель, а в отпуск за границу она ездит два-три раза в год.
За 7 лет работы компании мы накопили данные о нескольких миллионах уникальных покупателей в виде 800 миллионов событий (заходы, покупки, категории покупок, платформы, с которых пользователи приходили, шаги до покупки, брошенные корзины и так далее, в основном поведенческие данные).
Работа с данными
Для построения обеих моделей – по оттоку пользователей и рекомендательной системы – был использован алгоритм Random Forest («Случайный лес»). Это один из алгоритмов кластеризации и классификации, который способен работать с большим числом событий и атрибутов (а в нашем случае – признаков, как, что и где покупал пользователь).
В предиктивной аналитике, если алгоритм методологически подходит к задаче и типу очищенных данных, он применяется и на практике в зависимости от эффективности или, другими словами, от точности предсказаний.
«Случайный лес» не только способен эффективно обрабатывать данные с большим числом признаков, но и может обобщать разные сценарии и улавливать логику поведения пользователей, которая строится на основе многочисленных «разветвлений» их действий. У нас было достаточно данных для того, чтобы с его помощью можно было достаточно эффективно обобщать логику шагов и предсказывать вероятность того или иного действия.
Проверка предсказаний
Убедившись, что выстроенная модель работает, мы проверяли, «сбываются» ли предсказания. По рекомендациям мы оценивали, насколько повысилась конверсия, а по оттоку пользователей – насколько правильные прогнозы их ухода выдавал наш алгоритм. Для этого мы брали когорты клиентов по оттоку и смотрели, где предсказывался уход с вероятностью Х и дальше смотрели, сколько из них ушло через 2-4 недели.
Что мы получили
Запустив построенную модель, мы увидели, что вероятность оттока пользователей (в значениях 75%+, 85%+, 95%+ и так далее) она предсказывает с точностью 99,5%. Этого нам достаточно для того, чтобы эффективно удерживать клиентов, приносящих средний или высокий доход.
Выделив когорты пользователей, которые собрались уходить, мы начинаем использовать кастомизированные мобильные пуш-уведомления, email-рассылки с использованием промокодов и специальных предложений, чтобы простимулировать клиентов на повторную покупку. Можно использовать ремаркетинг на данные когорты, но это более затратный метод, поэтому мы работали в основном с внутренним ресурсом коммуникаций.
Грамотно используя имеющиеся данные (и «отлавливая» как можно раньше тех клиентов, которые собираются уходить), в потенциале можно повысить доход в два раза. Но в принципе снижение доли уходящих на 10-15% (именно процентов, а не пунктов) для любой когорты – уже неплохо. Многое зависит от ее параметров и величины вероятности ухода.
Рекомендательная система тоже показала себя хорошо. Любопытно, что она выделила массу совсем неочевидных (а иногда и вовсе нелогичных) взаимосвязей. Например, после приобретения абонемента в фитнес-клуб следует поход в бар. Пока мы используем рекомендательную систему в тестовом режиме, но в ближайшем будущем запустим ее на всем сервисе. По нашим подсчетам, с ее помощью можно повысить доход на 10-20%.
Можно ли эту систему применять в другом бизнесе?
Несмотря на то что все, о чем мы рассказываем в этой статье, касается именно агрегатора скидок, эти знания можно применять и к любому другому проекту в e-commerce. Важно лишь принять в расчет все особенности бизнеса.
К примеру, для онлайн-магазинов одежды есть уже готовые решения, кстати, хорошо зарекомендовавшие себя на российском рынке. При продаже одежды и обуви можно смотреть на такие параметры: частоту покупок, средний чек, связи между товарами (купила туфли, к ним – сумочку, к ней – шляпу). Также можно определять неожиданные или даже отсутствующие связи («схожие клиенты покупают к товару Х товар А1» из-за эффекта моды или по какой-то другой причине).
Для сервиса доставки еды – предполагаю, что люди заказывают по параметрам вкуса, привычке и по ограничениям кухни/связи между блюдами/диеты/цены, но, скорее всего, они делятся еще на психографические когорты. Кто-то любит повторять выбор, кто-то экспериментировать, кто-то чередовать. Тут нужно строить свое моделирование исходя из пользовательского поведения, когорт, частоты покупок.
Наши рекомендации
Напоследок хочу дать два совета тем, кто собирается строить предиктивную аналитику для своего проекта.
- Во-первых, уделяйте особое внимание нормализации данных, их полноте и чистоте. Вы должны понимать, с чем работаете – от этого напрямую зависит точность предсказаний.
- Во-вторых, помните: самое сложное в предиктивной аналитике – найти баланс между настойчивостью (делаем по этой методологии и бьемся) и умением быть достаточно гибкими, понять и принять свои ошибки и даже сменить алгоритм.
Тут нужно, конечно, работать короткими итерациями: построить модель, проверить прототип, посмотреть «да/нет» и бежать дальше. В обратном случае вы рискуете потратить на модель 6-9 месяцев только чтобы выяснить, что она вам не подходит, и ее вообще невозможно «докрутить» до нормального уровня предсказаний.
Материалы по теме:
Как медиакорпорации используют Big data
Большие данные в ритейле: что они дают и как с ними работать
Анализируй это: как построить аналитику для маркетинга в три шага
Три технологии, которые нужно использовать в ритейле
12 кейсов и 12 технологических решений для анализа больших данных
-
Партнёрский материал Что сдерживает модернизацию ЖКХ: итоги отраслевой дискуссии на ПМЭФ 16 июня 2026, 15:52
-
Бизнес Как бренд пазлов «Харди Гарди» получил рекламу у блогера-миллионника, просто рассказав о своём проекте 05 июня 2026, 14:23
-
Искусственный интеллект Нам не нужен свой OpenAI: где России искать эффект от ИИ и что для этого делать 19 мая 2026, 11:00
-
Бизнес «Команде не вырасти выше лидера»: как изменить неписаные правила взаимодействия в группе 19 мая 2026, 10:00
-
Личное Дарио Амодеи. Как обыграть OpenAI и создать самый дорогой ИИ-стартап в мире 16 июня 2026, 12:05
-
Ритейл Когда ручная отчётность мешает компании расти: как ускорить аналитику в фешен-ретейле 16 апреля 2026, 18:29
-
Деньги Персональные данные и цифровой след: кто и как на них зарабатывает 27 марта 2026, 10:11
-
Технологии Подключённые автомобили: как интернет меняет автопром 25 марта 2026, 13:17
-
Россия В России обновили реестр автомобилей для такси — в список локализованных моделей вошёл китайский Jetour X70 Plus 16 июня 2026, 16:34
-
Искусственный интеллект Конференция Conversations от Just AI в Петербурге: VK, Wildberries и другие расскажут, как зарабатывают на ИИ 16 июня 2026, 15:36
-
IT Разработчик облачных сервисов Cloud.ru готовится к первому размещению облигаций — его объём оценивают в 10 млрд ₽ 16 июня 2026, 14:11
-
Искусственный интеллект Разработчик DeepSeek увеличил свою оценку до $50 млрд — стартап стал самым дорогим ИИ-проектом в Китае 16 июня 2026, 16:00
-
Россия 2ГИС запустил «Ленту друзей» — теперь пользователи могут увидеть отзывы и рекомендации мест от знакомых 16 июня 2026, 15:00
-
Маркетплейсы Маркетплейсы будут нести административную ответственность за давление на селлеров: штрафы достигнут 500 тыс. рублей 16 июня 2026, 12:20
-
Бизнес Альфа-Банк подвёл итоги первой программы для импортёров: шесть компаний получили гранты по 1 млн ₽ 15 июня 2026, 18:01
-
Бизнес Минфин не ожидает IPO от российских госкомпаний в 2026-м — публичные размещения пройдут только через год 09 июня 2026, 16:00