Мы научились предсказывать поведение клиентов. Такой способ может увеличить ваш доход в два раза

Дмитрий Лучкин
Дмитрий Лучкин

Экс-директор по онлайн-маркетингу «Биглион»

Расскажите друзьям
Полина Константинова

Дмитрий Лучкин, экс-директор по онлайн-маркетингу «Биглион», рассказывает о том, как компания выстроила систему предиктивной аналитики и смогла предсказывать поведение клиентов на 99,5%.

Зачем нам предиктивная аналитика?

Как и большинству проектов в сфере e-commerce, нам нужно одновременно выполнять две задачи.

  • Во-первых, удерживать самые доходные сегменты пользователей.

Для этого необходимо знать ответы на ряд вопросов. Например, кто из них недавно совершал покупки? Кто с большей вероятностью уйдет с сервиса, а кто, скорее всего, останется? Если вы знаете, что доходный пользователь с вероятностью 85% уйдет от вас, вы можете направить на него коммуникации для удержания: уведомление с приглашением снова зайти на сервис, рассылку с подборкой интересных предложений, сообщение с промокодом и так далее.

  • Во-вторых, пользователей важно склонять на дополнительные покупки, используя сross sale и up sale.

Для этого мы должны выдавать ему предложение, конверсия которого будет выше, чем в случае, если бы он искал товар сам. Здесь все предельно ясно: если пользователь видит больше интересных ему товаров и услуг, он больше покупает.

Первую задачу можно решить, используя предиктивную аналитику: умея предсказывать, когда пользователь, вероятнее всего, уйдет, можно предпринимать попытки его удержать. Чем сильнее удается снизить отток пользователей, тем выше заработок бизнеса. Решение второй задачи – рекомендательная система с достаточно высокой конверсией.

Как мы строили предиктивную аналитику

Сбор данных

Особенность нашей компании состоит в том, что у каждой категории товаров есть своя специфика, средний чек и частота покупок. Взаимодействие пользователя с товарами различных категорий может в корне отличаться. Если на маникюр наша клиентка может ходить раз в неделю, то на концерты – уже раз в пару недель, а в отпуск за границу она ездит два-три раза в год.

За 7 лет работы компании мы накопили данные о нескольких миллионах уникальных покупателей в виде 800 миллионов событий (заходы, покупки, категории покупок, платформы, с которых пользователи приходили, шаги до покупки, брошенные корзины и так далее, в основном поведенческие данные).

Работа с данными

Для построения обеих моделей – по оттоку пользователей и рекомендательной системы – был использован алгоритм Random Forest («Случайный лес»). Это один из алгоритмов кластеризации и классификации, который способен работать с большим числом событий и атрибутов (а в нашем случае – признаков, как, что и где покупал пользователь).

В предиктивной аналитике, если алгоритм методологически подходит к задаче и типу очищенных данных, он применяется и на практике в зависимости от эффективности или, другими словами, от точности предсказаний.

«Случайный лес» не только способен эффективно обрабатывать данные с большим числом признаков, но и может обобщать разные сценарии и улавливать логику поведения пользователей, которая  строится на основе многочисленных «разветвлений» их действий. У нас было достаточно данных для того, чтобы с его помощью можно было достаточно эффективно обобщать логику шагов и предсказывать вероятность того или иного действия.

Проверка предсказаний

Убедившись, что выстроенная модель работает, мы проверяли, «сбываются» ли предсказания. По рекомендациям мы оценивали, насколько повысилась конверсия, а по оттоку пользователей – насколько правильные прогнозы их ухода выдавал наш алгоритм. Для этого мы брали когорты клиентов по оттоку и смотрели, где предсказывался уход с вероятностью Х и дальше смотрели, сколько из них ушло через 2-4 недели.  

Что мы получили

Запустив построенную модель, мы увидели, что вероятность оттока пользователей (в значениях 75%+, 85%+, 95%+ и так далее) она предсказывает с точностью 99,5%. Этого нам достаточно для того, чтобы эффективно удерживать клиентов, приносящих средний или высокий доход.

Выделив когорты пользователей, которые собрались уходить, мы начинаем использовать кастомизированные мобильные пуш-уведомления, email-рассылки с использованием промокодов и специальных предложений, чтобы простимулировать клиентов на повторную покупку. Можно использовать ремаркетинг на данные когорты, но это более затратный метод, поэтому мы работали в основном с внутренним ресурсом коммуникаций.

Грамотно используя имеющиеся данные (и «отлавливая» как можно раньше тех клиентов, которые собираются уходить), в потенциале можно повысить доход в два раза. Но в принципе снижение доли уходящих на 10-15% (именно процентов, а не пунктов) для любой когорты – уже неплохо. Многое зависит от ее параметров и величины вероятности ухода.

Рекомендательная система тоже показала себя хорошо. Любопытно, что она выделила массу совсем неочевидных (а иногда и вовсе нелогичных) взаимосвязей. Например, после приобретения абонемента в фитнес-клуб следует поход в бар. Пока мы используем рекомендательную систему в тестовом режиме, но в ближайшем будущем запустим ее на всем сервисе. По нашим подсчетам, с ее помощью можно повысить доход на 10-20%.

Можно ли эту систему применять в другом бизнесе?

Несмотря на то что все, о чем мы рассказываем в этой статье, касается именно агрегатора скидок, эти знания можно применять и к любому другому проекту в e-commerce. Важно лишь принять в расчет все особенности бизнеса.

К примеру, для онлайн-магазинов одежды есть уже готовые решения, кстати, хорошо зарекомендовавшие себя на российском рынке. При продаже одежды и обуви можно смотреть на такие параметры: частоту покупок, средний чек, связи между товарами (купила туфли, к ним – сумочку, к ней – шляпу). Также можно определять неожиданные или даже отсутствующие связи («схожие клиенты покупают к товару Х товар А1» из-за эффекта моды или по какой-то другой причине).

Для сервиса доставки еды – предполагаю, что люди заказывают по параметрам вкуса, привычке и по ограничениям кухни/связи между блюдами/диеты/цены, но, скорее всего, они делятся еще на психографические когорты. Кто-то любит повторять выбор, кто-то экспериментировать, кто-то чередовать. Тут нужно строить свое моделирование исходя из пользовательского поведения, когорт, частоты покупок.

Наши рекомендации

Напоследок хочу дать два совета тем, кто собирается строить предиктивную аналитику для своего проекта.

  • Во-первых, уделяйте особое внимание нормализации данных, их полноте и чистоте. Вы должны понимать, с чем работаете – от этого напрямую зависит точность предсказаний.

  • Во-вторых, помните: самое сложное в предиктивной аналитике – найти баланс между настойчивостью (делаем по этой методологии и бьемся) и умением быть достаточно гибкими, понять и принять свои ошибки и даже сменить алгоритм.

Тут нужно, конечно, работать короткими итерациями: построить модель, проверить прототип, посмотреть «да/нет» и бежать дальше. В обратном случае вы рискуете потратить на модель 6-9 месяцев только чтобы выяснить, что она вам не подходит, и ее вообще невозможно «докрутить» до нормального уровня предсказаний.


Материалы по теме:

Как медиакорпорации используют Big data

Большие данные в ритейле: что они дают и как с ними работать

Анализируй это: как построить аналитику для маркетинга в три шага

Три технологии, которые нужно использовать в ритейле

12 кейсов и 12 технологических решений для анализа больших данных


Актуальные материалы — в Telegram-канале @Rusbase

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter


Комментарии

Зарегистрируйтесь, чтобы оставлять комментарии и получить доступ к Pipeline — социальной сети, соединяющей стартапы и инвесторов.
Innovate or Die
13 ноября 2018
Ещё события


Telegram канал @rusbase