Дмитрий Лучкин, экс-директор по онлайн-маркетингу «Биглион», рассказывает о том, как компания выстроила систему предиктивной аналитики и смогла предсказывать поведение клиентов на 99,5%.
Зачем нам предиктивная аналитика?
Как и большинству проектов в сфере e-commerce, нам нужно одновременно выполнять две задачи.
- Во-первых, удерживать самые доходные сегменты пользователей.
Для этого необходимо знать ответы на ряд вопросов. Например, кто из них недавно совершал покупки? Кто с большей вероятностью уйдет с сервиса, а кто, скорее всего, останется? Если вы знаете, что доходный пользователь с вероятностью 85% уйдет от вас, вы можете направить на него коммуникации для удержания: уведомление с приглашением снова зайти на сервис, рассылку с подборкой интересных предложений, сообщение с промокодом и так далее.
- Во-вторых, пользователей важно склонять на дополнительные покупки, используя сross sale и up sale.
Для этого мы должны выдавать ему предложение, конверсия которого будет выше, чем в случае, если бы он искал товар сам. Здесь все предельно ясно: если пользователь видит больше интересных ему товаров и услуг, он больше покупает.
Первую задачу можно решить, используя предиктивную аналитику: умея предсказывать, когда пользователь, вероятнее всего, уйдет, можно предпринимать попытки его удержать. Чем сильнее удается снизить отток пользователей, тем выше заработок бизнеса. Решение второй задачи – рекомендательная система с достаточно высокой конверсией.
Как мы строили предиктивную аналитику
Сбор данных
Особенность нашей компании состоит в том, что у каждой категории товаров есть своя специфика, средний чек и частота покупок. Взаимодействие пользователя с товарами различных категорий может в корне отличаться. Если на маникюр наша клиентка может ходить раз в неделю, то на концерты – уже раз в пару недель, а в отпуск за границу она ездит два-три раза в год.
За 7 лет работы компании мы накопили данные о нескольких миллионах уникальных покупателей в виде 800 миллионов событий (заходы, покупки, категории покупок, платформы, с которых пользователи приходили, шаги до покупки, брошенные корзины и так далее, в основном поведенческие данные).
Работа с данными
Для построения обеих моделей – по оттоку пользователей и рекомендательной системы – был использован алгоритм Random Forest («Случайный лес»). Это один из алгоритмов кластеризации и классификации, который способен работать с большим числом событий и атрибутов (а в нашем случае – признаков, как, что и где покупал пользователь).
В предиктивной аналитике, если алгоритм методологически подходит к задаче и типу очищенных данных, он применяется и на практике в зависимости от эффективности или, другими словами, от точности предсказаний.
«Случайный лес» не только способен эффективно обрабатывать данные с большим числом признаков, но и может обобщать разные сценарии и улавливать логику поведения пользователей, которая строится на основе многочисленных «разветвлений» их действий. У нас было достаточно данных для того, чтобы с его помощью можно было достаточно эффективно обобщать логику шагов и предсказывать вероятность того или иного действия.
Проверка предсказаний
Убедившись, что выстроенная модель работает, мы проверяли, «сбываются» ли предсказания. По рекомендациям мы оценивали, насколько повысилась конверсия, а по оттоку пользователей – насколько правильные прогнозы их ухода выдавал наш алгоритм. Для этого мы брали когорты клиентов по оттоку и смотрели, где предсказывался уход с вероятностью Х и дальше смотрели, сколько из них ушло через 2-4 недели.
Что мы получили
Запустив построенную модель, мы увидели, что вероятность оттока пользователей (в значениях 75%+, 85%+, 95%+ и так далее) она предсказывает с точностью 99,5%. Этого нам достаточно для того, чтобы эффективно удерживать клиентов, приносящих средний или высокий доход.
Выделив когорты пользователей, которые собрались уходить, мы начинаем использовать кастомизированные мобильные пуш-уведомления, email-рассылки с использованием промокодов и специальных предложений, чтобы простимулировать клиентов на повторную покупку. Можно использовать ремаркетинг на данные когорты, но это более затратный метод, поэтому мы работали в основном с внутренним ресурсом коммуникаций.
Грамотно используя имеющиеся данные (и «отлавливая» как можно раньше тех клиентов, которые собираются уходить), в потенциале можно повысить доход в два раза. Но в принципе снижение доли уходящих на 10-15% (именно процентов, а не пунктов) для любой когорты – уже неплохо. Многое зависит от ее параметров и величины вероятности ухода.
Рекомендательная система тоже показала себя хорошо. Любопытно, что она выделила массу совсем неочевидных (а иногда и вовсе нелогичных) взаимосвязей. Например, после приобретения абонемента в фитнес-клуб следует поход в бар. Пока мы используем рекомендательную систему в тестовом режиме, но в ближайшем будущем запустим ее на всем сервисе. По нашим подсчетам, с ее помощью можно повысить доход на 10-20%.
Можно ли эту систему применять в другом бизнесе?
Несмотря на то что все, о чем мы рассказываем в этой статье, касается именно агрегатора скидок, эти знания можно применять и к любому другому проекту в e-commerce. Важно лишь принять в расчет все особенности бизнеса.
К примеру, для онлайн-магазинов одежды есть уже готовые решения, кстати, хорошо зарекомендовавшие себя на российском рынке. При продаже одежды и обуви можно смотреть на такие параметры: частоту покупок, средний чек, связи между товарами (купила туфли, к ним – сумочку, к ней – шляпу). Также можно определять неожиданные или даже отсутствующие связи («схожие клиенты покупают к товару Х товар А1» из-за эффекта моды или по какой-то другой причине).
Для сервиса доставки еды – предполагаю, что люди заказывают по параметрам вкуса, привычке и по ограничениям кухни/связи между блюдами/диеты/цены, но, скорее всего, они делятся еще на психографические когорты. Кто-то любит повторять выбор, кто-то экспериментировать, кто-то чередовать. Тут нужно строить свое моделирование исходя из пользовательского поведения, когорт, частоты покупок.
Наши рекомендации
Напоследок хочу дать два совета тем, кто собирается строить предиктивную аналитику для своего проекта.
- Во-первых, уделяйте особое внимание нормализации данных, их полноте и чистоте. Вы должны понимать, с чем работаете – от этого напрямую зависит точность предсказаний.
- Во-вторых, помните: самое сложное в предиктивной аналитике – найти баланс между настойчивостью (делаем по этой методологии и бьемся) и умением быть достаточно гибкими, понять и принять свои ошибки и даже сменить алгоритм.
Тут нужно, конечно, работать короткими итерациями: построить модель, проверить прототип, посмотреть «да/нет» и бежать дальше. В обратном случае вы рискуете потратить на модель 6-9 месяцев только чтобы выяснить, что она вам не подходит, и ее вообще невозможно «докрутить» до нормального уровня предсказаний.
Материалы по теме:
Как медиакорпорации используют Big data
Большие данные в ритейле: что они дают и как с ними работать
Анализируй это: как построить аналитику для маркетинга в три шага
Три технологии, которые нужно использовать в ритейле
12 кейсов и 12 технологических решений для анализа больших данных
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
-
Пройти курс «Как открыть пункт выдачи заказов»
- 1 Кадровое делопроизводство: как организовать и избежать ошибок
- 2 Референс-лист компании: как его правильно составить и каким образом использовать?
- 3 10 краудфандинговых проектов, которые собрали больше всего денег
- 4 Девальвация и деноминация: в чем разница