Колонки

Как прогнозируют спрос в X5 Retail Group?

Колонки
Павел Доронин
Павел Доронин

CEO AI Today, Founder AI Community

Ольга Лисина

AI Community в рамках проекта AI Heroes регулярно проводит вебинары с ведущими экспертами в области Data Science. 

В конце января прошел вебинар с Валерием Бабушкиным — Head of Data Science в X5 Retail Group. По совместительству Валерий — советник группы аналитики в Yandex и один из топ-100 лучших специалистов по Data Science в мире. Он рассказал, зачем нужно прогнозировать спрос в сети магазинов и как это происходит в X5 Retail Group.

Смотреть все материалы серии

Как прогнозируют спрос в X5 Retail Group?

X5 Retail Group управляет магазинами «Пятерочка», супермаркетами «Перекресток» и гипермаркетами «Карусель». Суммарно это более 16 000 магазинов. Прогноз спроса рассчитывается в отдельности на каждый.


Когда возникает потребность прогнозировать спрос?

В случае одного магазина вы точно знаете, что продавать. Вы работаете с поставщиками и с клиентами. У вас отлаженная рабочая система.

Если вы расширяетесь, и у вас десятки магазинов, то возникают вопросы: что и куда везти? Отсюда — необходимость собирать и распределять заявки.

Сотни магазинов — где и что хранить? Нужна CRM / ERP.

В случае Х5, под чьим управлением тысячи магазинов, следует на год вперед договариваться о поставках, отдельно строить собственный распределительный центр.

Задуматься о прогнозировании продаж стоит, когда рост товарооборота окупает затраты на специалистов, и когда заказывают и продают разные люди.


Зачем прогнозировать спрос?

Прогнозирование спроса позволяет предпринимателям увеличивать продажи.

Люди приходят в ваш магазин, и необходимый товар всегда есть в наличии. Значит, в этот раз они его купят, а в следующий раз вернутся снова. Отсюда растет трафик и товарооборот.

Допустим, вы спрогнозировали, что купят 130 единиц товара, а купили 100, осталось — 30. Если прогнозируем 110 единиц, то остаток 10, что гораздо меньше. Таким образом, мы снижаем количество остатков в магазине и не перегружаем наши автомобили бесполезными товарами. 

Как результат, больше покупателей, больше продаем товара, меньше остатков, выше точность доставки, меньше затрат на логистику, увеличение прибыли. Модель циклична.




Какие признаки используются в прогнозе?

  1. Исходные данные: цена, промо, даты праздников, прошлые продажи.
  2. Простые агрегации по категориальным признакам. Их множество — например, город, федеральный округ, день недели.
  3. Внешние данные: курс доллара, погода, реклама.
  4. Рассчитанные производные показатели — эластичность спроса по цене.

Исходя из этого, команда отдела Data Science X5 Retail Group создает список гипотез для проверки. Гипотез существует множество, далее опишем подтвержденные гипотезы, о которых было рассказано на вебинаре.


Примеры гипотез прогнозирования спроса


Гало и каннибализация


Гало и каннибализация — это кросс-эффекты. Разные товары повышают или понижают спрос в зависимости от некоторых условий. 

При гало-эффекте продажи основного товара увеличивают продажи сопутствующих. Простой пример: пиво и сухарики или овсяная каша и молоко. Покупка одного повышает интерес другого.

При каннибализации товары, обладающие схожими характеристиками, замещают друг друга. Спрос одного уменьшает продажи другого. 


Проверка гипотезы осуществляется следующими подходами:

  • Совместная/несовместная покупка.
  • Эмбеддинги по чекам.

Эмбеддинги — это векторное представление слов, обусловленное частотой встречаемости двух слов в одном контексте. В нашем случае, частота встречаемости двух слов в одном чеке. 

  • Регрессия для каждого объекта «магазин — товар».

В случае ритейла, регрессия — это зависимость спроса данного товара от оборота, количества упоминаний в чеках в данном магазине и других факторов.


Погодные факторы


Погода оказывает сильный эффект на спрос. При этом прогноз погоды дает более сильный эффект, чем факт погоды на дату прогноза. Это следует из того, что люди строят планы и совершают покупки на несколько дней вперед в зависимости от прогноза.


Подходы: 

  • Проверяются разные источники данных.
  • Каждая характеристика погоды проходит проверку отдельно.
  • Учитывается различие знаний о текущей погоде и прогнозе погоды на некоторое время вперед.

Кластеризация магазинов


Кластеризация позволяет группировать магазины со схожей структурой спроса. В Х5 все магазины кластеризуются, что повышает качество моделирования. 

Группировать удобно по расположению. В магазин у дома люди чаще заходят за продуктами для приготовления ужина, в магазин около бизнес-центра зайдут скорее за обедом или фруктами. Также учитываются чеки, пол, карты лояльности, конкуренты и другие факторы.


Подходы:

  • Проверка происходит по нескольким признакам. 
  • Производится минимум два подхода: с указанием количества кластеров и без указания. 
  • Далее кластеры интерпретируются с точки зрения бизнеса.

Динамика лояльности посетителей


И здесь лучший источник данных — карты лояльности. Карта лояльности позволяет отследить изменения потребностей покупателя во времени, проникновение лояльности. 

Помимо прямого влияния, информация о лояльности косвенно учитывается во многих признаках. Например, проводится разделение на мужа, жену и бабушку по бонусной карте, и можно использовать эту информацию о сегментации — какой сегмент в каком проценте присутствует в данном магазине. 


Вывод

В X5 Retail Group непрерывно генерируют новые гипотезы и проверяют их. На основе полученных результатов они совершенствуют существующие модели. 


Благодаря этому

  • витрины не бывают пустыми,
  • необходимый товар всегда в наличии,
  • продукты свежие,
  • вам приходят интересные акционные предложения,
  • легко ориентироваться в категориях товаров,
  • товары агрегированы под ЦА каждого магазина в отдельности,
  • удобное расположение магазинов,
  • невысокие цены.

А главное, это сказывается на трафике покупателей, что в конечном счете влияет на прибыль. 


Как получить максимум

Если вы задумались о прогнозировании спроса в вашем бизнесе, вам следует ответить на три вопроса:

  1. В вашей компании заказывают и продают товары разные люди?
  2. Отлажены ли у вас бизнес-процессы?
  3. Окупятся ли затраты на специалистов и «железо»?

Если ответы утвердительные, надо понять, откуда вы будете брать данные.

Допустим, все необходимые данные хранятся в системе компании и могут быть оттуда извлечены. Необходим объем данных минимум за последние 1–3 года.

И помните: прогнозирование спроса позволит всегда держать ваш бизнес на качественном уровне. Проверяя новые гипотезы, вы составите максимально точные портреты ваших клиентов. Вам будет проще их порадовать, а они будут чаще возвращаться именно к вам! 


Фото на обложке: Shutterstock / Tashatuvango

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 Как повысить продажи в три раза с помощью Big Data и машинного обучения?
  2. 2 Фантастическое будущее ритейла: какие технологии изменят отрасль
  3. 3 Большие данные в ритейле: что они дают и как с ними работать

Актуальные материалы —
в Telegram-канале @Rusbase

ВОЗМОЖНОСТИ

08 августа 2020

Цифровые джунгли

09 августа 2020

IT хакатон

09 августа 2020

Лето.SAAS