Колонки
DIG(IT)AL

Как построить ассортимент на основе Big Data

Колонки
Данила Наумов
Данила Наумов

Директор управления данными «Утконос Онлайн»

Ирина Печёрская

Возможности Big Data все чаще используют в управлении регулярными процессами ритейла, и «Утконос» уже успел оценить преимущества больших данных. Сейчас в каталоге гипермаркета — 52 тыс. товаров. В 2021 году компания планирует увеличить ассортимент до 150 тыс. наименований с помощью подхода Data-driven.

Подробнее о возможностях этого инструмента для ритейла — Данила Наумов, директор управления данными «Утконос Онлайн».

Как построить ассортимент на основе Big Data


В проекте Dig(IT)al рассказываем о технологиях, которые помогут вам заработать. Переходите на цифровую сторону бизнеса.


В контексте ритейла Data-Driven открывает доступ к важным практическим результатам:
  • создание рабочих персонализированных предложений;
  • улучшение доставки и сервиса;
  • выстраивание ассортимента, мотивирующего клиента к повторным заказам.

 

Онлайн-галерея «Цифровые двойники». Угадай, что изображено на картинах.

Использовать метод регрессионного анализа

Из запланированных 150 тыс. товаров в ассортименте 70 тыс. приходится на продукты питания. Остальное — товары из сопутствующих категорий: для детей, для красоты, для дома и сада и т. п. Перед нами стояли два ключевых вопроса:

  1. С каких категорий начать расширение ассортимента?
  2. Как спрогнозировать изменение выручки при расширении разных категорий?

Для решения задачи с приоритезацией ассортимента команда «Утконос» воспользовалась методом регрессионного анализа.

Справка

Регрессионный анализ — это набор статистических методов, которые позволяют исследовать, как одна или несколько независимых переменных влияют на зависимую переменную. Такой подход, понятный и логически интерпретируемый, дает возможность принимать решение, основанное на цифрах, а не только на личном мнении.

Регрессионный анализ дает возможность поиска связи между ассортиментом и очищенной выручкой. Мы построили регрессионную зависимость выручки и пенетрации в чек от количества товаров в категории. Под пенетрацией понимается доля чеков (т.е. заказов), в которых есть хотя бы один товар из категории. В этом помогает моделирование.

Благодаря моделированию можно оценить, какая будет выручка в категории при изменении ассортимента. В регрессионную модель подставляется целевой ассортимент, после чего моделируется выручка. Этот метод показывает изменение выручки при добавлении одной позиции в каждую категорию и упрощает расстановку приоритетов при расширении категорий.

Для каждой продуктовой категории, включая подкатегории разного уровня, были построены диаграммы рассеивания по медианным значениям:

  • выручки в зависимости от количества товаров на складе;
  • очищенной от трендов и сезонностей выручки в зависимости от количества товаров на складе;
  • % пенетрации в зависимости от количества товаров на складе.  

 Пример диаграммы

Наши аналитики искали те категории товаров, которые могут сильнее «выстрелить». Зеленой пунктирной чертой на графиках отмечено текущее количество товаров на складе в определенной категории. Точками отмечены фактические медианные значения, а красная линия описывает эти точки. 

По красной линии можно предположить, насколько насыщена рассматриваемая категория: чем более горизонтальной получается линия, тем категория более насыщена. Следовательно, при увеличении ассортимента значительных изменений в выручке или пенетрации не ожидается.

 

Пример

Рассмотрим Data-driven подход к расширению ассортимента на основе категорий молочных и кисломолочных продуктов. 

 

 

Разница в эффективности добавления в ассортимент разных категорий хорошо демонстрируется линиями регрессии. Так, например, категория молока перенасыщена, а увеличение категории кисломолочных продуктов может дать положительный эффект.

Сравнивать десятки графиков по категориям оказалось достаточно трудоемко. Поэтому наши аналитики разработали удобную модель расчета, основываясь на коэффициентах регрессий. Благодаря такому подходу специалисты, которым нужно было добавить, допустим, 100 новых позиций, просто вводили целевую цифру и получали распределение по продуктовым категориям.

Результат показал, сколько из 100 позиций должно быть отдано, например, десертам, а сколько — кисломолочным продуктам. Полученный результат максимизировал потенциальную выручку и пенетрацию в чеке.

Если мы хотим увеличить ассортимент категории «Молочные продукты» на 100 позиций (на 6 %), то рекомендации по расширению категорий будут следующие:

 

Категория ур. 4 Текущий ассортимент Кол-во добавляемых товаров Дельта очищенной выручки
Масло сливочное 91 30 0,42 %
Сливки жидкие 53 17 0,26 %
Сметана 92 14 0,15 %
Растительные десерты ложковые 33 10 0,14 %
Творог 212 10 0,10 %
Десертные снеки 36 7 0,08 %
Молоко коровье 158 7 0,07 %
Функциональные напитки 16 5 0,19 %

 

По оценкам модели мы увеличим выручку на 1,4 %

Принципы расширения ассортимента на основе моделирования упрощают компоновку ассортимента, при этом важно уловить значимые тренды и новинки. Моделирование не заменяет экспертный подход, а автоматизирует все, что можно автоматизировать.

Модель и автоматизация не смогут учитывать новинки и тренды, по которым не хватает еще данных в истории для моделирования. Сочетание работы человека и алгоритма — вот, что дает максимальный результат.


Big Data помогает оценить эффективность ассортимента и понять, как выводить неэффективные товары, но при этом сохранять значимые для клиентов. Внутри категорий зачастую есть большой «хвост» — это товары с небольшим объемом продаж. Как понять, есть ли какие-то причины, чтобы оставить эти товары в ассортиментной матрице? Чтобы принять решение, мы определили показатели, которые могут быть аргументом в пользу того, чтобы оставить товар.

Для каждого товара на основе рассчитанных показателей была составлена «Оценка эффективности». Если показатель имеет хорошее значение, то к оценке прибавляются баллы. Если в итоге товар не набрал ни одного балла, можно говорить о его выводе из ассортимента. Подробнее о системе оценки товаров можно почитать здесь.

Ассортимент не всегда является приоритетной задачей при использовании методов Big Data в ритейле. Традиционно это задачи целевого маркетинга, прогноз спроса, ценообразование. В онлайн-гипермаркете «Утконос» по этим направлениям активно применяются алгоритмы машинного обучения.

«Утконос» располагает тремя ЦОДами. При построении ассортимента мы учитываем объемные Click Stream данные о просмотрах товаров и добавлении в «Корзины», а также данные о созданных и оплаченных товарах, ценах и множестве других показателей. 

В 2021 году планируем встроить алгоритмы машинного обучения в наши витрины и постоянное А/В-тестирование для улучшения клиентского опыта с подтверждением результатов по метрикам.

Как представители рынка электронной коммерции, мы хотим понимать все возможности методов Big Data и использовать их на практике. Так, коммерческий отдел уже получил гибкий инструмент определения целевой ширины ассортимента в категории, возможность прогнозировать влияние расширения ассортимента на выручку, а также выстраивать приоритеты в работе. 

Инструмент оценки эффективности ассортимента также позволил автоматизировать бизнес-процессы управления ассортиментной матрицей и улучшить показатели оборачиваемости.

 

Как получить максимум

1. Для каждой категории необходимых уровней иерархии на каждую неделю анализируемого периода важно рассчитать:

  • среднее количество товаров по данным о наличии на складе;
  • количество заказов, выручку и очищенную выручку от тренда и сезонности, пенетрацию в чек.

2. По каждой категории и количеству товаров в неделю найти медианные выручки, очищенную выручку, пенетрацию в чек.

3. Для каждой категории необходимо построить регрессионную модель, взять ее коэффициенты для определения дельты выручки, очищенной выручки, пенетрации в чек при увеличении количества товаров.

4. По полученным коэффициентам регрессий надо определить, сколько дополнительной выручки, очищенной выручки будет генерировать или добавлять в пенетрацию в чек добавление каждого нового товара в категории.

5. Далее следует отсортировать каждый новый добавляемый товар в категориях по уменьшению дельты очищенной выручки. Имея ограничение на общее количество добавляемых товаров в категории и ограничение на то, что категория может расширяться от определенного % текущего числа товаров, надо распределить это общее количество товаров по категориям с учетом заданной сортировки. Число добавленных товаров, равное нулю, в распределении не участвует.

Не для всех категорий удается рассчитать необходимые показатели, потому что где-то не хватает данных истории, где-то недостаточно разнообразия количества товаров в неделю. Подобные категории имеют максимальное число добавленных товаров, равное нулю, и не участвуют в распределении.

Фото на обложке: Sorbis/shutterstock.com

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 «Это единственный выбор на пути к нормальной жизни»: что малый бизнес говорит сотрудникам о вакцинации
  2. 2 Скоро на экранах: ByteDance готовится вывести TikTok на Smart TV
  3. 3 AMC, GameStop и другие: почему растут «‎акции-мемы»
  4. 4 БФ «Система» проведет круглый стол на тему карьеры в ответственных компаниях
  5. 5 Что нужно, чтобы создать приложение для обучения детей?
EdTech: карта российского рынка
Все компании и инвесторы в области образовательных технологий
Перейти

ВОЗМОЖНОСТИ

18 июня 2021

18 июня 2021