Мнения / Бизнес

Мы оптимизируем бизнес-процессы с помощью ML уже почти 2 года. Каких результатов удалось достичь?

Кейс Qlean

05 декабря 2018, 13:13

6 минут

Бизнес

Автор:

Федор Брюховецкий

Федор Брюховецкий, аналитик данных команды Core в Qlean, рассказывает, зачем в компании внедрили машинное обучение, и называет бизнес-процессы, оптимизированные с помощью ML-моделей.

Что такое Machine Learning?

Технологии машинного обучения и предиктивного анализа стремительно ворвались в тренды последних лет. В общих словах, Machine Learning (ML) – классы алгоритмов, позволяющие компьютеру делать выводы на основании данных, не будучи явно запрограммированным. В основе моделей машинного обучения лежат такие принципы, как математическая статистика, теория вероятности, линейная алгебра, теория оптимизации и другие.

Одно из направлений ML – это обучение без учителя. В этом случае компьютер будет самостоятельно искать закономерности в данных. Такой подход может применяться, например, для выявления фрода в бизнес-процессах.

Другое направление – это обучение с учителем. В этом случае компьютер получает большой массив примеров и старается обобщить их, используя для дальнейшего прогнозирования. Работает это так: зная, как реагирует клиент или клинер в конкретной ситуации, мы можем создать алгоритм, обобщающий их поведение. По сути, данные типа «ситуация – реакция пользователя» формируют обучающую выборку для ML. Важными факторами являются как объем обучающей выборки, так и грамотная оценка способности полученной модели к обобщению.

Зачем это нам?

Основной целью внедрения решений на базе ML было поддержание гармоничного роста компании путем эффективного управления спросом со стороны клиентов и предложением со стороны клинеров.

В основе поставленной цели была простая логика – делая оценку текущих заказов и предсказывая изменения факторов на будущее, мы сможем заранее выработать наиболее оптимальные сценарии обработки заказов. Как следствие – повышение качества нашего продукта и минимизация операционных издержек.

Понимая, что алгоритмы ML не создают каких-то новых бизнес-процессов, а лишь оптимизируют существующие, мы пересмотрели часть из них. Именно выстроенные бизнес-процессы и накопленные за годы работы данные о клиентском и клинерском поведении позволили нам начать процесс внедрения предсказательной аналитики в Qlean. Прошло уже практически два года, как мы сделали первые шаги в оптимизации наших процессов с помощью ML.

Откуда брали данные?

Итак, первый шаг – это собрать воедино данные о заказе и о поведении клиентов и клинеров. Для этого мы использовали разные данные:

логи изменений заказов
логи клинероской активности
логи клиентской активности
метаданные о заказе, клинере и клиенте
данные из нашей CRM-системы
комментарии и отзывы клиента
внешние данные (праздничные дни, тренды поисковых запросов и пр.)

Что мы делали с данными?

После сбора данных начинается второй шаг: их предобработка, исходя из конкретного бизнесс-процесса и цели. Очевидно, что параметры, имеющие хорошую предсказательную способность для одного процесса, могут быть полностью бесполезны для другого. Например, положение квартиры может влиять на «привлекательность» заказа для клинера, но быть полностью бесполезным при оценке вероятности отмены этого заказа клиентом. Таким образом, второй шаг обычно состоит из:

первичного отбора факторов, основанного на бизнес-логике
очистки и предобработки данных
генерации новых факторов

В итоге мы получаем набор параметров, создающих для Qlean «портрет личности» с его набором предпочтений, привычек и особенностей в рамках конкретного процесса. Это важный шаг перед заключительным этапом отбора значимых параметров, построения самой предиктивной модели и началом ее эксплуатации.

Как это работает?

Мы выделили ключевой для нас бизнес-процесс – процесс создания и распределения заказов – и решили его автоматизировать при помощи ML в первую очередь. Ниже приведу несколько конкретных примером применения предиктивного анализа у нас в компании.

Управление доступными слотами

Один из базовых процессов в Qlean – это управление доступными слотами (временным диапазоном доступным для создания заказа). Оптимальное открытие и закрытие слотов дает возможность максимизировать количество выполненных заказов, не допуская овербукинга. Cлоты во внутреннем аналитическом отчете:

Те же слоты, но уже на главное странице Qlean:

Для прогноза доступного количество слотов на несколько дней вперед мы должны уметь точно предсказывать количество активных клинеров, что равнозначно предсказанию Supply на каждый день. Сначала задачу предсказания количества активных клинеров мы решили с помощью модели градиентного бустинга, оценивая вероятность выхода на работу конкретного клинера в конкретный день.

Этот подход хорошо работал для старых клинеров, но при большом притоке новых точность модели сильно упала, и нам пришлось пересмотреть подход. Сейчас мы перешли к оценке самого тренда изменения количества клинеров и используем модель авторегрессии и скользящего среднего, при этом относительное отклонение не превышает 5%.

Прогнозирование неприезда клинера

Даже при оптимальном управлении слотами какие-то заказы остаются нераспределенными между клинерами и в конечном счете не будут выполнены. На решение клинера взять заказ влияет ряд факторов: удаленность заказа, время дня, количество комнат, попадание даты старта заказа в «сезон отпусков» и другие. Как компания, в случае неприезда клинера, мы стараемся компенсировать неудобство клиенту путем выплат бонусов.

Это решало проблему в конкретном случае, но для системного подхода необходим был инструмент для прогнозирования таких заказов. Поэтому мы создали модель для оценки вероятности распределения заказа, основанную на логистической регрессии, и выделили отдельный процесс для обработки таких заказов. Как результат, снижение количества неприездов на 60% в первые две недели после внедрения относительно такого же временного промежутка до внедрения.

Ложные заказы

Также одна из бизнес-задач, которую мы решили при помощи Machine Learning, – это борьба с ложными заказами. Ложным заказом считается тот, на который приехал клинер, но который оказался неактуальным, например, клиент оформил заказ по ошибке или забыл о нем. Это проблема для нас по нескольким причинам:

мы компенсируем клинеру издержки, связанные с этим заказом
фактически сокращаем наш Supply, «теряя» клинера на таком заказе

Для решения этой проблемы мы создали модель оценки вероятности отмены заказа со стороны клиента на базе алгоритма градиентного бустинга. Теперь, анализируя поведение клиента и принимаемые им решения, характеристики его заказа и подписки, мы можем с высокой вероятностью предсказывать ситуации с ложным заказами и заранее их обрабатывать.

А именно, мы классифицировали заказы по вероятности их отмены и начали обзванивать пользователей для уточнения актуальности их заказов. В случае, если заказ действительно становится неактуальным, мы его закрываем. Таким образом, мы оставляем для клинеров только актуальные заказы, снижая количество «холостых» выездов к клиенту.

На графике ниже приведен пример динамики изменения количества нераспределенных между клинерами заказов на конкретный день. Как видно, наиболее стремительное снижение происходит в период обзвона клиентов среди заказов с наибольшей вероятностью отмены.

Выводы

Даже не самые сложные модели машинного обучения, действительно, способны помочь бизнесу. Это популярное и динамично развивающееся направление, которое активно внедряется во многих компаниях. Мы решили многие задачи, оптимизировав процесс обработки и распределения заказов, а также минимизировав убытки. Тем не менее не стоит гоняться за хайпом и стремиться запустить машинное обучение, чего бы это не стоило. Оцените насколько это необходимо, а именно: