Колонки

Как внедрить машинное обучение в бизнес-процессы всего за три шага

Колонки
Константин Королев
Константин Королев

Руководитель отдела в департаменте Data Science Nielsen Россия

Полина Константинова

В наше время миром все больше управляют цифровые технологии. Большие данные, искусственный интеллект, беспилотные автомобили — и это только малая часть того, что ежедневно меняет или будет менять нашу жизнь, наши привычки и то, как мы ведем бизнес. Но как на практике использовать машинное обучение и почему это хорошая инвестиция в бизнес? Рассказывает Константин Королев, руководитель отдела в департаменте Data Science Nielsen Россия.

Как внедрить машинное обучение в бизнес-процессы всего за три шага

Именно сегодняшняя доступность больших массивов данных сделали возможным повсеместное использование машинного обучения для решения бизнес-задач, однако есть два главных условия для того, чтобы эта технология работала, — это качество исходных данных и отлаженность модели, которая их обрабатывает. Если они выполняются, то процесс внедрения машинного обучения может занять всего три шага.


Шаг 1. Поставьте цель

Определитесь с задачей и найдите процесс, шаблон работы которого вы сможете детально описать. Помните, алгоритм не заменяет человека и не принимает за вас решений. Поэтому не стоит автоматизировать те процессы, которые требуют учитывать большое количество случайно возникающих факторов. 

Делегируйте машинному обучению предсказуемые вещи: определение типа документа или диапазона допустимого изменения показаний датчиков.

Пример

Машинное обучение хорошо подходит для оптимизации рутинных задач. В этом случае его точность близка к максимальной. Поэтому в Nielsen мы используем его для классификации информации о товарах, так как этот процесс не связан с наличием множества изменяющихся переменных. 

Каждый день к нам поступают данные, и каждый день алгоритмы обрабатывают и классифицируют их, помогая избежать ошибок на ранних этапах. У этого процесса высокая скорость и точность, так как почти вся поступающая информация нам уже знакома. А когда на рынок выходит новинка, мы проводим дополнительную работу и отлаживаем модель.


Шаг 2. Найдите примеры

Для успешной работы машинного обучения важно иметь так называемые «примеры для подражания», и поэтому нужно заранее подготовить их в достаточном количестве: для каждой группы, с которой алгоритм будет сравнивать новые образцы. И чем больше правильных и разнообразных примеров вы используете, тем более качественный результат получите на выходе.

Пример

Мы работаем с огромным количеством описаний продуктов, чтобы анализировать, что люди покупают, — более миллиона товарных позиций заранее классифицированных по определенным параметрам. К примеру, категория товара, производитель, бренд, вес, вкус и многие другие.

По наборам признаков, которые видны в текстовых описаниях, мы сравниваем полученные данные с теми примерами, которые содержатся в так называемых словарях соответствия, накопленных за десятилетия работы. В них содержится информация обо всех аудируемых продуктах. 

Благодаря этому можно отделить обычное молоко от молочных продуктов или газированные напитки в упаковке емкостью 0,5 от двухлитровых. Огромное количество уже существующих примеров делает работу с алгоритмом эффективнее, ведь внести небольшое изменение в текущую модель проще.


Шаг 3. Создайте алгоритм

После описания процесса на словах остается перевести алгоритм в ту форму, которая будет привычна компьютеру — например, с помощью одного из популярных сейчас языков программирования — R или Python. И после первичного обучения модели проверить ее на точность и подобрать оптимальные параметры. 

Пример

В примере с анализом продаж мы используем разновидность нейронной сети, которая хорошо зарекомендовала себя с точки зрения классификации данных. Обучив алгоритм на примерах конкретных продуктов, мы стали применять его для масштабных целей: анализа более 500 млн строк данных в месяц, которые поступают из более чем 60 тысяч магазинов по всей стране каждые 30 секунд. 

Работа с такими колоссальными объемами данных делает нас единственной компанией на рынке ритейла и FMCG, которая предоставляет структурированную информацию о продажах с детализацией до конкретной товарной позиции. Например, бутылки негазированной воды определенного бренда в объеме 1,5 литра со вкусом лимона. Добиться такой точности не всегда просто из-за того, что зачастую один и тот же товар может быть по-разному закодирован, иметь разные названия или дублировать другие товарные позиции.

Пройдя эти шаги, мы получаем готовое программное решение, «машинный интеллект», который обучен автоматически выполнять поставленную перед ним задачу.

Теперь можно в любой момент отправлять ему новые порции данных в виде десятков и сотен тысяч новых строк описаний, чтобы за несколько секунд или часов (в зависимости от объема данных) классифицировать их. У сотрудников на такую работу вручную точно ушло бы гораздо больше времени.

В долгосрочной перспективе на этом, конечно, процесс не заканчивается. Работающий алгоритм нужно периодически проверять и дообучать. В нашем случае новые продукты постоянно появляются на рынке, а старые постепенно исчезают. И чтобы модель оставалась релевантной, ее нужно адаптировать к этим изменениям.


Как получить максимум?

Итак, чтобы внедрить машинное обучение в бизнес-процессы:

  • определите процесс, который необходимо оптимизировать. Например, сортировку входящих документов;
  • найдите примеры данных, которые станут основой обучения алгоритма. Чем больше и разнообразнее они будут, тем лучше;
  • создайте алгоритм. Популярные языки программирования, например, Python, станут отличным стартом для экспериментов на поле искусственного интеллекта;
  • тестируйте и корректируйте модель, чтобы добиться максимальной точности. И не забывайте регулярно адаптировать ее к изменениям.

Фото на обложке: Unsplash

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 Словарь: чем различаются машинное и глубокое обучение
  2. 2 Как работает машинное обучение в маркетинге?
  3. 3 Как Uber применяет в бизнесе машинное обучение

Актуальные материалы —
в Telegram-канале @Rusbase

ВОЗМОЖНОСТИ

14 июля 2020

FoodTech

15 июля 2020

NeuroTech