Мнения / Искусственный интеллект

Как внедрить машинное обучение в бизнес-процессы всего за три шага

Все довольно просто!

12 декабря 2019, 15:39

Как внедрить машинное обучение в бизнес-процессы всего за три шага

Автор:

В наше время миром все больше управляют цифровые технологии. Большие данные, искусственный интеллект, беспилотные автомобили — и это только малая часть того, что ежедневно меняет или будет менять нашу жизнь, наши привычки и то, как мы ведем бизнес. Но как на практике использовать машинное обучение и почему это хорошая инвестиция в бизнес? Рассказывает Константин Королев, руководитель отдела в департаменте Data Science Nielsen Россия.

Именно сегодняшняя доступность больших массивов данных сделали возможным повсеместное использование машинного обучения для решения бизнес-задач, однако есть два главных условия для того, чтобы эта технология работала, — это качество исходных данных и отлаженность модели, которая их обрабатывает. Если они выполняются, то процесс внедрения машинного обучения может занять всего три шага.

Шаг 1. Поставьте цель

Определитесь с задачей и найдите процесс, шаблон работы которого вы сможете детально описать. Помните, алгоритм не заменяет человека и не принимает за вас решений. Поэтому не стоит автоматизировать те процессы, которые требуют учитывать большое количество случайно возникающих факторов.

Делегируйте машинному обучению предсказуемые вещи: определение типа документа или диапазона допустимого изменения показаний датчиков.

Пример

Машинное обучение хорошо подходит для оптимизации рутинных задач. В этом случае его точность близка к максимальной. Поэтому в Nielsen мы используем его для классификации информации о товарах, так как этот процесс не связан с наличием множества изменяющихся переменных.

Каждый день к нам поступают данные, и каждый день алгоритмы обрабатывают и классифицируют их, помогая избежать ошибок на ранних этапах. У этого процесса высокая скорость и точность, так как почти вся поступающая информация нам уже знакома. А когда на рынок выходит новинка, мы проводим дополнительную работу и отлаживаем модель.

Шаг 2. Найдите примеры

Для успешной работы машинного обучения важно иметь так называемые «примеры для подражания», и поэтому нужно заранее подготовить их в достаточном количестве: для каждой группы, с которой алгоритм будет сравнивать новые образцы. И чем больше правильных и разнообразных примеров вы используете, тем более качественный результат получите на выходе.

Пример

Мы работаем с огромным количеством описаний продуктов, чтобы анализировать, что люди покупают, — более миллиона товарных позиций заранее классифицированных по определенным параметрам. К примеру, категория товара, производитель, бренд, вес, вкус и многие другие.

По наборам признаков, которые видны в текстовых описаниях, мы сравниваем полученные данные с теми примерами, которые содержатся в так называемых словарях соответствия, накопленных за десятилетия работы. В них содержится информация обо всех аудируемых продуктах.

Благодаря этому можно отделить обычное молоко от молочных продуктов или газированные напитки в упаковке емкостью 0,5 от двухлитровых. Огромное количество уже существующих примеров делает работу с алгоритмом эффективнее, ведь внести небольшое изменение в текущую модель проще.

Шаг 3. Создайте алгоритм

После описания процесса на словах остается перевести алгоритм в ту форму, которая будет привычна компьютеру — например, с помощью одного из популярных сейчас языков программирования — R или Python. И после первичного обучения модели проверить ее на точность и подобрать оптимальные параметры.

Пример

В примере с анализом продаж мы используем разновидность нейронной сети, которая хорошо зарекомендовала себя с точки зрения классификации данных. Обучив алгоритм на примерах конкретных продуктов, мы стали применять его для масштабных целей: анализа более 500 млн строк данных в месяц, которые поступают из более чем 60 тысяч магазинов по всей стране каждые 30 секунд.

Работа с такими колоссальными объемами данных делает нас единственной компанией на рынке ритейла и FMCG, которая предоставляет структурированную информацию о продажах с детализацией до конкретной товарной позиции. Например, бутылки негазированной воды определенного бренда в объеме 1,5 литра со вкусом лимона. Добиться такой точности не всегда просто из-за того, что зачастую один и тот же товар может быть по-разному закодирован, иметь разные названия или дублировать другие товарные позиции.

Пройдя эти шаги, мы получаем готовое программное решение, «машинный интеллект», который обучен автоматически выполнять поставленную перед ним задачу.

Теперь можно в любой момент отправлять ему новые порции данных в виде десятков и сотен тысяч новых строк описаний, чтобы за несколько секунд или часов (в зависимости от объема данных) классифицировать их. У сотрудников на такую работу вручную точно ушло бы гораздо больше времени.

В долгосрочной перспективе на этом, конечно, процесс не заканчивается. Работающий алгоритм нужно периодически проверять и дообучать. В нашем случае новые продукты постоянно появляются на рынке, а старые постепенно исчезают. И чтобы модель оставалась релевантной, ее нужно адаптировать к этим изменениям.

Как получить максимум?

Итак, чтобы внедрить машинное обучение в бизнес-процессы:

определите процесс, который необходимо оптимизировать. Например, сортировку входящих документов;
найдите примеры данных, которые станут основой обучения алгоритма. Чем больше и разнообразнее они будут, тем лучше;
создайте алгоритм. Популярные языки программирования, например, Python, станут отличным стартом для экспериментов на поле искусственного интеллекта;
тестируйте и корректируйте модель, чтобы добиться максимальной точности. И не забывайте регулярно адаптировать ее к изменениям.

Фото на обложке: Unsplash

Подписаться на телеграм-канал