Мнения / Реклама

Как работает машинное обучение в маркетинге?

Объясняет эксперт

17 апреля 2019, 14:31

Как работает машинное обучение в маркетинге?

Хотя многие до сих пор считают маркетинг отраслью на грани бизнеса и искусства, рекламный рынок давно перестал быть местом, куда стремятся попасть исключительно творческие люди. Индустрия медиа и развлечений, как известно, переживает цифровую трансформацию одной из первых, а значит, и индустрия рекламы вместе с ней – и новые технологии существенно меняют ее ландшафт.

Михаил Горкунов, руководитель отдела Data Science «АДВ Лаб», рассказывает о том, что скрывается за модным научным понятием «машинное обучение» применительно к маркетингу и какие задачи можно решать с помощью алгоритмов ML в этой сфере.

Для чего может использоваться машинное обучение?

Глобально технология чаще всего используется для решения трех основных задач:

классификация – отнесение объекта к тому или иному классу на основании его характеристик (простейший пример – мужчины/женщины);
регрессия – определение значения того или иного параметра объекта на основе имеющихся данных (прогнозирование спроса на определенный товар, роста или падения цен);
кластеризация – поиск независимых групп (кластеров) и их характеристик во всем множестве анализируемых данных (например, разделение писем в электронной почте по тематикам: «работа», «учеба», «личное», «спам» и так далее).

Применительно к маркетингу рассматриваются, как правило, первые две.

Итак, чем же нам могут помочь алгоритмы классификации? Прежде всего, это незаменимый инструмент для создания сегментов look-alike.

Если каких-то десять лет назад мы знали лишь социально-демографический профиль своих потребителей, то сегодня у нас есть данные о том, как они проводят досуг, куда ходят за покупками, что покупают и сколько за это платят. И именно машинное обучение помогает нам связать эти данные и использовать для повышения эффективности рекламы.

Фото: архив автора

Простой пример: допустим, у нас есть небольшой сегмент потребителей, регулярно покупающих витамины. Мы знаем также, чем эти люди занимаются в интернете: на какие сайты ходят, какие действия совершают, какие тематики предпочитают.

Исходя из имеющихся у нас данных (естественно, обезличенных), мы можем предположить, что люди, ведущие себя в сети схожим образом, также могут оказаться в числе тех, кто не прочь купить витамины.

Поиск таких людей вручную занял бы огромное количество времени, однако алгоритм способен производить эти вычисления в тысячи раз быстрее. Таким образом, мы получаем возможность расширить наш сегмент – то есть создать тот самый look-alike.

Еще один возможный вариант применения подобного рода алгоритмов – отслеживание фрода. Думаю, здесь все и так понятно: на основе определенного набора признаков алгоритм решает, была ли ваша реклама в интернете показана человеку или же боту.

Фото: архив автора

Что касается алгоритмов регрессии, они оказываются незаменимы при прогнозировании охватов. Используя обширные данные о прошедших рекламных кампаниях, можно обучить модель предсказывать охват будущей кампании, учитывая такие параметры, как объем бюджета, используемые каналы, сезонность и другие.

Как происходит выбор алгоритма?

Есть ли какие-то популярные алгоритмы, которые используются именно в маркетинге?

В целом, безусловно, существуют алгоритмы, пользующиеся большей популярностью у дата-сайентистов, нежели другие, – некий must-have каждого уважающего себя специалиста по работе с данными (например, логистическая регрессия или «случайный лес»).

Но нельзя сказать, что подобные предпочтения имеются применительно к конкретной отрасли – выбор алгоритма, скорее, исходит из имеющихся задач. Помимо этого, обычно учитываются размер выборки данных и время, необходимое на разработку алгоритма.

Время – это понятный параметр: в стремлении осуществить задуманное мы, как правило, выбираем наиболее быстрый путь.

С выборкой все обстоит интереснее: вы можете построить сложную нейросеть для решения поставленной задачи, но если количество исходных данных невелико, то очень скоро произойдет переобучение, и алгоритм начнет использовать в своих расчетах признаки, не имеющие отношения к реальной задаче.

Например, вы обучаете нейросеть классифицировать изображения людей на мужчин и женщин, однако ваша выборка недостаточно велика, и так получилось, что у всех женщин в ней зеленые глаза.

Фото: архив автора

Алгоритм фиксирует этот момент и начинает использовать данный признак как определяющий пол человека на изображении. Таким образом, как правило, чем меньше выборка, тем проще должен быть алгоритм.

Какие в итоге результаты мы можем получить?

Насколько использование машинного обучения повышает эффективность рекламных кампаний?

В конце 2017 года мы в АДВ поставили перед собой довольно амбициозную цель: объединить данные о том, что делают потребители во всех медиа – проще говоря, создать единую систему измерений для ТВ, интернета, радио и наружной рекламы с возможностью видеть, что делает один и тот же человек в каждом из этих каналов.

На данный момент мы уже имеем возможность создавать единые рекламные кампании для ТВ и интернета – и, конечно же, во многом мы обязаны этому алгоритмам машинного обучения.

Процесс происходит следующим образом: основным поставщиком данных об аудитории на российском рекламном рынке является компания Mediascope. Для того чтобы эффективно планировать размещение сразу в двух ключевых медиа (ТВ+интернет) и определять необходимую долю каждого из них в рекламной кампании, нужно объединить информацию из двух источников – Mediascope TV Index (данные о просмотре ТВ) и Web Index (данные об интернет-пользовании).

Для начала мы используем небольшую выборку, в которой нам уже известны характерные черты поведения одних и тех же пользователей как на ТВ, так и в интернете, и на ее основе обучаем алгоритм находить похожих пользователей в нужных нам источниках.

Фото: Unsplash

Представим: у нас есть пользователь Х. Мы знаем, когда и сколько он смотрит телевизор, какие каналы предпочитает, какие передачи смотрит и многое другое – всего 32 признака. Аналогичная ситуация и с поведением в интернете – там таких признаков аж 88.

Мы находим в TV Index человека с максимально близкими признаками к пользователю Х, а затем проделываем то же самое и в Web Index – для этого используется довольно популярный и простой алгоритм kNN или k-ближайших соседей (как раз тот случай, когда количество исходных данных невелико).

Далее нам остается лишь «соединить» найденных пользователей в двух источниках между собой. Здесь в дело вступает Венгерский алгоритм – он не имеет отношения к машинному обучению, но помогает нам сформировать пары в новой выборке – проще говоря, найти одного и того же человека. Звучит довольно фантастично, однако точность подобного метода составляет порядка 95%.

Иллюстрация: архив автора

Что это нам дает? Возможность контактировать с одним и тем же человеком в разных медиа и именно там, где ему это будет интересно, позволяет снизить стоимость контакта, а также увеличить эффективность рекламы – и это не говоря уже о возможности добавить сюда информацию о покупках (пример с витаминами выше), что также положительно сказывается на результате.

По нашим замерам, такой подход способен увеличить эффективность до 17%. Учитывая, что машинное обучение является одной из самых быстроразвивающихся областей искусственного интеллекта, нетрудно представить, какое будущее нас ждет.

Материалы по теме:

Семь лекций, чтобы понять искусственный интеллект

Когда технологии знают вас лучше, чем вы сами

Почему стоит беспокоиться о том, что машины умеют читать ваши эмоции

Как Uber применяет в бизнесе машинное обучение

Как внедрить машинное обучение и повысить количество откликов на вакансии на 5 миллионов: кейс HeadHunter

Фото на обложке: Unsplash

Авторы