Что может Big Data в рекламе?

Никита Стаценко

Внештатный автор

Расскажите друзьям
Светлана Зыкова
Никита Стаценко

Высокоточное профилирование, скоринг пользователей, распознавание лиц, определение мотивов потребителей, выявление связей между людьми и агентов влияния в группах — это далеко не все, на что способны «большие данные». Обо всем этом в лектории BBDO Moscow рассказал генеральный директор SocialDataHub Артур Хачуян.

Открытые данные, которые в своей работе использует SocialDataHub, — это все то, до чего можно «дотянуться» без логина и пароля: открытые профили в соцсетях, поисковая выдача, открытые реестры и т.д. Термин Big Data, по словам Артура Хачуяна, можно применять, когда объем такой информации достигает 1 млрд строк, если данные представлены в виде таблицы, либо 1 Пб, если говорить о файловом хранилище.

Как правило, «околобигдатные» решения применяются для таргетирования аудитории и анализа маркетинговых исследований. Но этим использование больших данных не ограничивается.


Открытости становится больше

Большинство пользователей сейчас начинают открывать свои профили в соцсетях, например, во «ВКонтакте» всего лишь 14% закрытых аккаунтов. Люди перестают остро реагировать на то, что кто-то узнает о них слишком много. Ведь огромное количество информации можно получить, если просто бегло проанализировать профиль, записи и список друзей человека в соцсетях.

Из открытых источников можно выяснить много: HR-агентство может узнать, ругается ли матом потенциальный работник, ставит ли лайки под публикациями Навального или «Единой России». Часто открытая информация касается семейных ценностей, стоимости недвижимости, поиска автомобиля и т.д. С точки зрения маркетинга по этим метрикам можно разбить людей на различные группы для дальнейшей коммуникации.

SocialDataHub собирает данные 11 социальных сетей («ВКонтакте», Facebook, «Одноклассники», Instagram и др.). Это 430 млн пользователей, 200 млн из которых постоянно активны. Данные включают профили, группы, связи людей между собой, текстовый контент, который они постят, фотографии, если на них есть лица.

Специалисты стараются связать каждую соцсеть с другой, актуальность данных постоянно проверяется: на обновление базы «ВКонтакте» уходит около двух дней, на Facebook — около недели. Таким образом можно отследить, что изменилось у пользователей, а что осталось прежним. Это важно, например, если требуется выяснить, кем еще недавно были люди, которые приходят в штаб политической партии — вдруг они будут передавать информацию конкурентам.


Принципы таргетинга меняются

Большинство сервисов, которые анализируют аудитории в соцсетях, в качестве главного критерия берут группы, на которые подписаны представители ЦА. Но в реальности пользователи хоть и подписаны на какие-то группы и страницы/паблики, но на самом деле про большую часть из них они даже не помнят. А система будет считать, что человека активно интересуют все 100% групп, которые являются топовыми для этой аудитории.

Что же делать, чтобы понять определить круг реальных интересов? На данный момент самым грамотным индикатором интересов пользователя является отслеживание лайков. Хотя во «ВКонтакте» нет ленты лайков и пользователи считают, что их действия никак не отслеживаются, это не так. Собрав определенную группу контента, который интересует заказчика, проверив, отметился ли человек в нужной группе каким-либо образом, можно выяснить, кто этот пользователь, чем он интересуется и другую информацию.

Если вы не обладаете доступом к сетевому трафику, не читаете личные сообщения, то лайки всегда подскажут, кто перед вами: беременная женщина, мама, военный, полицейский и т. д. А для человека, который будет размещать рекламу, это очень важные характеристики.



15 сентября в Москве состоится конференция по большим данным Big Data Conference. В программе — бизнес-кейсы, технические решения и научные достижения лучших специалистов в этой области.

Приглашаем всех, кто заинтересован в работе с большими данными и хочет их применять в реальном бизнесе.

Следите за Big Data Conference в Telegram, на Facebook и «ВКонтакте».


Где искать следы

Самое интересное использование открытых источников данных — это высокоточное профилирование и скоринг профилей. По аккаунту человека в соцсети можно узнать, не только кто он, каковы его интересы, но и понять средний уровень зарплаты, сколько стоит его квартира, насколько он лоялен работодателю и т.д.

Например, чтобы определить зарплату пользователя, достаточно посмотреть, в каком регионе он живет и где работает, а затем взять выгрузку похожих вакансий с HH.ru или Superjob.ru и сравнить данные. Для определения достатка и образа жизни можно по профилю в соцсети выяснить, где человек живет и/или бывает чаще всего (точное место определяется по чекинам, мета-данным либо с помощью анализа постов и публикаций с отслеживанием упоминания местоположения), а потом узнать примерную стоимость покупки или аренды такого жилья через портал Cian.ru. Также можно понять, сколько человек путешествует, насколько лоялен к работодателю (по количеству лайков и шеров постов с корпоративной страницы).

Конечно, не вся информация, указанная в профиле, соответствует действительности, бывают погрешности. Например, если сравнить официальное количество выпускников МГУ и количество тех, кто указал этот университет при регистрации в соцсетях, получается, что виртуальных выпускников на 60% больше, чем реальных.

Многое можно узнать о человеке по его номеру телефона, если данные были указаны где-то в сети. Чаще всего телефон выкладывают при размещении объявлений о продаже или покупке на Avito.ru или Auto.ru. Там пользователи так или иначе упоминают место, где проживают или чаще всего появляются. По этим сайтам можно сделать выводы и о том, чем пользуется человек, что ищет.

Кроме того, можно собирать интересную информацию и из других источников. Например, бот на Tinder позволит высчитать по удаленности объекта его вероятное местоположение. Таким образом можно определить количество пользователей приложения, которые находятся в Госдуме или любом другом месте, интересном для рекламодателя.


О чем говорят картинки

Еще один способ поиска потенциальной аудитории — анализ изображений. С его помощью можно распознавать на фотографиях беременных женщин, логотипы бренда, марки автомобилей, с которыми снялись люди и т.д. Благодаря этой технологии можно понять отношение людей к определенному бренду или продукту. Пользователи не всегда упоминают бренд в тексте либо пишут название с ошибками, и классические мониторинговые сети не могут это учесть. А на фотографии видно, например, какое место занимает продукт в кадре.

Один из самых удачных кейсов SocialDataHub в данной области — анализ для одного из ресторанов, какие роллы чаще всего постили пользователи сети для прогнозирования спроса. Поскольку большинство людей делают фото еды, чтобы «чекиниться», то анализируя картинки, можно понять, что сподвигло людей посетить конкретное заведение. Затем можно собрать информацию об этих людях и выявить, что общего между ними, а заодно проанализировать, как обращаются к ним конкуренты.

Пример из офлайна — история с казино, когда распознавались лица посетителей с камер видеонаблюдения. Процент распознанных был довольно велик, что позволило понять, кто эти люди, и точно спрогнозировать, почему они туда пришли, и даже что у них произошло в жизни.

На основе визуального анализа можно построить модель, которая будет показывать, когда и почему человек может заинтересоваться брендом. В результате бренд получает возможность показывать пользователю рекламу не после того, как он что-то купил, а заранее. Однако с ритейлом данная технология работает не очень адекватно, например, трудно спрогнозировать мотивацию человека в аптеке.


Агенты влияния заменят блогеров?

В ситуации, когда бренды и агентства не очень хотят сотрудничать с блогерами, анализ открытых данных предлагает более «тонкую» альтернативу. С помощью Big Data можно установить связи между людьми и использовать эту информацию для поиска агентов влияния. Например, собрав автовладельцев BMW, можно найти среди них лидеров общественного мнения. Чаще всего это обычные люди, которые проявляют активность в тематических группах, интересуются контентом и способны за короткий промежуток времени вовлечь бренд в зону ответственности. Также анализ данных позволяет узнать, с какой скоростью будет распространяться информация.

Еще один большой плюс анализа данных — возможность в автоматическом режиме выявить и отфильтровать ботов как пользователей, нерелевантных для исследования. Это также важно для брендов с репутационной точки зрения.

Возможности Big Data огромны, с каждым днем появляются новые способы их использования. Каждый, кто хоть раз лайкнул что-то в соцсети, разместил фотографию или просто дал объявление, оставил в истории свой цифровой след. Поэтому главный совет Артура Хачуяна тем, кто хочет остаться в тени — не постите ничего, за что может быть стыдно!

Видео с выступления:

Презентацию с выступления Артура Хачуяна можно посмотреть тут.




Материалы по теме:

6 областей ИИ и машинного обучения, за которыми стоит наблюдать

Как RTB-реклама стала попсой и что в этом хорошего

Какие стартапы в области рекламы и маркетинга интересны корпорациям?



Комментарии

  • baramburum 16:00, 22.03.2017
    0
    Гораздо проще все эти данные у пользователя просто спросить, чем платить $BB на то, чтобы автоматизировать весь сбор этих данный. Даже если собрать абсолютно все данные, то абсолютно не ясно, что с ними делать. Таких экспертов у рекламщиков просто нет.
  • sporitus 16:04, 22.03.2017
    0
    Вот, как раз сижу и клепаю презентацию о том, как монетизировать Big Data. Через месяц уже будет все готово. А кому интересно взглянуть на наработки, прошу сюда: https://www.slideshare.net/... https://uploads.disquscdn.c...
Комментарии могут оставлять только авторизованные пользователи.
Money2020
22 октября 2017
Ещё события


Telegram канал @rusbase