9 ошибок в работе с большими данными, которые делают руководители компаний
Что и как измерять?
Даже с одним и тем же набором данных два человека могут сделать совершенно разные выводы. Это потому, что сами по себе данные не являются «эталонными». Исследователи могут выводить данные из неправильной информации, полагаться на субъективное суждение или использовать источники сомнительного происхождения. И если эталонные данные окажутся неправильными, то результаты будут неправильными и потенциально опасными для вашего бизнеса.
Вот 9 распространенных ошибок, которые совершают руководители компаний, когда работают с данными.
1. Отсутствие четкой цели
Если вы четко не установите цель, вы не будете знать, что нужно собирать. Вероятнее всего, вы соберете неверные или неполные данные. В больших данных наблюдается распространенная тенденция, когда компании собирают тонны информации, не понимая, зачем она им нужна и как ее использовать. Сбор огромного количества данных только помешает проводить анализ в будущем, потому что среди кучи мусора вам придется искать то, что на самом деле нужно.
2. Ошибка определения
Давайте представим, что вы хотите узнать, сколько клиенты потратили на ваши услуги за прошедший квартал. Казалось бы, простая задача, правда? К сожалению, даже такие простые цели требуют точного определения понятий.
Во-первых, как вы определяете «клиента»? Вы же не захотите стричь всех под одну гребенку. Вы, скорее всего, планируете сегментировать клиентов по их покупательскому поведению, чтобы соответствующим образом строить маркетинговую модель. В таком случае вам необходимо будет удостовериться, что вы учитываете важную информацию о клиенте, например, историю его расходов или демографическую информацию.
А как вы определяете «квартал»? Вы имеете в виду финансовый квартал или календарный? Финансовые годы у многих компаний не совпадают с календарными. Они также отличаются в зависимости от страны: например, в Австралии финансовый год начинается первого июля, а в Индии – первого апреля.
Фото: Harvard Extension School
Вам также нужно будет разработать стратегию учета возвратов и обменов. Что, если клиент купил ваш продукт в одном квартале, но вернул его в другом? Что, если он подал жалобу и получил возмещение? Вы будете относить это к предыдущему кварталу или к этому?
Как вы видите, выбрать правильное – не очень простая задача. Вам нужно будет понять, чего вы ожидаете, и установить соответствующие параметры, чтобы собирать информацию, которая вам действительно нужна.
3. Ошибка захвата данных
Как только вы определили тип данных, которые хотели бы собирать, вам необходимо разработать механизм для их захвата. В случае ошибки вы можете собрать неправильные данные. Например, если вы хотите проверить, является ли продукт A более привлекательным, чем продукт B, но на сайте продукт A находится на первой странице, а продукт B – на второй, есть вероятность, что пользователи просто не увидят продукт B, и это приведет вас к неправильным выводам.
4. Ошибка измерения
Эти ошибки возникают тогда, когда что-то идет не так в программном обеспечении или аппаратуре, которые вы используете для захвата данных.
Например, вы можете потерять информацию о поведении пользователя в вашем мобильном приложении, если у пользователя проблемы с подключением, и его логи не синхронизируются с вашими серверами. Если вы используете аппаратные датчики, такие как микрофон, вам могут помешать фоновые шумы или другие электрические сигналы.
5. Ошибка обработки
Как вы уже поняли, многие ошибки возникают еще до того, как вы взглянете на данные. Большинство предприятий, которым принадлежат данные, уже давно устарели, а первоначальная команда, которая могла бы объяснить свои решения, распалась. Многие их предположения чаще всего не задокументированы. Получается, вы должны сами делать выводы, а это непростая задача.
Фото: Unsplash
Вместе с командой вы можете сделать предположения, которые будут отличаться от первоначальных. Таким образом вы достигните совершенно других результатов. Очень часто компании не используют определенный фильтр, который использовали исследователи, или просто совершают методологические ошибки.
6. Ошибка покрытия
Когда компании проводят опросы, они часто упускают тот факт, что не у всех целевых респондентов есть возможность принять в нем участие. Например, если вы собираете данные о пожилом населении на сайте, вы наверняка упустите большое количество респондентов.
В случае с цифровыми продуктами ваша команда маркетологов должна проанализировать поведение всех пользователей смартфонов. Однако если вы разработаете приложение только для iOS, вы не сможете понять, как себя будут вести в приложении пользователи Android.
7. Ошибка сбора
Эта ошибка возникает тогда, когда вы анализируете данные лишь небольшой группы людей, а этого недостаточно для составления четкой картины. Выводы, которые вы сделаете, скорее всего, окажутся неправильными – они не будут относиться ко всей целевой аудитории.
Классический пример ошибки сбора: вы спрашиваете мнение только своих друзей и знакомых, а затем приходите к выводу, что вся ваша целевая аудитория думает так же.
8. Ошибка выводов
Модели статистического или машинного обучения совершают ошибки выводов, когда делают неверные прогнозы, основываясь на исходном наборе данных. Существует два типа ошибок выводов:
- вы неправильно прогнозируете, что предмет относится к определенной категории, когда на самом деле это не так;
- предмет уже находится в определенной категории, а вы прогнозируете, что это не так.
Вычисление таких ошибок поможет оценить эффективность ваших моделей машинного обучения. Однако на самом деле многие наборы данных могут быть неправильно маркированы, поэтому вам будет сложно точно определить ошибки выводов, которые допускает ваша система искусственного интеллекта.
Фото: AgentMail
9. Неизвестная ошибка
Реальность неуловима, и вам не всегда будет легко устанавливать эталонные данные. Очень часто (особенно если речь идет о цифровых продуктах) вы можете захватить тонны информации о том, что пользователь делал на вашей платформе, но не будете понимать его мотивацию. Вы будете знать, что пользователь нажал на рекламу, но не будете знать, разозлила она его или нет.
Наряду с точными ошибками существуют и те, которые мы не можем объяснить.
Об этих девяти ошибках должен знать каждый руководитель, но следует помнить, что помимо них существует огромное множество проблем, которые могут помешать эффективности технологий ИИ.
Материалы по теме:
Что нужно знать начинающему дата-сайентисту
Три правила грамотного использования Big data в практике маркетолога (и успешные кейсы)
Где будут обсуждать большие данные и AI в 2018 году?
Большие данные в ритейле: что они дают и как с ними работать
-
Партнёрский материал Альфа-Банк подвёл итоги первой программы для импортёров: шесть компаний получили гранты по 1 млн ₽ 26 июня 2026, 09:44
-
Личное Из фарцовщика в создателя дизайн-завода Flacon: как Николай Матушевский дважды бросал свой бизнес и начинал с нуля 05 мая 2026, 12:09
-
Бизнес Отказ от завода и ставка на интеллект: как Катерина Карпова реанимировала PURE LOVE 02 марта 2026, 11:45
-
Тренды Главные мемы 2026 года и их значение 26 июня 2026, 21:10
-
Бизнес Музыкальный бизнес в России в 2026-м: как ИИ и новые законы меняют рынок 19 июня 2026, 18:30
-
Личное Дарио Амодеи. Как обыграть OpenAI и создать самый дорогой ИИ-стартап в мире 16 июня 2026, 12:05
-
Бизнес Как бренд пазлов «Харди Гарди» получил рекламу у блогера-миллионника, просто рассказав о своём проекте 05 июня 2026, 14:23
-
Деньги Онлайн-инкассация: как превратить наличную выручку в рабочий капитал 01 июня 2026, 10:00
-
Бизнес Более 50% предпринимателей МСП в цифровой сфере — младше 35 лет: чаще всего они открывают компьютерные клубы 26 июня 2026, 20:00
-
Россия В России создадут базу IMEI: в нее внесут заводской код телефонов — работу украденных устройств смогут блокировать 26 июня 2026, 19:20
-
Бизнес В России ввели штрафы за авторизацию пользователей через зарубежные сервисы: компании могут заплатить до 700 тыс. ₽ 26 июня 2026, 18:30
-
Деньги Россияне оформили 4 млн кредитов в мае 2026-го — это самый большой показатель за последние два года 26 июня 2026, 17:00
-
Бизнес «ВкусВилл» закроет все розничные магазины в Казахстане — товары бренда останутся на полках местных торговых сетей 24 июня 2026, 16:47
-
Ритейл Самокат обновил главную страницу приложения — пользователям стало проще искать нужные товары 24 июня 2026, 07:00
-
Технологии «Моторика» привлекла 1 млрд ₽ льготного финансирования — средства направят на развитие нейротехнологий 23 июня 2026, 16:40
-
На регате Digital Club встретятся представители бизнеса — среди них «Аэрофлот», ВТБ и Ozon Банк 22 июня 2026, 16:12

