Добычей персональных данных из сети занимаются "скрейперы"
В современном мире информационных
технологий набирает популярность новая маркетинговая стратегия: "снятие"
персональных данных с интернет-сайтов, включая социальные сети. Рынок личной
информации о пользователях сети переживает бум, пишет Wall
Street Journal. Причем в авангарде этого рынка идут так называемые "скрейперы",
которые копируют для заказчиков персональные данные пользователей социальных
сетей, сайтов, размещающих резюме и онлайн-фрумов, где люди обсуждают свою
личную жизнь.
Одним из сайтов, подвергшихся такого рода атаке, стал недавно около-медицинский сайт Patientslikeme.com, где в разделе "Настроение" люди делились историями о своем эмоциональном состоянии и различных психологических проблемах - от маниакально-депрессивного расстройства до навязчивого желания наносить себе порезы.
Владельцы сайта обнаружили подозрительную деятельность в этом разделе - один из новых участников с помощью сложного ПО "снимал" или копировал все сообщения с форумов сайта. Нарушителя удалось заблокировать и опознать - им оказалась известная исследовательская компания Nielsen.
Nielsen ведет мониторинг информационного "гула" в интернете для своих клиентов, к числу которых относятся крупные фармацевтические компании. Производители лекарственных средств платят за персональные данные, извлеченные из интернета, чтобы получить обратную связь о своей продукции от потребителей, говорит Nielsen.
Сами потребители не в восторге от таких методов общения с ними. "Я почувствовал себя жертвой насилия", - говорит один из пользователей сайта PatientsLikeMe 33-летний Биляль Ахмед, который на форуме сайта общался с другими людьми, как и он, страдающими от депрессии. На форуме он писал под псевдонимом, но его профиль на сайте ведет к его блогу, в котором в свою очередь есть информация о его настоящем имени.
После того, как сайт сообщил пользователям о факте взлома, Ахмед стер все свои посты, а также список лекарств, которыми он пользуется. "Было очень неприятно знать, что твои личные данные являются предметом продажи", - говорит он.
Nielsen утверждает, что больше не копирует данные с сайтов, доступ к которым требует ввода личных данных - по крайней мере, без специального разрешения.
Растущий рынок персональных данных, пишет WSJ, обеспечивает "сырье" для стремительно расширяющейся "экономики данных". По данным консалтинговой компании Winterberry Group, торговые компании в 2009 году потратили $7,8 млрд на покупку данных, полученных из интернета и из других источников. По прогнозам, расходы на информацию из интернет-источников к 2012 году вырастут более чем вдвое по сравнению с 2009 - с $410 млн до $840 млн.
Газета Wall Street Journal изучила методы сбора информации в сети, используемые компаниями-"скрейперами". Некоторые из них составляют детальные отчеты о клиентах, содержащие их электронные адреса, номера сотовых телефонов, фотографии и сообщения в социальных сетях.
Другие предоставляют возможность отслеживать поведение клиентов в реальном времени с использованием тысяч новых ресурсов, блогов и сайтов, где можно просматривать, что люди говорят о том или ином продукте или той или иной теме в каждый момент времени.
В частности такого рода услуги предоставляет компания Dow Jones & Co., являющаяся издателем Wall Street Journal. Dow Jones собирает данные в сети, которые могут включать в себя личную информации из информационных сообщений или постов в блогах, которые позволяют их корпоративным клиентам следить за отзывами о своих товарах и услугах. Dow Jones утверждает, что не собирает информацию с защищенных паролями разделов сайтов.
Конкуренция на новом рынке данных крайне высока. В частности, уже упомянутый сайт PatientsLikeMe и сам продает информацию о своих пользователях - как утверждают владельцы сайта, исключительно анонимную.
Тем временем возможности в области получения и сбора информации растут. Компания PeekYou LLC подала заявку на патент на метод, позволяющий совмещать настоящие имена людей и их псевдонимы в сети.
Подобные компании, пишет газета, работают в "серой зоне" права. В разных странах законы, регулирующие правомерность таких методов получения информации, варьируются. В Соединенных Штатах по разным делам о сборе персональных данных решения судов были противоречивы. "Скрейпинг вездесущ, но сомнителен, - говорит преподаватель права из Университета Санта-Клары. - Все это делают, но не вполне понятно, можно ли кому-то это делать без разрешения".
Часто этот процесс превращается в игру в кошки-мышки между сайтами, пытающими предоставить своим пользователям защиту от несанкционированного сбора личных данных, и скрейперами, которые пытаются их перехитрить. В целом, как пишет газета, технически копирование информации с сайтов не представляет особенных сложностей - это может сделать практически любой одаренный программист. Взлом защитных систем сайтов может оказаться труднее, однако специалисты справляются и с этим.
Одним из сайтов, подвергшихся такого рода атаке, стал недавно около-медицинский сайт Patientslikeme.com, где в разделе "Настроение" люди делились историями о своем эмоциональном состоянии и различных психологических проблемах - от маниакально-депрессивного расстройства до навязчивого желания наносить себе порезы.
Владельцы сайта обнаружили подозрительную деятельность в этом разделе - один из новых участников с помощью сложного ПО "снимал" или копировал все сообщения с форумов сайта. Нарушителя удалось заблокировать и опознать - им оказалась известная исследовательская компания Nielsen.
Nielsen ведет мониторинг информационного "гула" в интернете для своих клиентов, к числу которых относятся крупные фармацевтические компании. Производители лекарственных средств платят за персональные данные, извлеченные из интернета, чтобы получить обратную связь о своей продукции от потребителей, говорит Nielsen.
Сами потребители не в восторге от таких методов общения с ними. "Я почувствовал себя жертвой насилия", - говорит один из пользователей сайта PatientsLikeMe 33-летний Биляль Ахмед, который на форуме сайта общался с другими людьми, как и он, страдающими от депрессии. На форуме он писал под псевдонимом, но его профиль на сайте ведет к его блогу, в котором в свою очередь есть информация о его настоящем имени.
После того, как сайт сообщил пользователям о факте взлома, Ахмед стер все свои посты, а также список лекарств, которыми он пользуется. "Было очень неприятно знать, что твои личные данные являются предметом продажи", - говорит он.
Nielsen утверждает, что больше не копирует данные с сайтов, доступ к которым требует ввода личных данных - по крайней мере, без специального разрешения.
Растущий рынок персональных данных, пишет WSJ, обеспечивает "сырье" для стремительно расширяющейся "экономики данных". По данным консалтинговой компании Winterberry Group, торговые компании в 2009 году потратили $7,8 млрд на покупку данных, полученных из интернета и из других источников. По прогнозам, расходы на информацию из интернет-источников к 2012 году вырастут более чем вдвое по сравнению с 2009 - с $410 млн до $840 млн.
Газета Wall Street Journal изучила методы сбора информации в сети, используемые компаниями-"скрейперами". Некоторые из них составляют детальные отчеты о клиентах, содержащие их электронные адреса, номера сотовых телефонов, фотографии и сообщения в социальных сетях.
Другие предоставляют возможность отслеживать поведение клиентов в реальном времени с использованием тысяч новых ресурсов, блогов и сайтов, где можно просматривать, что люди говорят о том или ином продукте или той или иной теме в каждый момент времени.
В частности такого рода услуги предоставляет компания Dow Jones & Co., являющаяся издателем Wall Street Journal. Dow Jones собирает данные в сети, которые могут включать в себя личную информации из информационных сообщений или постов в блогах, которые позволяют их корпоративным клиентам следить за отзывами о своих товарах и услугах. Dow Jones утверждает, что не собирает информацию с защищенных паролями разделов сайтов.
Конкуренция на новом рынке данных крайне высока. В частности, уже упомянутый сайт PatientsLikeMe и сам продает информацию о своих пользователях - как утверждают владельцы сайта, исключительно анонимную.
Тем временем возможности в области получения и сбора информации растут. Компания PeekYou LLC подала заявку на патент на метод, позволяющий совмещать настоящие имена людей и их псевдонимы в сети.
Подобные компании, пишет газета, работают в "серой зоне" права. В разных странах законы, регулирующие правомерность таких методов получения информации, варьируются. В Соединенных Штатах по разным делам о сборе персональных данных решения судов были противоречивы. "Скрейпинг вездесущ, но сомнителен, - говорит преподаватель права из Университета Санта-Клары. - Все это делают, но не вполне понятно, можно ли кому-то это делать без разрешения".
Часто этот процесс превращается в игру в кошки-мышки между сайтами, пытающими предоставить своим пользователям защиту от несанкционированного сбора личных данных, и скрейперами, которые пытаются их перехитрить. В целом, как пишет газета, технически копирование информации с сайтов не представляет особенных сложностей - это может сделать практически любой одаренный программист. Взлом защитных систем сайтов может оказаться труднее, однако специалисты справляются и с этим.
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
- 1 Не доверяй мне, я социальный инженер: 5 главных правил кибербезопасности для бизнеса
- 2 Правила кибербезопасности для бизнеса в сфере торговли, которые важно знать всем
- 3 С какими сложностями может столкнуться компания при внесении данных в IT-системы и как упростить этот процесс
- 4 «Телефон знает о вас слишком много» — как доверить приложению персональные данные и не попасть в неприятности
- 5 SEO для локального бизнеса: как выйти на первые позиции в поиске по регионам