Добычей персональных данных из сети занимаются "скрейперы"
В современном мире информационных
технологий набирает популярность новая маркетинговая стратегия: "снятие"
персональных данных с интернет-сайтов, включая социальные сети. Рынок личной
информации о пользователях сети переживает бум, пишет Wall
Street Journal. Причем в авангарде этого рынка идут так называемые "скрейперы",
которые копируют для заказчиков персональные данные пользователей социальных
сетей, сайтов, размещающих резюме и онлайн-фрумов, где люди обсуждают свою
личную жизнь.
Одним из сайтов, подвергшихся такого рода атаке, стал недавно около-медицинский сайт Patientslikeme.com, где в разделе "Настроение" люди делились историями о своем эмоциональном состоянии и различных психологических проблемах - от маниакально-депрессивного расстройства до навязчивого желания наносить себе порезы.
Владельцы сайта обнаружили подозрительную деятельность в этом разделе - один из новых участников с помощью сложного ПО "снимал" или копировал все сообщения с форумов сайта. Нарушителя удалось заблокировать и опознать - им оказалась известная исследовательская компания Nielsen.
Nielsen ведет мониторинг информационного "гула" в интернете для своих клиентов, к числу которых относятся крупные фармацевтические компании. Производители лекарственных средств платят за персональные данные, извлеченные из интернета, чтобы получить обратную связь о своей продукции от потребителей, говорит Nielsen.
Сами потребители не в восторге от таких методов общения с ними. "Я почувствовал себя жертвой насилия", - говорит один из пользователей сайта PatientsLikeMe 33-летний Биляль Ахмед, который на форуме сайта общался с другими людьми, как и он, страдающими от депрессии. На форуме он писал под псевдонимом, но его профиль на сайте ведет к его блогу, в котором в свою очередь есть информация о его настоящем имени.
После того, как сайт сообщил пользователям о факте взлома, Ахмед стер все свои посты, а также список лекарств, которыми он пользуется. "Было очень неприятно знать, что твои личные данные являются предметом продажи", - говорит он.
Nielsen утверждает, что больше не копирует данные с сайтов, доступ к которым требует ввода личных данных - по крайней мере, без специального разрешения.
Растущий рынок персональных данных, пишет WSJ, обеспечивает "сырье" для стремительно расширяющейся "экономики данных". По данным консалтинговой компании Winterberry Group, торговые компании в 2009 году потратили $7,8 млрд на покупку данных, полученных из интернета и из других источников. По прогнозам, расходы на информацию из интернет-источников к 2012 году вырастут более чем вдвое по сравнению с 2009 - с $410 млн до $840 млн.
Газета Wall Street Journal изучила методы сбора информации в сети, используемые компаниями-"скрейперами". Некоторые из них составляют детальные отчеты о клиентах, содержащие их электронные адреса, номера сотовых телефонов, фотографии и сообщения в социальных сетях.
Другие предоставляют возможность отслеживать поведение клиентов в реальном времени с использованием тысяч новых ресурсов, блогов и сайтов, где можно просматривать, что люди говорят о том или ином продукте или той или иной теме в каждый момент времени.
В частности такого рода услуги предоставляет компания Dow Jones & Co., являющаяся издателем Wall Street Journal. Dow Jones собирает данные в сети, которые могут включать в себя личную информации из информационных сообщений или постов в блогах, которые позволяют их корпоративным клиентам следить за отзывами о своих товарах и услугах. Dow Jones утверждает, что не собирает информацию с защищенных паролями разделов сайтов.
Конкуренция на новом рынке данных крайне высока. В частности, уже упомянутый сайт PatientsLikeMe и сам продает информацию о своих пользователях - как утверждают владельцы сайта, исключительно анонимную.
Тем временем возможности в области получения и сбора информации растут. Компания PeekYou LLC подала заявку на патент на метод, позволяющий совмещать настоящие имена людей и их псевдонимы в сети.
Подобные компании, пишет газета, работают в "серой зоне" права. В разных странах законы, регулирующие правомерность таких методов получения информации, варьируются. В Соединенных Штатах по разным делам о сборе персональных данных решения судов были противоречивы. "Скрейпинг вездесущ, но сомнителен, - говорит преподаватель права из Университета Санта-Клары. - Все это делают, но не вполне понятно, можно ли кому-то это делать без разрешения".
Часто этот процесс превращается в игру в кошки-мышки между сайтами, пытающими предоставить своим пользователям защиту от несанкционированного сбора личных данных, и скрейперами, которые пытаются их перехитрить. В целом, как пишет газета, технически копирование информации с сайтов не представляет особенных сложностей - это может сделать практически любой одаренный программист. Взлом защитных систем сайтов может оказаться труднее, однако специалисты справляются и с этим.
Одним из сайтов, подвергшихся такого рода атаке, стал недавно около-медицинский сайт Patientslikeme.com, где в разделе "Настроение" люди делились историями о своем эмоциональном состоянии и различных психологических проблемах - от маниакально-депрессивного расстройства до навязчивого желания наносить себе порезы.
Владельцы сайта обнаружили подозрительную деятельность в этом разделе - один из новых участников с помощью сложного ПО "снимал" или копировал все сообщения с форумов сайта. Нарушителя удалось заблокировать и опознать - им оказалась известная исследовательская компания Nielsen.
Nielsen ведет мониторинг информационного "гула" в интернете для своих клиентов, к числу которых относятся крупные фармацевтические компании. Производители лекарственных средств платят за персональные данные, извлеченные из интернета, чтобы получить обратную связь о своей продукции от потребителей, говорит Nielsen.
Сами потребители не в восторге от таких методов общения с ними. "Я почувствовал себя жертвой насилия", - говорит один из пользователей сайта PatientsLikeMe 33-летний Биляль Ахмед, который на форуме сайта общался с другими людьми, как и он, страдающими от депрессии. На форуме он писал под псевдонимом, но его профиль на сайте ведет к его блогу, в котором в свою очередь есть информация о его настоящем имени.
После того, как сайт сообщил пользователям о факте взлома, Ахмед стер все свои посты, а также список лекарств, которыми он пользуется. "Было очень неприятно знать, что твои личные данные являются предметом продажи", - говорит он.
Nielsen утверждает, что больше не копирует данные с сайтов, доступ к которым требует ввода личных данных - по крайней мере, без специального разрешения.
Растущий рынок персональных данных, пишет WSJ, обеспечивает "сырье" для стремительно расширяющейся "экономики данных". По данным консалтинговой компании Winterberry Group, торговые компании в 2009 году потратили $7,8 млрд на покупку данных, полученных из интернета и из других источников. По прогнозам, расходы на информацию из интернет-источников к 2012 году вырастут более чем вдвое по сравнению с 2009 - с $410 млн до $840 млн.
Газета Wall Street Journal изучила методы сбора информации в сети, используемые компаниями-"скрейперами". Некоторые из них составляют детальные отчеты о клиентах, содержащие их электронные адреса, номера сотовых телефонов, фотографии и сообщения в социальных сетях.
Другие предоставляют возможность отслеживать поведение клиентов в реальном времени с использованием тысяч новых ресурсов, блогов и сайтов, где можно просматривать, что люди говорят о том или ином продукте или той или иной теме в каждый момент времени.
В частности такого рода услуги предоставляет компания Dow Jones & Co., являющаяся издателем Wall Street Journal. Dow Jones собирает данные в сети, которые могут включать в себя личную информации из информационных сообщений или постов в блогах, которые позволяют их корпоративным клиентам следить за отзывами о своих товарах и услугах. Dow Jones утверждает, что не собирает информацию с защищенных паролями разделов сайтов.
Конкуренция на новом рынке данных крайне высока. В частности, уже упомянутый сайт PatientsLikeMe и сам продает информацию о своих пользователях - как утверждают владельцы сайта, исключительно анонимную.
Тем временем возможности в области получения и сбора информации растут. Компания PeekYou LLC подала заявку на патент на метод, позволяющий совмещать настоящие имена людей и их псевдонимы в сети.
Подобные компании, пишет газета, работают в "серой зоне" права. В разных странах законы, регулирующие правомерность таких методов получения информации, варьируются. В Соединенных Штатах по разным делам о сборе персональных данных решения судов были противоречивы. "Скрейпинг вездесущ, но сомнителен, - говорит преподаватель права из Университета Санта-Клары. - Все это делают, но не вполне понятно, можно ли кому-то это делать без разрешения".
Часто этот процесс превращается в игру в кошки-мышки между сайтами, пытающими предоставить своим пользователям защиту от несанкционированного сбора личных данных, и скрейперами, которые пытаются их перехитрить. В целом, как пишет газета, технически копирование информации с сайтов не представляет особенных сложностей - это может сделать практически любой одаренный программист. Взлом защитных систем сайтов может оказаться труднее, однако специалисты справляются и с этим.
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
-
Пройти курс «Просто о сложном: первые шаги в бизнесe»
- 1 IT-стартап Wiz заявил об утечке базы данных DeepSeek
- 2 Кабмин не поддержал запрет на использование голосов россиян без их согласия
- 3 За утечки персональных данных теперь грозит до 10 лет лишения свободы
- 4 Госдума ужесточила штрафы для бизнеса за повторные утечки персональных данных