big data
Большие данные и будущее бизнеса


Часть I
В основе коммерческой деятельности лежит информация. Так, одни из самых ранних форм письменности и бухгалтерского учета принадлежат шумерским купцам, которые примерно в VIII тысячелетии до н. э. использовали маленькие глиняные бусины для обозначения товаров, а позднее вели письменный учет сделок.

И, обращаясь к вопросу о роли данных сегодня, легко сказать, мол, с тех пор мало что изменилось: возможно, объем информации, которую мы собираем, храним и используем, увеличился, но сама природа данных и их значимость не особо трансформировались. Если так думать, получается, «большие данные» — это всего лишь замысловатый термин, описывающий, как общество может поставить себе на службу невиданный ранее объем данных, который, однако, ничего не значит для вневременных основ коммерции, с античных времен до наших дней.
Но придерживаться такой точки зрения было бы неверно. Во многих сферах жизни за изменением количества следует изменение формы. Например, никто не возьмется утверждать, что изобретение печатного станка где-то в 1450 году не стало настоящей революцией лишь потому, что и до этого знаки выдавливали на глиняных дощечках, затем составляли в слова и выписывали их чернилами на свитках. Да, слова и книги существовали и раньше. Но появление печатного станка повлекло за собой резкое увеличение объема письменных материалов и снижение стоимости их производства.
Это было настолько грандиозно, что эра «больше слов» вызывала к жизни огромные перемены. Она ослабила авторитет церкви и власть монархий, она обусловила распространение всеобщей грамотности, развитие демократии, капитализма и общества, в котором составной частью труда стали знания, а не просто мышечная сила.
Сегодня мы обладаем беспрецедентными объемами информации. За изменением масштабов последует изменение формы. Количественный скачок влечет за собой скачок качественный.
Сегодня понятие записанного материала — «книга» — снова претерпевает изменения. iPad позволяет уместить все книги крупной университетской библиотеки на одном устройстве. Такие устройства позволяют осуществлять поиск, составлять указатель, легко копировать любые фрагменты и мгновенно обмениваться ими. Здесь то же самое: «больше» не есть просто больше. Больше — значит новое. Больше — значит лучшее. Больше — значит иное.

Но довольно о словах. Обратимся к средствам связи. В прошлом люди умели передавать сообщения на значительные расстояния. В Древнем Риме это делали с помощью почтовых голубей. Чингисхан для поддержания связи со своими военачальниками расставил пункты смены почтовых голубей по всей Азии и в некоторых частях Восточной Европы. То же самое в бизнесе: в XIX веке банкиры Ротшильды отправляли свою почту с голубями, как и служба биржевых новостей «Рейтер».

Затем появился телефон: связь — надежнее, стоимость — ниже, использование — проще, и не скажешь, что просто стало больше объема прежней связи. То же коснулось радио. А сегодняшний интернет настолько принципиально отличен от почтовых голубей, что сравнивать эти два способа связи было бы нелепо. Но это только подчеркивает, насколько «больше» не отражает лишь количество, а означает новое, лучшее и непохожее.

К данным относится все то же самое, что и к словам и средствам связи. Информации у нас больше, чем когда-либо. Но ее значимость не в том, что мы можем делать больше обычных для нас вещей или больше узнать об уже изученном. Скорее, за изменением масштабов последует изменение формы. Количественный скачок повлечет за собой скачок качественный. Имея больше данных, мы можем делать принципиально новые вещи, какие невозможны были при меньшем объеме данных.

Фактически мы лишь в начале познания этих вещей, поскольку всегда испытывали свое воображение на предмет того, что можно делать с данными. Это был бессознательный процесс, ведь мы и представить не могли, что этих данных у нас будет так много и что их сбор, хранение, обработка и совместное использование могут быть настолько простыми и недорогими. На основании чего мы могли бы предугадать это?

Наверное, наимудрейший из тех, кто пользовался счётами, никогда не вообразил бы механическое счетное устройство для миллиардов, а ученый, работавший с таким устройством, — электронную вычислительную машину. И даже после изобретения транзистора — через несколько лет после появления первых ЭВМ — инженерам, кроме самых смелых из них, было бы трудно воспринять темп, постулируемый законом Мура. Этот закон, ставший принципом цифрового века, говорит о том, что количество транзисторов, размещаемых на кристалле интегральной схемы, удваивается каждые два года, что означает резкое — в геометрической прогрессии — снижение стоимости и увеличение мощности с течением времени.

Такое расширение масштаба, в котором общество может осуществлять сбор информации и взаимодействовать с ней, оказало громаднейшее влияние на наше понимание экономики.

В XVIII веке собирать, хранить и использовать информацию было настолько трудно, что идея об информации, которая сама по себе может служить сырьем для бизнеса, звучала бы абсурдно. Не стоит забывать, что данные пришлось бы записывать гусиным пером на неподатливом пергаменте. Обрабатывать и использовать информацию было дорого и обременительно. К тому же в то время еще не были известны и начатки статистики. Так что даже если бы кто-то имел какие-то данные, с ними мало чего удалось бы сделать.
Степень изменения масштабов сбора информации в обществе оказывает глубокое воздействие на наше понимание экономики
Ясно, что сегодня ситуация в корне изменилась. Конечно, до сих пор имеются ограничения относительно того, какие данные можно получить и что с ними можно делать. Однако большинство наших предположений о стоимости сбора и трудностях обработки данных следует полностью опровергнуть. Мы до сих пор живем психологией «дефицита», как те старики, которые спешат к телефону и стараются не говорить много, потому что «звонит межгород», — устаревший стиль поведения времен дорогих телефонных звонков, предшествовавших либерализации рынка и появлению новых технологий, которые навсегда изменили стоимость телекоммуникаций.

В основе наших учреждений также по-прежнему лежит идея дефицита информации и ее высокой стоимости. Бортовые самописцы сохраняют лишь небольшой объем данных, эквивалентный всего нескольким часам скудной технической информации и переговоров в кабине пилотов — наследие эры, в которую они создавались. Их сигналы слабы, а заряда аккумулятора хватает ненадолго, дней на 30. Сейчас, после трагедии с рейсом MH370 малайзийской авиакомпании, пропавшим в марте 2014 года, мир пытается исправить эти недостатки.

А вот сам принцип «черного ящика» можно было бы применять с пользой для общества в разных ситуациях: например, такие самописцы, установленные на полицейские машины и в экипировку стражей порядка, помогали бы судьям при разбирательстве обвинений в агрессивности действий полиции, свидетельствуя о законном или незаконном применении силы. Но это используется совсем в немногих местах. Подобным образом «черные ящики» пригодились бы в операционных: они дали бы возможность хирургам учиться на своих ошибках, помогали бы пострадавшим от небрежности врачей пациентам получать справедливую компенсацию или доказывали бы безупречность работы врачей.

Однако врачи опасаются волны исков о профессиональной небрежности и сопротивляются нововведению. И в том, что полиция и врачи держатся за свои, казалось бы, направленные против использования информации установки, нет их неправоты: требуется время, для того чтобы общество свыклось с необходимостью принятия новой технологии и выработало новую культуру. Мы ведь только сейчас привыкли к компьютерам, спустя полвека после того, как они вошли в массовый обиход.

Поучителен в связи с этим опыт социальных сетей. В книге Удалить: Преимущества забывания в цифровую эпоху (Delete: The Virtue of Forgetting in the Digital Age) Виктор Майер-Шенбергер из Оксфордского университета рассказывает чудовищные истории о том, как людям отказывали в приеме на работу из-за фотографии шумной вечеринки, которая многими годами раньше появилась в Facebook, на страничке претендента на вакансию. Такие примеры высветили проблему среди менеджеров по подбору персонала, которые не пересмотрели свои методы работы и не учли того, что в существующем мире наше прошлое в режиме онлайн навечно остается настоящим, и юношеские выходки человека следует сбрасывать со счетов, в то время как раньше в этом не было никакой нужды.
Обществу потребуется время, чтобы поменять привычный уклад и установки, найти разумный способ привнести технологии в нашу жизнь, общественные институты и наши ценности
Подобным же образом в мире больших данных многие вещи будут фиксироваться в пассивном режиме, просто потому что они существуют или происходят. Обществу потребуется время, чтобы поменять привычный уклад и установки, найти разумный способ привнести технологии в нашу жизнь, общественные институты и наши ценности.

Важно отметить, что это противоречие — между тем, на что способны технологии, и нашими установками и правилами, в среде которых существуют эти технологии, — характеризует один из главных аспектов конфликта, который пришлось преодолевать американскому политическому истеблишменту в связи с разоблачениями Сноудена. Суть внутреннего конфликта такова: закон создавался для эпохи, когда сбор и анализ данных были затруднительны и дорогостоящи. После того как эти операции — например, анализ метаданных телефонных разговоров — стали простыми и дешевыми, те виды деятельности, которые могли считаться невозможными или, по крайней мере, исключительно редкими в 1970-х годах, когда составлялись законы, в июне 2013-го — в момент их обнародования — могли рассматриваться как обычное явление.

С точки зрения поборников конфиденциальности всеобщая слежка со стороны Агентства национальной безопасности США была противозаконной. С точки зрения управления используемые программы представляли собой лишь расширенный масштаб того, что закон действительно дозволяет. Разве не должен орган безопасности применять те же современные средства, какие используют против него противоборствующие элементы? — следует аргументация. Критики парируют: в таком случае получите законодательное право, если хотите иметь такие полномочия и если считаете, что люди примут идею подобного «прочесывания».

Увы, американской политической системе еще только предстоит организовать полноценное обсуждение этих вопросов, чтобы найти взаимопонимание. И хотя такой теоретический анализ не освобождает от ответственности за подобную деятельность, возможно, он является еще одним шагом вперед в плане ее объяснения. И в этом случае мы вновь возвращаемся к лейтмотиву больших данных. Больше — это не просто больше. Больше — значит новое. Больше — значит лучшее. Больше — значит иное.

Ни одна сфера человеческой деятельности или промышленности не останется незатронутой той сильнейшей встряской, которая должна скоро случиться в процессе того, как большие данные начнут прокладывать себе путь в общество, политику и бизнес.
Об авторе: Кеннет Кукьер — редактор The Economist, специалист по big data, соавтор книги «Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим».

Источник: OpenMind
Перевод: бюро переводов «Прима Виста»
Выпускающий редактор: Полина Тодорова
Полина Тодорова