Михаил Левиев

6 необычных областей, где применяют большие данные

Последние несколько лет технология анализа данных проникает во многие сферы бизнеса и человеческой деятельности: розничную торговлю, мониторинг городского трафика, медицину и образование. Но порой встречаются и совершенно неожиданные области применения big data. Михаил Левиев, CEO АлгоМост, рассказал именно о таких областях.


1. Как предотвратить эпидемию

Ученые из Weill Corner Medical College на протяжении 18 месяцев собирали данные о ДНК бактерий в метро. С помощью анализа данных им удалось создать генетический профиль транспортной системы города. Это своего рода генетическое отражение самих людей, которые пользуются подземкой. Каждый день 5,5 миллионов пассажиров приносят сюда бактерии, частицы пищи, которую они ели, растений и животных. Получив более 10 миллиардов фрагментов ДНК, с помощью анализа данных ученые сравнили их с генетическими базами известных бактерий, вирусов и других микроорганизмов для последующей идентификации. В итоге удалось составить подробную карту бактерий метро Нью-Йорка.

Так выяснилось, что на станции Таймс-сквер 42 содержится след 114 уникальных бактерий, из которых 67 видов могли вызвать различные пищевые отравления и инфекции.

Проект по создания генетического профиля транспортной системы Нью-Йорка стимулировал микробиологов не только в США, но и во всем мире начать изучать биологию городской среды. Ведь различные городские условия могут способствовать росту и развитию целых экосистем разных микроорганизмов. Например, по результатам анализа проб воздуха в торговых центрах Сингапура и домах в Объединенных Арабских Эмиратах были обнаружены до 300 различных видов бактерий, в том числе инфекционных. Причина крылась в обычном кондиционере воздуха. Ученые надеются, что с помощью полученных данных будут открыты новые пути для отслеживания вспышек заболеваний. В результате подобные проекты были запущены в других метрополитенах мира: Шанхае, Токио, Париже, Сан-Паоло.


2. Как большие данные развивают пищевую промышленность

Как потребители мы ожидаем, что купленные в магазине кетчуп, лазанья быстрого приготовления или любимое шоколадное печенье всегда будут знакомого нам вкуса. Также рестораны и производители продуктов стараются идти в ногу со временем и знать наверняка, какую пищу лучше приготовить и с чем ее лучше подавать, адаптируя меню под своих клиентов.

Излишне говорить, что фундаментальная задача состоит в сохранении качества на сильно конкурентном рынке. Справиться с ней поможет новая технология анализа данных, влияние которой на пищевую промышленность будет только расти.

Представим такую ситуацию: клиент, сидя в ресторане, жалуется на то, что его кетчуп странной консистенции и непонятного вкуса, и такие жалобы начинают поступать одновременно в целой сети ресторанов. Если это связанно с плохой партией поставщика, то как можно избежать возникновения подобных ситуаций и найти причины?

Для крупной сети ресторанов с десятками поставщиков задача крайне сложная, один некачественный компонент – и они рискуют получить огромное количество жалоб от недовольных клиентов. Так, например, было с мясными фрикадельками в IKEA, в которых обнаружилась конина, что привело к огромныму скандалу.

Для отслеживания своих поставок The Cheesecake Factory, крупнейшая ресторанная компания и дистрибьютор различных кондитерских изделий, используя решения IBM, собирает данные из 175 своих ресторанов по всему США. Это позволяет получать данные о цепочках поставок мгновенно, объединив анализ структурированных данных ресторанов, с неструктурированными (цвет, свежесть и консистенция продукта). Если ингредиенты не были смешаны должным образом на производственной линии или имеют необычный цвет, это будет отмечено в режиме реального времени. С помощью такой информации ресторан может определить причину проблем с качеством поставляемой продукции и избежать их в будущем. Большие данные в пищевой промышленности используются не только для контроля поставок и качества продукции. Шеф-повара, например, могут оптимизировать цены в меню и улучшать его на основе предпочтений посетителей. С помощью платформы Food Genius можно понять, какие блюда сейчас в тренде и по какой цене их продавать. Отслеживая данные о заказах более чем 360 тысяч ресторанов, около 16 миллионов позиций в меню, видно, какой овощ, например, заказывают чаще с определенным видом макарон или цыпленком.  


3. Как анализ данных помогает выигрывать в гонках

Популярные автогонки серии F1 служат полигоном для сбора и анализа больших данных. Ведь каждая машина, в которой только руль стоит около 77 тысяч долларов, а общая стоимость болида превышает 9 миллионов, – это не просто дорогая игрушка, способная развивать скорость свыше трехсот километров в час. Она еще и умная, благодаря десяткам установленных датчиков.

Каждый датчик взаимодействует с трассой, командой в боксе, а также инженерной службой, находящейся удаленно. Зрители на трибунах и представить себе не могут, что на их глазах происходит не только состязание машин, но и гонка компьютеров по всему миру. Датчики устанавливают на шасси автомобиля, в шины, двигатель, они измеряют сопротивление воздуха, давление в шинах, температуры при торможении, скольжение при проходе поворота и так далее. «Формула-1» имеет строгий регламент по количеству сотрудников команды, обслуживающих гонку – так, например, у команды Infinity RedBull на месте 60 инженеров, еще 30 – в Англии. Нужен мгновенный обмен опытом, передача информации занимает 300 миллисекунд. Технологии этого вида спорта настолько совершенны, что экстраполируются и на другие отрасли, где мгновенный анализ большого объема данных может стоить человеческой жизни. Так, например команда McLaren делится своим опытом с ConocoPhilips для последующего применения знаний в нефтедобывающей промышленности.


4. Как сохранить редкие виды животных

Ученые тратят годы кропотливого труда, чтобы узнать, какие животные находятся или могут быть под угрозой исчезновения. Технологии анализа данных вносит свой вклад и в эту сферу. Некоммерческая организация Conservation International занимается сохранением биоразнообразия растений, животных и ландшафтов во всём мире. С 2007 года ученые Conservation International начали устанавливать камеры-ловушки (лесные камеры, работающие на датчик движения и управляемые удаленно) в 16 тропических лесах. Именно тропические леса являются родиной половины всех растений и животных на Земле и производят 40% всего кислорода.   

Сейчас таких камер более тысячи, а количество получаемых фотографий в год – около двух миллионов. Ученые из Conservation International сопоставляют фото с климатическими данными, данными о росте деревьев, о солнечной радиации, чтобы создать модель изменения популяций животных в их естественной среде обитания. Изначально ученые занимались анализом полученных данных самостоятельно и на собственных компьютерах, и на это могло уходить недели и месяцы. Компания HP помогает исследователям обрабатывать данные в режиме реального времени.

Точность обработки информации увеличилась в девять раз. Анализ данных повысил качество выявления конкретных мест обитания животных. Но, к сожалению, популяция некоторых редких видов продолжает сокращаться.


5. Как управлять эмоциями

Это может показаться совсем удивительным, но к концу 2016 года с помощью технологии Affedex Affectiva пользователь при просмотре фильма ужасов сможет делать его настолько страшным, насколько захочет. При помощи камеры на планшете или смартфоне программа анализирует в режиме реального времени эмоции и мимику зрителя. Если на каком либо страшном моменте пользователь отворачивается, то на основе его биометрических данных и алгоритмов программа решает, держать его в напряжении или ускорить жуткий момент.


6. Как big data меняют йогу

Сферы применения анализа данных расширяются с удивительной скоростью. Иногда они настолько неожиданны, что буквально граничат с научной фантастикой.

Существует даже научный проект по разработке и моделированию оптимальных поз йоги с целью лечения хронических заболеваний. Из-за того, что в упражнениях задействовано огромное количество суставов и мышц, результаты моделирования связаны с большим набором данных – их анализ призван оптимизировать определенной позы для целенаправленного лечения того или иного хронического заболевания. Цель проекта – предоставить научные доказательства полезности такой терапии.

Наблюдая за развитием подобных проектов, понимаешь, что будущее ближе чем, кажется.


Материалы по теме:

Мировому рынку Big Data предсказали рост до $1 трлн

Как большие данные вторгаются в частную жизнь

Можно ли не зависеть от больших данных?

Как современные российские ИТ-разработки меняют мир

Большие данные и большое будущее

11 рисков при работе с big data

Как big data помогают реальному сектору

Видео по теме:


comments powered by Disqus

Подпишитесь на рассылку RUSBASE

Мы будем вам писать только тогда, когда это действительно очень важно