Современные приложения на базе ИИ, как правило, потребляют слишком много энергии. Из-за этого они обрабатывают данные не на самих девайсах, а отправляют их на мощные облачные сервера.
Если мы научимся запускать ИИ-программы на фитнес-браслетах, дронах и прочих устройствах, нас ждет не только более широкое применение технологии, но и революция в области ИИ. И это может стать реальностью — благодаря новому микрочипу NeuRRAM от исследователей Стэнфорда.
Проблема современного ИИ
Большинство современных ИИ-систем выполняют обработку «в облаке». Если попросить генератор изображений нарисовать картинку, то запрос отправляется в дата-центр, а результат возвращается на смартфон или компьютер через интернет.
Процесс занимает от 10 с до нескольких минут, что вполне нормально — вряд ли пользователю нужно получить картинку моментально. Однако в других случаях это более критично, например если ИИ отслеживает состояние сердца в реальном времени, используя данные фитнес-браслета. В таком случае эффективнее выполнять обработку прямо на устройстве, а не в облаке. Этот подход называется граничными вычислениями.
Цикл обратной связи в режиме реального времени возможен «лишь с чем-то подобным граничным вычислениям», по мнению Аруна Мирчандани, советника по цифровому преобразованию сферы здравоохранения, не участвовавшего в исследовании.
«Информация бесполезна, если требуется несколько минут или секунд, чтобы обрабатывать ее в другом месте», — рассказал Мирчандани.
Граничные вычисления обладают и другим преимуществом — повышают конфиденциальность. Если медицинская информация не покидает носимое устройство, то злоумышленники не смогут перехватить ее при передаче.
Так почему же приложения запускаются в облаке, а не локально? Проблема в том, что беспроводные устройства обладают ограниченной вычислительной мощностью и емкостью батареи. Чтобы запускать более продвинутые и энергоемкие ИИ-программы, приходится задействовать крупные облачные сервера.
Решение — микрочип NeuRRAM
Команда из Стэнфорда представила NeuRRAM — микрочип, который позволит запускать продвинутые ИИ-программы прямо на устройствах. NeuRRAM устраняет процесс, который потребляет значительный объем энергии, — передачу данных между вычислительным модулем чипа (где происходит обработка) и модулем памяти (где хранятся данные).
«Проблема перемещения данных аналогична тому, чтобы тратить на поездки в офис по восемь часов ради двухчасового рабочего дня», — рассказал ведущий исследователь Вейер Ван.
NeuRRAM переносит ИИ-обработку из специального модуля в саму память благодаря новой технологии под названием резистивная память с произвольным доступом (resistive random-access memory, RRAM).
Этот тип архитектуры чипов называется Compute-in-Memory или CIM. Раньше он помогал повысить энергоэффективность микрочипов, но часто это шло в ущерб вычислительной мощности, универсальности и точности.
Команда из Стэнфорда преодолела эти ограничения, внедрив инновации в дизайн, схемы и другие особенности чипа. NeuRRAM работает в два раза эффективнее лучших CIM-девайсов, поддерживает различные ИИ-приложения, а также не уступает в точности традиционным чипам в таких задачах, как распознавание символов и классификация изображений.
«Эффективность, универсальность и точность — все это важные аспекты для более широкого внедрения технологии, — рассказал Ван. — Однако реализовать их все сразу не просто. Совместная оптимизация всего стека, от аппаратного до программного обеспечения, имеет ключевое значение». Это, по его словам, стало возможно благодаря международной команде исследователей с разнообразным опытом.
Будущие способы применения
Пока NeuRAMM лишь доказывает концепцию, и команда планирует доработать устройство так, чтобы оно справлялось с более сложными ИИ-приложениями.
По словам Вана, если бы чипы производились массово, они идеально подошли бы для носимых устройств в силу низкой стоимости, небольшого размера, универсальности и энергоэффективности. Благодаря NeuRRAM такие девайсы смогли бы обрабатывать ИИ-приложения, с которыми сегодня справляются лишь облачные вычисления.
Технология пригодится не только в сфере здравоохранения — NeuRRAM и прочие CIM-чипы обладают «практически неограниченным потенциалом», говорится в пресс-релизе Стэнфорда.
Однажды благодаря этим передовым микрочипам VR- и AR-гарнитуры получат больше возможностей с меньшей задержкой, а поисково-спасательные дроны — способность анализировать кадры в реальном времени, не расходуя батарею так быстро.
Эти чипы также могут позволить космическим роверам автономно исследовать другие планеты — им не придется ждать минуты и часы, чтобы получать указания с Земли.
Фото на обложке: Gorodenkoff /
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter