Top.Mail.Ru
Колонки

Следующий этап развития нейросетей: что такое интерактивный ИИ и почему он «умнее» генеративного

Колонки
Александр Хопёрский
Александр Хопёрский

Сооснователь компании AI Agents

Елизавета Шатохина

Искусственный интеллект — интересная и быстро развивающаяся сфера. Трудно вспомнить технологию за последние 20 лет, которая сильнее вдохновляла инвесторов и исследователей на создание новых продуктов. 

Сегодня системы искусственного интеллекта выполняют задачи на уровне или выше человеческого интеллекта: понимают естественный язык, распознают лица, создают контент. Многие эксперты и ученые сходятся в том, что в будущем ИИ станет ещё «умнее». Сооснователь компании AI Agents Александр Хопёрский рассказал, что такое интерактивный ИИ и чем он отличается от генеративного.

Следующий этап развития нейросетей: что такое интерактивный ИИ и почему он «умнее» генеративного
  1. Колонки

 

Что такое интерактивный ИИ

Наше время будут вспоминать как эпоху обучения ИИ. С появлением больших языковых моделей (LLM) мы смогли передавать человеческие знания искусственным формам сознания. Сейчас мировое комьюнити исследователей и энтузиастов делает вклад в создании глобального ИИ, или по-другому, — AGI (Artificial general intelligence). Предполагается, что технология сможет самостоятельно обучаться и выполнять любые задачи. Это та самая стадии сингулярности, о которой говорил фантаст Вернор Виндж ещё в 1983 году, предрекая появления искусственных форм сознания, которые станут умнее человека.

Интерактивный искусственный интеллект основан на представлении о том, что человеческий интеллект характеризуется разносторонними связями на разных уровнях. Например, мы можем одновременно разговаривать по телефону и общаться с коллегой по соседству с помощью эмоций и языка тела. И таких параллельных разговоров за день у нас может быть сотни.

Интерактивный ИИ похож на человека в режиме многозадачности. Он переходит от простого ввода и вывода информации к постоянному диалогу сразу с несколькими людьми, программами или другими интерактивными нейронными сетями. В отличие от генеративного ИИ, интерактивный не ограничивается анализом данных и их прогнозированием на основе заранее заданной модели. Он строится на взаимодействии разных подсистем и способен адаптивно подстраиваться под нужные задачи.

 

Как интерактивный ИИ подводит к «постсмартфонной» эре ИИ-девайсов

Взаимодействию разных языковых моделей под управлением человека отводится ключевая роль в работе интерактивного ИИ. При этом появление новых инструментов меняет сценарии выполнения задач. Это означает, что программы, которыми мы пользуемся на ежедневной основе, становятся более интеллектуальными, способными самостоятельно решать вопросы.

Теперь для пользователя как никогда важно иметь гибкий интерфейс приложений, заточенных под его личные проблемы и задачи. На место вау-эффекта от появления первого iPhone с выезжающей клавиатурой пользователи ждут новых революционных решений. И если вы думаете, что до этого еще далеко, то крупно ошибаетесь. Такие девайсы уже среди нас.

Первым, кто осмелился представить, как должен выглядеть девайс будущего, стала компания Humane, основанная бывшими дизайнерами Apple, которые отвечали за разработку Apple Watch, iPhone, iPad и других устройств. 

Разработанное ими устройство AI Pin представляет собой небольшую «брошку» с микрофоном, камерой и проектором для вывода информации на ладонь. Цена на устройство начинается от $700. Девайс работает на базе ChatGPT-4, за который вы должны будете платить еще по $20 в месяц.

 AI Pin. Источник: Humane

 

Еще одним интересным прототипом является проект Rabbit R1. Его создатель Джесси Лю разработал собственную операционную систему для автономных агентов на базе ИИ. Устройство представляет набор автономных помощников («кроликов»), которые помогают пользователю вызвать такси, заказать еду или товар на Amazon. Устройство отсылает к консольным дизайнам 90-х годов и позиционирует себя как умный помощник для молодёжи. Стоить он будет всего $200 и появится на прилавках США уже в марте. Будет интересно посмотреть на его результаты и как его воспримет молодёжь.

Rabbit R1. Источник: Rabbit.tech

 

Всё это говорит о том, что сейчас нужно переосмыслить развитие традиционных систем ввода и вывода информации, так как большая часть функций теперь будут выполняться в фоновом режиме.

Интерактивный ИИ — понятие новое, но его смело можно охарактеризовать как посредника между человеком и цифровым миром. Такая система обладает высокой степенью вовлеченности и понимания всех процессов. Однако уровень распознавания контекста во многом остается таким же, как и в генеративных языковых моделях. Качественно новый результат достигается за счет разработки автономных ИИ-агентов для выполнения задач. Такие алгоритмы способны демонстрировать высокую степень рассуждения и всесторонней проверки.

В последние десятилетия исследовательские усилия были сосредоточены на развитие способов и глубины общения между человеком и машиной. Совсем скоро диалог станет основной формой обмена информацией. Искусственный интеллект изменит то, как мы работаем с интерфейсами отдельных программ и экранов. 

Пользователю останется привычное диалоговое окно, в котором он формулирует задачу текстом или голосом и отслеживает ход её выполнения. Ведь это намного удобней, чем нажимать на клавиши, не так ли? Весь процесс будет происходить в виртуальных сессиях в фоновом режиме, где-то далеко на сервере. 

Способность действовать — это то, что отличает интерактивный ИИ от своих предыдущих форм. Вы просто ставите верхнеуровневую цель, и модель декомпозирует задачу на конкретные действия в различных программах, выстраивая последовательный сценарий их выполнения. Она, как дирижёр множества соподчиненных программ и сотрудников, будет вести диалог с ними и перенаправлять потоки данных в правильном направлении.

Это огромный шаг в развитии технологии искусственного интеллекта. Многие до конца не понимают, насколько сильно это изменит подход в работе с информацией. Но для развития интерактивного ИИ потребуются изменить всю инфраструктуру работы с информацией: все вычисления будут происходить в облаке, поэтому персональным компьютерам и мобильным устройствам уже не нужна будут большая часть функций и вычислительной мощности. 

Из-за этого сократится число предустановленного программного обеспечения на устройства. Достаточно будет иметь командную строку ввода запроса или отправку голосовой команды, чтобы запустить выполнение любой задачи. В «постсмартфонную» эру вендоры устройств, такие как Apple, Samsung и другие, больше не будут соревноваться в мощности процессоров и их производительности. На первое место выйдет количество интеграций и способность автономно выполнять наибольшее количество задач. Такая облачная инфраструктура снизит также и потребление энергии девайсов, и на рынок выйдут модели, способные работать днями без подзарядки.

 

Интерактивный ИИ — свободный ИИ

Обретая автономность, искусственный интеллект становится более свободным. Однако, чтобы позволить выполнять процессы за пользователя, нейросеть должна получить доступы и права на выполнения задач, чтобы сторонние программы воспринимали ее как запрос от пользователя. Это требует разработки новых протоколов взаимодействия систем и новых способов аутентификации.

Нынешние интерфейсы API не рассчитаны на предоставление полноценного доступа к программному обеспечению: передаются лишь некоторые триггерные события. Но для понимания всего контекста нейросетям требуется как можно больше информации. Например, интерактивный ИИ может генерировать текст, отражающий стиль и тон пользователя; изображения, соответствующие вкусу и настроению человека; код, соответствующий его требованиям.

Интеграции и свобода действий дает интерактивному ИИ возможность адаптировать свои результаты к предпочтениям пользователя. В зависимости от контекста меняется и роль интерактивного ИИ: он может избегать создания неуместных ситуаций, исправлять результаты, исполнять роль руководителя и контролера, проверяя ход выполнения процессов, и сам выполнять роль заказчика.

Генеративные модели уже сейчас умеют примерять на себя разные роли для генерации контента, но это достигается за счет прямой команды от пользователя. Интерактивный ИИ сможет сам определять контекст задачи и собственную роль для её выполнения.

 

Вместо заключения

Путь от генеративного к интерактивному ИИ уже начался. Мы добились прогресса в передачи знаний ИИ. Он может планировать, самостоятельно решать проблемы, использовать внешние инструменты и следовать инструкциям. Интерактивный ИИ будет и дальше эволюционировать в том, как он взаимодействует с системами, управляемыми людьми и нейросетями.

Исследователи в сфере ИИ приближают нас к будущему, в котором ИИ сможет беспрепятственно управлять сложными задачами, становясь больше чем просто ассистентом для пользователя в его ежедневных задачах. Он сможет полноценно взять на себя большинство рутинных процессов, освободив время для вещей, которые по-настоящему важны.

Фото на обложке: Freepik / Freepik

Подписывайтесь на наш Telegram-канал, чтобы быть в курсе последних новостей и событий!

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 ИИ сделал проще соблюдение конфиденциальности данных
  2. 2 С момента появления ChatGPT число вакансий для копирайтеров на Upwork снизилось на 21%
  3. 3 После запуска ChatGPT упал спрос на фрилансеров — отчет
  4. 4 За кулисами Sora: как работает видеонейросеть от OpenAI
  5. 5 Копирайтер VS нейросеть: пишем текст и теряем заказчиков
FutureFood
Кто производит «альтернативную» еду
Карта