Top.Mail.Ru
Колонки

ИИ в сервисах для видеоконференций: сегодня и завтра

Колонки
Дмитрий Крюков
Дмитрий Крюков

Руководитель направления гибридных коммуникаций «МТС Линк»

Ольга Тройникова

Удобство видеоконференций многие оценили только в период пандемии: инструмент стал незаменим в работе, учёбе и дружеском общении. Спрос породил предложение: разработчики платформ наперегонки стали раширять их возможности, чтобы опередить конкурентов, в том числе за счёт внедрения ИИ.

Как именно он помогает улучшить видеоконференции, что доступно уже сегодня, а что появится в ближайшем будущем, рассказал Дмитрий Крюков, руководитель направления гибридных коммуникаций «МТС Линк».

ИИ в сервисах для видеоконференций: сегодня и завтра
  1. Колонки
Автор: Ольга Тройникова

 

Доступно уже сейчас

Транскрибация

Ещё семь–десять лет назад перевод звука в текстовый формат требовал усилий. Сервисы для расшифровки существовали уже тогда, но в большинстве своем они делали слишком много ошибок. На их исправление уходило не меньше времени, чем требовала транскрибация вручную. 

Сегодня инструменты для транскрибации стали заметно лучше. Сервисы на основе ИИ делают эту работу быстро и практически без ошибок. Достаточно загрузить запись: через несколько секунд вы получите результат. Часто даже этого не требуется, если в платформу для видеоконференции опция встроена по умолчанию. 

Если говорить о том, какие профессии вытеснил искусственный интеллект, то профессия транскрибатора — одна из них.

Тем не менее сложности ещё остаются, поскольку речь бывает разной. Кто-то говорит слишком быстро, кто-то «проглатывает» слоги и даже слова, кто-то говорит с акцентом. А ещё во время видеозвонка люди могут перебивать друг друга. Всё это влияет на результат транскрибации: чем больше помех, тем труднее машине разобрать речь.

 

Подведение итогов звонка

Подведение итогов — один из самых важных этапов встречи. Для дальнейшей работы необходимо зафиксировать, что обсуждали, о чём договорились, что наметили на будущее.

Раньше эта задача поручалась кому-то из участников или даже стороннему ассистенту, который делал краткое резюме на основе записи.

Сейчас это умеет делать встроенный ИИ. После встречи участники получают краткую текстовую выжимку, где обозначено содержание беседы и основные выводы. Такие конспекты важны не только для тех, кто присутствовал на встрече. Они выручат, если человек пропустил собрание или лекцию, но у него нет времени полностью переслушивать запись.

Платформы с опцией подведения итогов звонка есть в России. Причём они получают позитивную обратную связь от пользователей. Это говорит о необходимости дальше развивать такие сервисы и расширять их функционал.



 

Шумоподавление 

Даже в офисе не всегда есть возможность обеспечить полную тишину, что уж говорить о работе на удалёнке. Большинство сотрудников научились гибкости и присоединяются ко встрече откуда угодно: из квартиры, ближайшего кафе или парка. Но в таких условиях о звукоизоляции можно не мечтать.

Шум транспорта, крики детей и сосед с дрелью создают нежелательный для деловой встречи фон.

Справиться с этой проблемой помогают инструменты, у которых достаточно сложные алгоритмы. Сначала ИИ анализирует звуковой поток и определяет голоса участников. Затем он выясняет, какие именно звуки — ненужный шум, который стоит удалить.

Чтобы ИИ смог это сделать, его нужно «познакомить» с типичными помехами вроде гула транспорта, лая собаки, дрели, посторонних разговоров в кафе. Подобные технологии создаются и без участия ИИ, но в этом случае их качество хуже.

 

Бьютификация

Большинство платформ для видеоконференций включает опцию смены фона. Она полезна в том случае, если окружающая обстановка не соответствует деловой беседе. Вместо интерьеров квартиры, откуда подключается сотрудник, подставляются фотографии офиса, красивые пейзажи или абстрактные зарисовки. Или фон можно просто размыть, чтобы скрыть детали интерьера.

Современные технологии корректируют не только фон. Они включают фильтры и настройки цветопередачи, позволяющие улучшить освещение и пройти «косметическую процедуру» участнику видеоконференции.

Благодаря маскам и фильтрам ИИ может, например, подкорректировать мешки под глазами. Это позволяет человеку чувствовать себя комфортнее на встрече и не переживать, что он плохо выглядит из-за того, что не выспался или только вышел с больничного.


По теме. Zoom-этикет: какое поведение допустимо во время
виртуальных встреч?


 

Резюме чатов

Во время видеоконференции немало полезной информации отправляется в чат. Туда кидают ссылки на ресурсы, о которых идёт речь в беседе. В чате комментируются вводные, которые появляются по ходу беседы. Например, когда спикер использует непонятные термины, кто-то из коллег может расшифровать их в чате для остальных, не прерывая докладчика.

По завершении встречи важная информация часто теряется, если специально её не сохранить. А сотрудник, который подключился к разговору позже, упускает часть сообщений из-за их потока. Человеку придётся пролистывать чат назад, что может отвлечь от беседы.

В такой ситуации тоже выручает ИИ: он способен сделать резюме чата. Инструменты на основе искусственного интеллекта сохранят самое важное и создадут удобную выжимку, к которой можно обратиться и во время встречи, и после неё.

 

Доступно будет позже (но пока неточно)

Анализ рабочих звонков

Часто бывает так, что рабочее время уходит на ненужную работу. Это, например, ситуации дублирования усилий, когда одну и ту же задачу решают несколько разных исполнителей. Или участие в ненужных встречах, куда сотрудника зовут «на всякий случай».

Лишнее время тратится и на ожидание фидбека, и на поиск файлов, и на другую рутину. Естественно, что при таком неоптимальном распределении задач многое не делается вовремя, теряется информация и вносятся другие элементы хаоса.

Уменьшить хаос помог бы универсальный ассистент, который слушал бы онлайн-звонок, а потом рассылал ответы на вопросы, заданные в ходе встречи, планировал новые совещания, обновлял планы всей команды и отдельных сотрудников. С учётом задач и приоритетов, обозначенных на собрании, добавлял обновления в календарь и так далее.

ИИ-ассистент помог бы как минимум избежать дублирования функций и присутствия на «ненужных» звонках. И сегодня уже есть предпосылки для появления таких технологий в будущем.

 

Оценка настроения 

Согласно данным международных исследований, 77% работников испытывают выгорание, а в ответ на вопрос, в чём они видят причину, называют отсутствие поддержки со стороны руководства. Но даже если руководство внимательно относится к сотрудникам, усталость всё равно может возникать. А если что-то не ладится или проект пробуксовывает, мы расстраиваемся, и работа начинает казаться бессмысленной.

И опять на помощь мог бы прийти ИИ. Он способен отслеживать мимику и жесты, определять признаки выгорания и давать сигнал руководителю. Это позволило бы вовремя принять меры: обсудить с сотрудником проблемы, перераспределить задачи, предложить ему отдых или другую поддержку, чтобы он успешно преодолел кризис.

 

Виртуальный аватар 

Человек устаёт, и этого никак не избежать. Если преподавателю нужно прочитать пять–шесть лекций за день, силы будут на исходе к концу последней лекции даже у профи. В итоге нарушается внимание и самого лектора, и слушателей. Преподаватель уже не так охотно отвечает на вопросы, и качество работы с аудиторией падает.

В таких ситуациях человека может заменить виртуальный аватар. Он не устаёт, всегда остается в хорошем настроении и может читать лекции для аудитории из других стран с помощью встроенного переводчика. Не исключено, что такие виртуальные аватары появятся на образовательных онлайн-платформах в недалёком будущем.


По теме. Ученые выяснили, какой фон помогает произвести лучшее впечатление на видеозвонке


 

Виртуализация идей

Элементы виртуальной и дополненной реальностей используются в видеосвязи уже сейчас, но пока их применение не очень широко. Тем не менее это направление активно развивается, и в будущем стоит ждать более полной виртуализации.

Благодаря таким инструментам будет возможна визуализация идей в режиме реального времени. Искусственный интеллект покажет в виртуальной реальности, как будут работать предложенные участниками планы.

Такая наглядность позволит сразу увидеть сильные и слабые стороны проекта. И, как следствие, проработать первые и откорректировать вторые. Все это повысит эффективность рабочего общения и сэкономит время команды.

 

Воспроизведение ощущений и запахов

Мы считаем, что скоро появится возможность передавать по видеосвязи тактильные ощущения и запахи. Это позволит виртуально пожать руку коллегам или воспроизвести уютную атмосферу кофейни.

Такие опции сделают обстановку более непринужденной, помогут быстрее наладить контакты между участниками. Всё это способствует объединению команды, даже если её представители находятся за тысячи километров друг от друга.

Фото на обложке: Freepik

Подписывайтесь на наш Telegram-канал, чтобы быть в курсе последних новостей и событий!

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 Все по правилам. Как бизнесу избежать проблем с законом при запуске видеорекламы
  2. 2 Вертикальные видео и упор на e-com: как меняются соцсети
  3. 3 Как мы заработали 20 млн рублей в год на стримерах: история платформы по продвижению трансляций Reyden-X
  4. 4 Видео в 8K, новый Wi-Fi и нейросети: главные тренды с выставки IBC-2023 в Амстердаме
  5. 5 5 неочевидных замен Youtube для бизнеса
ArtTech — карта разработчиков арт-технологий
Все игроки российского рынка технологий для искусства
Перейти