Top.Mail.Ru
Истории

Этот спикерфон может заглушать шумные зоны и назойливых людей

Истории
Елена Лиханова
Елена Лиханова

Старший редактор RB.RU

Елена Лиханова

Найдено решение против коллеги, который постоянно всех перебивает, — устройство, позволяющее нескольким людям вести два разговора одновременно и способное изолировать или заглушить каждый голос. Для этого используются самодвижущиеся микрофоны-роботы и нейросеть.

Этот спикерфон может заглушать шумные зоны и назойливых людей
  1. Истории
Автор: Елена Лиханова

Конус тишины

Новый динамик использует семь «самонаводящихся» микрофонов, которые разделяют комнату на так называемые «зоны речи», позволяя отслеживать и определять голоса разных людей, даже если они движутся.

Более того, авторы исследования считают, что это позволит не только отделить различные разговоры, но и заглушить шумные участки — или назойливых людей, например во время видеоконференции.

Согласно описанию работы, опубликованному в журнале Nature Communications, устройство включает так называемый рой роботов. Крошечные микрофоны размером с наперсток общаются между собой и передвигаются на крошечных колесах в разные точки, как роботы-пылесосы, а при необходимости возвращаются на станцию зарядки.

«Используя акустический рой роботов, нам впервые удалось отследить местонахождение нескольких людей, разговаривающих в комнате, и отделить их речь» — прокомментировал ведущий соавтор исследования Малек Итани из Школы компьютерных наук и инжиниринга Пола Г. Аллена.

Движение на звук

Как объясняют исследователи, чтобы ориентироваться в пространстве, прототипные роботы используют технологию, напоминающую высокочастотную эхолокацию.

Это и обеспечивает столь необходимую мобильность. Распределяя микрофоны как можно дальше, нейросеть, обрабатывающая данные, может делать более точные вычисления. Пока что роботы могут перемещаться лишь по поверхности стола, поскольку они способны ориентироваться лишь в двумерном пространстве.

«Мы разработали нейросети, которые задействуют сигналы с временной задержкой, чтобы отделить речь каждого человека и его перемещения в пространстве, — объясняет ведущий соавтор То Чао Чен. — Так что четверо людей могут вести два разговора одновременно, и каждый голос можно будет изолировать».

Зона тишины

Эксперименты в реальном мире показали впечатляющие результаты.

Исследователи испытывали рой роботов в таких местах, как офисы и кухни, где одновременно разговаривали от трех до пяти человек, причем системе заранее не было известно о расположении голосов.

Несмотря на эти препятствия, устройство смогло локализовать голоса 90% времени, находясь на расстоянии 0,5 м друг от друга. Медианная ошибка была довольно небольшой — менее 15 см для всех сценариев, что довольно точно.

Однако пока устройство работает недостаточно быстро. В среднем системе требуется 1,82 секунды, чтобы обработать 3 секунды звука. И это может создавать помехи во время видеоконференций.

Далее исследователи планируют применить эти технологии в физическом пространстве, в реальном времени, используя локализующие микрофоны, чтобы сделать то же, что шумоподавляющие наушники — но уже со всей комнатой.

Источник.

Фото на обложке: Unsplash

Подписывайтесь на наш Telegram-канал, чтобы быть в курсе последних новостей и событий!

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 6 AI-ботов, которые помогут найти и сохранить любовь
  2. 2 Типичные ошибки при запуске голосового робота и как их избежать
  3. 3 Люди и роботы: как «подружить» сотрудников с технологиями
  4. 4 Импортозамещение, роботы и решения для здоровья: какие задачи решали сколковские стартапы в 2023 году
  5. 5 На конференции в кластере «Ломоносов» расскажут о трендах и перспективах робототехники в России
FutureFood
Кто производит «альтернативную» еду
Карта

ВОЗМОЖНОСТИ

14 июля 2024

15 июля 2024