Top.Mail.Ru
Истории

Этот спикерфон может заглушать шумные зоны и назойливых людей

Истории
Елена Лиханова
Елена Лиханова

Бывший старший редактор RB.RU

Елена Лиханова

Найдено решение против коллеги, который постоянно всех перебивает, — устройство, позволяющее нескольким людям вести два разговора одновременно и способное изолировать или заглушить каждый голос. Для этого используются самодвижущиеся микрофоны-роботы и нейросеть.

Этот спикерфон может заглушать шумные зоны и назойливых людей
  1. Истории

Конус тишины

Новый динамик использует семь «самонаводящихся» микрофонов, которые разделяют комнату на так называемые «зоны речи», позволяя отслеживать и определять голоса разных людей, даже если они движутся.

Более того, авторы исследования считают, что это позволит не только отделить различные разговоры, но и заглушить шумные участки — или назойливых людей, например во время видеоконференции.

Согласно описанию работы, опубликованному в журнале Nature Communications, устройство включает так называемый рой роботов. Крошечные микрофоны размером с наперсток общаются между собой и передвигаются на крошечных колесах в разные точки, как роботы-пылесосы, а при необходимости возвращаются на станцию зарядки.

Освободите время и зарабатывайте больше с помощью ИИ! Пройдите курс и получите в подарок лучшие промты для решения бизнес-задач.

«Используя акустический рой роботов, нам впервые удалось отследить местонахождение нескольких людей, разговаривающих в комнате, и отделить их речь» — прокомментировал ведущий соавтор исследования Малек Итани из Школы компьютерных наук и инжиниринга Пола Г. Аллена.

Движение на звук

Как объясняют исследователи, чтобы ориентироваться в пространстве, прототипные роботы используют технологию, напоминающую высокочастотную эхолокацию.

Это и обеспечивает столь необходимую мобильность. Распределяя микрофоны как можно дальше, нейросеть, обрабатывающая данные, может делать более точные вычисления. Пока что роботы могут перемещаться лишь по поверхности стола, поскольку они способны ориентироваться лишь в двумерном пространстве.

«Мы разработали нейросети, которые задействуют сигналы с временной задержкой, чтобы отделить речь каждого человека и его перемещения в пространстве, — объясняет ведущий соавтор То Чао Чен. — Так что четверо людей могут вести два разговора одновременно, и каждый голос можно будет изолировать».

Зона тишины

Эксперименты в реальном мире показали впечатляющие результаты.

Исследователи испытывали рой роботов в таких местах, как офисы и кухни, где одновременно разговаривали от трех до пяти человек, причем системе заранее не было известно о расположении голосов.

Несмотря на эти препятствия, устройство смогло локализовать голоса 90% времени, находясь на расстоянии 0,5 м друг от друга. Медианная ошибка была довольно небольшой — менее 15 см для всех сценариев, что довольно точно.

Однако пока устройство работает недостаточно быстро. В среднем системе требуется 1,82 секунды, чтобы обработать 3 секунды звука. И это может создавать помехи во время видеоконференций.

Далее исследователи планируют применить эти технологии в физическом пространстве, в реальном времени, используя локализующие микрофоны, чтобы сделать то же, что шумоподавляющие наушники — но уже со всей комнатой.

Источник.

Фото на обложке: Unsplash

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

FutureFood
Кто производит «альтернативную» еду
Карта