Top.Mail.Ru
Новости

Китайские разработчики создали приложение для распознавания беззвучной речи

Новости
Анна Полякова
Анна Полякова

Редактор (RB)

Анна Полякова

Китайские разработчики создали приложение, распознающее беззвучную речь по движениям губ пользователя. Об этом сообщает N+1.

Китайские разработчики создали приложение для распознавания беззвучной речи

Приложение отслеживает положение 20 контрольных точек, которые достаточно точно передают движения губ, отмечает издание. Оно также определяет степень открытости рта, что позволяет фиксировать начало и конец команды.

Пример создания контрольных точек

Эти данные передаются другому алгоритму нейросети, который занимается непосредственно распознаванием речи по движениям губ. Приложение разрабатывают для смартфонов, но пока оно работает только на компьютере, добавляет N+1.

Авторы приложения разработали для сервиса 44 команды. Часть из них относится ко всей системе, например, включает Wi-Fi, часть регулирует работу конкретных приложений. Еще часть команд позволяет взаимодействовать с любым приложением с помощью системных служб, например, выделять текст.

При этом приложение понимает контекст команд — если система отобразила всплывающее окно с сообщением, то пользователь сможет быстро ответить на него.

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 Олимпийские игры 2024 уже стартовали — но не в Париже, а на китайских фабриках
  2. 2 «Офисное фермерство»: тренд для тех, кто устал от стресса на работе
  3. 3 Китайские автомобили. Как будет работать параллельный импорт после 1 апреля 2024 года?
  4. 4 Честный знак при карго-доставке из Китая: «серые» схемы и их последствия
  5. 5 В 2024 году объемы белой доставки из Китая превысят карго: цифровой рубль, «Честный знак» и еще пять предпосылок
DION
Что ждет рынок корпоративных коммуникаций в 2024 году?
Подробнее