Китайские разработчики создали приложение для распознавания беззвучной речи
Китайские разработчики создали приложение, распознающее беззвучную речь по движениям губ пользователя. Об этом сообщает N+1.
Приложение отслеживает положение 20 контрольных точек, которые достаточно точно передают движения губ, отмечает издание. Оно также определяет степень открытости рта, что позволяет фиксировать начало и конец команды.
Пример создания контрольных точек
Эти данные передаются другому алгоритму нейросети, который занимается непосредственно распознаванием речи по движениям губ. Приложение разрабатывают для смартфонов, но пока оно работает только на компьютере, добавляет N+1.
Авторы приложения разработали для сервиса 44 команды. Часть из них относится ко всей системе, например, включает Wi-Fi, часть регулирует работу конкретных приложений. Еще часть команд позволяет взаимодействовать с любым приложением с помощью системных служб, например, выделять текст.
При этом приложение понимает контекст команд — если система отобразила всплывающее окно с сообщением, то пользователь сможет быстро ответить на него.
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Популярное
Материалы по теме
-
Пройти курс «Как открыть бизнес по франшизе»
- 1 Baidu выпустила две бесплатные модели ИИ для конкуренции с DeepSeek Обе доступны в чат-боте Ernie Bot 17 марта 11:40
- 2 Руководство DeepSeek ограничивает зарубежные поездки персонала В особенности в США — на фоне рекомендаций властей, которые борются с «утечкой мозгов» 16 марта 15:17
- 3 На острове Хайнань растет число новых коммерческих организаций Это в основном зарубежный бизнес: количество регистраций выросло почти на 20% 16 марта 14:28
- 4 Импорт грузов в Россию из Китая резко снизился На этом фоне уменьшились сроки и стоимость перевозок контейнеров 13 марта 12:37