Американская компания Lexika запустила разработанный на основе нейросети сервис для поиска по тексту в аудио- и видеофайлах.
Об этом пишет N+1, воспользоваться самим поиском можно после регистрации на сайте DeepGram.
Для того, чтобы найти определенный текст в аудио или видео с помощью сервиса, необходимо сначала загрузить контент в базу – пользователям доступно до 40 часов аудио и видео ежемесячно. Файлы можно загружать с локального диска или с видеохостингов.
После этого DeepGram проиндексирует полученный файл, и функция станет доступна. Можно, в частности, просмотреть полную текстовую транскрипцию файла, либо найти место, где звучит определенная фраза или слово — такие места будут отмечены на временной шкале файла красными точками.
Отмечается, что при создании DeepGram использовались методы глубокого обучения. Причем сервис ориентируется при поиске не на написание проиндексированного текста, а на фонетическую транскрипцию, что позволяет искать и находить слова и фразы, которые звучат похоже при разном написании. Однако у этого подхода есть и негативная сторона – в результатах может содержаться большое количество ошибок.
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
ВОЗМОЖНОСТИ
30 апреля 2024
30 апреля 2024