Технология распознавания речи группы ЦРТ стала лучшей на конкурсе CHiME
Технология диаризации и распознавания речи, созданная группой компаний ЦРТ, признана лучшей на конкурсе CHiME Speech Separation and Recognition Challenge. Об этом Rusbase рассказали в пресс-службе ЦРТ.
Конкурс международный. Он проводится раз в два года и с каждым разом задания становятся более сложными.
На CHiME-5 конкурсанты решали так называемую cocktail party problem — распознавание спонтанной речи, когда в шумной обстановке говорит несколько людей. Этот блок требовал работы с сегментированной (уже выделенной) речью. Тогда ЦРТ стал третьим.
На CHiME-6 конкурсантам было предложено решить аналогичную проблему, но работая с несегментированной речью. Записи были сделаны на 20 ужинах на настоящих вечеринках, где люди готовили, ели, мыли посуду, общались, шутили и смеялись. Там была одновременно речь 2-4 человек и шум — звон приборов, льющаяся из крана вода, гул кондиционера, шаги, смех.
Цель конкурса состояла в том, чтобы создать систему распознавания, которая «прослушает» записи и выдаст полную расшифровку с наименьшим количеством ошибок.
Для решения задачи ЦРТ разработал алгоритм выделения речевых сегментов для каждого из дикторов, а также комплекс из нескольких нейронных сетей, различающий разных дикторов.
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Популярное
Налог на прибыль организаций
Материалы по теме
-
Пройти курс «Искусство переговоров»
- 1 Инвесткомпания миллиардера Джеффа Безоса вошла в капитал Toloka Аркадия Воложа, возглавив раунд на $72 млн Средства будут направлены на масштабирование проекта 08 мая 12:32
- 2 В Windows 11 в приложении «Параметры» появится ИИ-агент для настройки ПК Функция будет доступна на устройствах с Copilot+ 07 мая 10:54
- 3 OpenAI отказалась от обновления GPT-4o из-за недовольства пользователей По поводу льстивого поведения 30 апреля 15:26
- 4 «Яндекс Маркет» запустил в приложении чат с ассистентом на базе ИИ Для улучшения процесса покупки товаров 30 апреля 14:08