Технология распознавания речи группы ЦРТ стала лучшей на конкурсе CHiME
Задачи по распознаванию решали научные команды со всего мира
Технология диаризации и распознавания речи, созданная группой компаний ЦРТ, признана лучшей на конкурсе CHiME Speech Separation and Recognition Challenge. Об этом Rusbase рассказали в пресс-службе ЦРТ.
Конкурс международный. Он проводится раз в два года и с каждым разом задания становятся более сложными.
На CHiME-5 конкурсанты решали так называемую cocktail party problem — распознавание спонтанной речи, когда в шумной обстановке говорит несколько людей. Этот блок требовал работы с сегментированной (уже выделенной) речью. Тогда ЦРТ стал третьим.
На CHiME-6 конкурсантам было предложено решить аналогичную проблему, но работая с несегментированной речью. Записи были сделаны на 20 ужинах на настоящих вечеринках, где люди готовили, ели, мыли посуду, общались, шутили и смеялись. Там была одновременно речь 2-4 человек и шум — звон приборов, льющаяся из крана вода, гул кондиционера, шаги, смех.
Цель конкурса состояла в том, чтобы создать систему распознавания, которая «прослушает» записи и выдаст полную расшифровку с наименьшим количеством ошибок.
Для решения задачи ЦРТ разработал алгоритм выделения речевых сегментов для каждого из дикторов, а также комплекс из нескольких нейронных сетей, различающий разных дикторов.
- 7 из 10 компаний в России инвестируют в ИИ-инфраструктуру в 2026 году: план — повысить эффективность работы Большинство планируют направить средства на ИИ-агентов и генеративные нейросети 03 апреля 2026, 19:00
- Яндекс добавил в Алису AI режим «Исследовать»: ИИ-агент проводит анализ бизнеса, финансов и создаёт карьерные треки Функция доступна всем пользователям Алисы AI 02 апреля 2026, 19:30
- Университет «Зерокодер» запускает первый в России венчурный фонд для ИИ-стартапов: инвестиции составят до 100 млн ₽ Главное условие — максимальная автоматизация бизнеса с помощью ИИ 02 апреля 2026, 15:05
- Партнёрский материал Экс-директор Xiaomi о том, как делать сильные продукты и внедрять ИИ без иллюзий Почему низкая цена сама по себе ничего не решает, как продукт рождается из сценария пользователя и почему любые технолог