Top.Mail.Ru
Новости

Технология распознавания речи группы ЦРТ стала лучшей на конкурсе CHiME

Новости
Анна Оленькова
Анна Оленькова

Ex-руководитель новостного отдела.

Анна Оленькова

Технология диаризации и распознавания речи, созданная группой компаний ЦРТ, признана лучшей на конкурсе CHiME Speech Separation and Recognition Challenge. Об этом Rusbase рассказали в пресс-службе ЦРТ.

Технология распознавания речи группы ЦРТ стала лучшей на конкурсе CHiME

Конкурс международный. Он проводится раз в два года и с каждым разом задания становятся более сложными.

На CHiME-5 конкурсанты решали так называемую cocktail party problem — распознавание спонтанной речи, когда в шумной обстановке говорит несколько людей. Этот блок требовал работы с сегментированной (уже выделенной) речью. Тогда ЦРТ стал третьим.

На CHiME-6 конкурсантам было предложено решить аналогичную проблему, но работая с несегментированной речью. Записи были сделаны на 20 ужинах на настоящих вечеринках, где люди готовили, ели, мыли посуду, общались, шутили и смеялись. Там была одновременно речь 2-4 человек и шум — звон приборов, льющаяся из крана вода, гул кондиционера, шаги, смех.

Цель конкурса состояла в том, чтобы создать систему распознавания, которая «прослушает» записи и выдаст полную расшифровку с наименьшим количеством ошибок. 

Для решения задачи ЦРТ разработал алгоритм выделения речевых сегментов для каждого из дикторов, а также комплекс из нескольких нейронных сетей, различающий разных дикторов.

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 «Тинькофф» запустил для пользователей «вселенную ассистентов» на основе ИИ
  2. 2 «Яндекс» представил обновленную нейросеть YandexART 1.3
  3. 3 В кофематы Unicum встроят голосового помощника
  4. 4 На TechRec 2024 расскажут, как грамотно внедрить ИИ в HR
  5. 5 Google не будет заявлять права на контент, сгенерированный сервисами на основе ИИ
Relocation Map
Интерактивный гид по сервисам и компаниям, связанным с релокацией
Перейти