«Сбер» открывает доступ к датасету Golos
«Сбер» открывает доступ к датасету Golos — самому большому размеченному вручную набору речевых данных на русском языке, включающему 1240 часов аудиоданных.
Также в Golos входит модель распознавания речи, которая демонстрирует точность, сравнимую с человеческой, сообщает пресс-служба банка.
Датасет можно скачать на сайте GitHub.
Данные Golos могут быть использованы для распознавания и синтеза речи. Сбер предоставит их по лицензии, допускающей использование в исследовательских и коммерческих целях.
Над датасетом работала команда SberDevices. Было сгенерировано более 1240 часов речи, похожей на запросы пользователей. Датасет Golos составляют обезличенные записи, прослушанные и размеченные вручную.
Помимо данных, «Сбер» выкладывает обученную на них модель распознавания речи. Она проходила обучение с использованием мощностей суперкомпьютера «Кристофари» от Сбера на 16 видеокартах Nvidia Tesla V100 в течение 8 дней. Доступная для использования акустическая модель QuartzNet 15x5 была обучена на данных датасетов Golos и Common Voice, а языковая модель KenLM построена на Common Crawl и аннотациях Golos, заявили в банке.
Открытие датасета Golos — это очень важный шаг для развития речевых технологий в России, и мы в «Сбере» рады, что можем применить свой опыт в этой области и продолжить наш тренд делиться своими наработками и технологиями с разработчиками и научным сообществом. <...> Мы верим, что датасет Golos даст возможность научному сообществу России двигаться ещё быстрее в совершенствовании русскоязычных речевых технологий.
Ранее глава Сбербанка Герман Греф заявил, что экосистема банка будет открытой для доступа к ней других участников.
Подписывайтесь на наш TG-канал, чтобы быть в курсе всех новостей и событий!
Фото на обложке: bxTT /
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Популярное
Материалы по теме
-
Пройти курс «Как преуспеть на Ozon»
- 1 Выбор микрофона: на что обратить внимание и как проверить перед покупкой? И как вообще устроен микрофон 20 декабря 05:00
- 2 Google решил защитить товарными знаками два новых сервиса в России Новыми продуктами корпорации в России стали ИИ-чатбот и ИИ для подкастов 29 ноября 14:38
- 3 Как записать подкаст и сделать его успешным Где брать музыку, как выбрать тему и каких гостей приглашать 18 октября 18:50
- 4 Победители премии RB Digital Awards 2024 станут героями видеоподкаста Подкаст развивает компания-разработчик ПО KOTELOV 01 февраля 20:35