SberDevices представила семейство моделей машинного обучения для распознавания речи и эмоций
Анастасия Марьина
SberDevices представила GigaAM — это семейство open-source моделей машинного обучения для распознавания речи и эмоций, говорится в сообщении SberDevices.
Акустические модели можно использовать для подготовки дипломных работ и научных статей. Разработкой занимались команды сервисов GigaChat и SaluteSpeech в SberDevices.
- GigaAM — Audio Foundation Model, предобучена на разнообразной русской речи. Можно использовать для адаптации под разные задачи работы со звуком, в том числе для распознавания речи и эмоций, определения диктора и другие.
- GigaAM-CTC — открытая модель для распознавания запросов на русском языке. Оценка качества на 7 срезах данных (от запросов в «умные» колонки до записей из телефонного канала) показала, что модель допускает в коротких запросах на 20–35% меньше ошибок в словах по сравнению с такими решениями, как NeMo-Conformer-RNNT и Whisper-Large-v3.
- GigaAM-Emo — акустическая модель, созданная для определения эмоций. По данным SberDevices, продемонстрировала лучший результат на крупнейшем датасете Dusha среди известных моделей.
Все модели размещены в открытом доступе с некоммерческой лицензией.
Фото на обложке: Unsplash
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Популярное
Материалы по теме
-
Пройти курс «Личный опыт: как открыть магазин одежды»
- 1 МТС Exolve озвучит текст на шести языках Новый сервис упростит взаимодействие с клиентами и повысит его эффективность 06 марта 18:15
- 2 Голосовые технологии, адаптация и рост: пять лет Fromtech на рынке Интервью с генеральным директором Fromtech генеральным директором Александром Глазуновым 30 сентября 19:25
- 3 В «Алисе» «на железном уровне» блокируется навык «подслушивания» Как заявил директор бизнес-группы поиска и рекламных технологий «Яндекса» Дмитрий Масюк 20 июля 21:13
- 4 Skyeng разработал разговорный ИИ-тест для определения уровня владения английским языком 15-минутный тест с точностью 95% оценивает текущий уровень студента 06 марта 16:24