SberDevices представила семейство моделей машинного обучения для распознавания речи и эмоций
Их можно использовать для подготовки дипломных работ и научных статей
SberDevices представила GigaAM — это семейство open-source моделей машинного обучения для распознавания речи и эмоций, говорится в сообщении SberDevices.
Акустические модели можно использовать для подготовки дипломных работ и научных статей. Разработкой занимались команды сервисов GigaChat и SaluteSpeech в SberDevices.
- GigaAM — Audio Foundation Model, предобучена на разнообразной русской речи. Можно использовать для адаптации под разные задачи работы со звуком, в том числе для распознавания речи и эмоций, определения диктора и другие.
- GigaAM-CTC — открытая модель для распознавания запросов на русском языке. Оценка качества на 7 срезах данных (от запросов в «умные» колонки до записей из телефонного канала) показала, что модель допускает в коротких запросах на 20–35% меньше ошибок в словах по сравнению с такими решениями, как NeMo-Conformer-RNNT и Whisper-Large-v3.
- GigaAM-Emo — акустическая модель, созданная для определения эмоций. По данным SberDevices, продемонстрировала лучший результат на крупнейшем датасете Dusha среди известных моделей.
Все модели размещены в открытом доступе с некоммерческой лицензией.
Фото на обложке: Unsplash
Публикации по теме
-
Партнёрский материал Что сдерживает модернизацию ЖКХ: итоги отраслевой дискуссии на ПМЭФ 16 июня 2026, 15:52
-
Личное Дарио Амодеи. Как обыграть OpenAI и создать самый дорогой ИИ-стартап в мире 16 июня 2026, 12:05
-
Технологии Что сдерживает модернизацию ЖКХ: итоги отраслевой дискуссии на ПМЭФ 09 июня 2026, 12:14
-
Бизнес Музыкальный бизнес в России в 2026-м: как ИИ и новые законы меняют рынок 19 июня 2026, 18:30
-
Бизнес Как бренд пазлов «Харди Гарди» получил рекламу у блогера-миллионника, просто рассказав о своём проекте 05 июня 2026, 14:23
-
Технологии Прощание с эпохой Кука и ставка на агентов: конференция Apple WWDC 2026 12 июня 2026, 15:35
-
Тренды «Пухосос купить»: как россияне поверили в фейк, а бренды — заработали на меме 11 июня 2026, 19:59
-
Искусственный интеллект Как подключить Яндекс Дропс и использовать все функции Алисы AI: полный обзор первых ИИ-наушников от Яндекса 09 июня 2026, 11:00
Новости по теме
-
Технологии Пользователи сообщают о сбое в работе Twitch — при этом Роскомнадзор отрицает блокировку сервиса в России 23 июня 2026, 20:00
-
Технологии В работе Claude произошёл сбой 23 июня — пользователи по всему миру жалуются на недоступность нейросети 23 июня 2026, 19:26
-
Технологии «Моторика» привлекла 1 млрд ₽ льготного финансирования — средства направят на развитие нейротехнологий 23 июня 2026, 16:40
-
Россия Госдума ввела ипотечные каникулы для семей с двумя детьми — заёмщики смогут приостановить выплаты на 18 месяцев 23 июня 2026, 19:47
-
Маркетплейсы Wildberries может купить «Еаптеку» осенью 2026 года — тогда маркетплейс обгонит Ozon и «Яндекс» на фармрынке 23 июня 2026, 19:13
-
Бизнес Налоговые долги бизнеса и граждан достигли 4 трлн ₽: главные причины — дорогие кредиты и рост НДС 23 июня 2026, 15:30
-
На регате Digital Club встретятся представители бизнеса — среди них «Аэрофлот», ВТБ и Ozon Банк 22 июня 2026, 16:12
-
Искусственный интеллект VK, «Яндекс» и «Авито Реклама» выступят на конференции «AdIndex Сити»: главная тема — влияние ИИ 22 июня 2026, 14:49