Facebook разработала wav2vec Unsupervised (wav2vec-U) — систему распознавания речи, которая не требуют транскрибируемых данных.
«Это важный шаг на пути к созданию машин, которые смогут решать широкий круг задач, просто извлекая уроки из своих наблюдений. Мы думаем, что эта работа приблизит нас к миру, в котором речевые технологии доступны гораздо большему количеству людей», — говорится в сообщении Facebook.
Система использует новый, отличный подход по сравнению с созданными ранее. Работа метода начинается с изучения структуры речи из немаркированного звука. Система сегментирует голосовую запись на речевые единицы, которые приблизительно соответствуют отдельным звукам. Например, слово «кот» включает в себя три звука: «/ K /», «/ AE /» и «/ T /».
Систему протестировали wav2vec-U на таких языках, как суахили и татарский, для которых сейчас недоступны высококачественные модели распознавания речи.
«В более общем плане люди учатся многим навыкам, связанным с речью, просто слушая окружающих, — написали в Facebook. — Это говорит о том, что существует лучший способ обучения моделей распознавания речи, который не требует большого объема помеченных данных. Разработка более интеллектуальных систем такого рода — амбициозная долгосрочная научная задача, и мы верим, что wav2vec-U поможет нам продвинуться к этой важной и захватывающей цели»
Подписывайтесь на наш TG-канал, чтобы быть в курсе всех новостей и событий!
Фото: Facebook
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
- Пройти курс «Как управлять командой»
- 1 Производитель роботов ГК «Роботех» привлек 300 млн рублей от венчурного фонда «Восход»
- 2 В Москве на стройплощадке успешно протестировали робособак
- 3 Кардашьян сыграла в «камень, ножницы, бумага» с роботом Optimus
- 4 Стартап Kiwibot запустил аренду роботов-курьеров
ВОЗМОЖНОСТИ
08 декабря 2024
09 декабря 2024
10 декабря 2024