«ВКонтакте» запустила автоматические субтитры на базе собственных технологий распознавания речи
Автоматические субтитры на русском языке стали доступны в обновленном видеоплеере «ВКонтакте», говорится в сообщении компании. Они работают на базе собственных технологий соцсети по распознаванию речи, алгоритмов машинного обучения единой видеоплатформы и технологий интеллектуального шумоподавления единой платформы видеозвонков.
Новая технология способна автоматически сгенерировать текст, расставить знаки препинания и заглавные буквы, распределить текст по кадрам и проследить за точностью появления субтитра в момент произнесения фразы.
Отличие технологии от существующих решений на рынке — способность проставлять в субтитрах знаки препинания и заглавные буквы. Разработчики уверяют, что в ближайшем будущем технология будет способа разделять речь спикеров на разные реплики. Все это должно повысить понятность расшифровки и упростить чтение во время просмотра видео.
Соцсеть ведет тестирование и дообучение новой технологии: субтитры в экспериментальном режиме уже доступны части аудитории в популярных роликах и видео из верифицированных сообществ в веб-версии и мобильном приложении «ВКонтакте».
Как работает технология
Для обеспечения высокого качества расшифровки субтитров аудиопоток проходит четыре этапа обработки. Для начала запись очищается от фоновых звуков с помощью технологии интеллектуального шумоподавления — это позволяет лучше определять речь не только на профессиональных видео, но и на любительских роликах.
Затем нейросеть распознает слова и формирует из них текст. На третьем этапе подключается пунктуационная модель, которая расставляет знаки препинания и заглавные буквы.
Эти решения «ВКонтакте» ранее применила для распознавания аудиосообщений, а для работы с видео к ним добавили еще один шаг: методы машинного обучения распределяют текст по кадрам, таким образом фраза появляется точно в момент, когда говорящий ее произносит.
Подписывайтесь на наш TG-канал, чтобы быть в курсе всех новостей и событий!
Фото: «ВКонтакте»
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Популярное
Материалы по теме
-
Пройти курс «Как преуспеть на Ozon»
- 1 «Яндекс» запустил новую линейку генеративных нейросетей YandexART У платных подписчиков будет безлимит на генерацию картинок и видео 20 марта 14:56
- 2 Машинное обучение и большие данные: как они связаны? Прежде чем данные смогут «обучить» алгоритмы машинного обучения, они проходят этапы 19 марта 06:30
- 3 Топ-7 идей Data Science проектов — пет-проекты и примеры анализа данных Полезные проекты на каждый день 03 марта 18:55
- 4 Чем различаются слабый, сильный и супер-ИИ Широко распространен только один из них 27 декабря 20:50