Канадский стартап Lyrebird представил нейросетевой сервис для имитации речи, использующий для обучения всего одну минуту аудиозаписи с оригинальным голосом. Об этом говорится на сайте компании.
Алгоритмы для имитации речи создавались и ранее, однако нейросетям, как правило, требуется довольно большое количество материала (записей оригинального голоса), чтобы научиться ее воспроизводить.
Монреальскому проекту Lyrebird удалось сократить необходимое для обучения программы время до минуты, заявили в компании. Созданный специалистами Монреальского университета алгоритм, в частности, позволяет за полсекунды обработать до тысячи предложений, которые программа «скажет» нужным голосом и с нужной пользователю интонацией.
В данный момент синтезированные Lyrebird голоса звучат немного электронно, однако в случае знаменитостей позволяют безошибочно определить, кому они принадлежат. Свою разработку стартап продемонстрировал на голосах Барака Обамы, Дональда Трампа и Хиллари Клинтон, заставив копии их голосов обсуждать сам сервис.
Сроки релиза продукта не сообщаются. Также остается неясным, будет ли сервис полностью бесплатным. На сайте проекта в данный момент говорится о том, что Lyrebird планирует выпустить API для работы с алгоритмом, и приглашает пользователей стать бета-тестерами через подписку на email-рассылку.
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
- Пройти курс «Подбор и адаптация сотрудников»
- 1 Россияне назвали самые бесполезные новогодние подарки
- 2 Что подарить любителю технологий: обзор необычных подарков
- 3 12 причин влюбленности: как психология любви и привязанности влияет на нас
- 4 YouTube-блогеры попали в Книгу рекордов Гиннесса за создание двухметрового iPhone
ВОЗМОЖНОСТИ
28 января 2025
03 февраля 2025
28 февраля 2025