Канадский стартап Lyrebird представил нейросетевой сервис для имитации речи, использующий для обучения всего одну минуту аудиозаписи с оригинальным голосом. Об этом говорится на сайте компании.
ПрисоединитьсяАлгоритмы для имитации речи создавались и ранее, однако нейросетям, как правило, требуется довольно большое количество материала (записей оригинального голоса), чтобы научиться ее воспроизводить.
Монреальскому проекту Lyrebird удалось сократить необходимое для обучения программы время до минуты, заявили в компании. Созданный специалистами Монреальского университета алгоритм, в частности, позволяет за полсекунды обработать до тысячи предложений, которые программа «скажет» нужным голосом и с нужной пользователю интонацией.
В данный момент синтезированные Lyrebird голоса звучат немного электронно, однако в случае знаменитостей позволяют безошибочно определить, кому они принадлежат. Свою разработку стартап продемонстрировал на голосах Барака Обамы, Дональда Трампа и Хиллари Клинтон, заставив копии их голосов обсуждать сам сервис.
Сроки релиза продукта не сообщаются. Также остается неясным, будет ли сервис полностью бесплатным. На сайте проекта в данный момент говорится о том, что Lyrebird планирует выпустить API для работы с алгоритмом, и приглашает пользователей стать бета-тестерами через подписку на email-рассылку.
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
- 1 14 подкастов ко дню программиста, которые интересно послушать неравнодушным к софтверу
- 2 «Я не понимал, как буду жить на меньшую зарплату, но согласился» – кипер московского зоопарка об увольнении из корпорации
- 3 8 причин, почему бутстрэппинг сделает из вас классного предпринимателя
- 4 Инвестор комментирует идеи стартапов, которые зрители канала «вДудь» предложили Ходорковскому
- 5 Шесть главных мифов о технарях и почему им нельзя верить
ВОЗМОЖНОСТИ
29 марта 2024
31 марта 2024
31 марта 2024