Канадский стартап Lyrebird, работающий над нейросетевым сервисом для имитации любого голоса на базе одной минуты речи, сообщил о запуске открытого тестирования.
Бета-версия позволяет создать цифровую копию голоса на базе одной минуты речи и генерировать с помошью нее любые предложения, говорится в сообщении.
В действительности на подготовку цифрового слепка может уйти больше времени – после регистрации сервис просит последовательно записать и подтвердить запись 30 предложений на английском языке.
В компании уверяют, что цифровой слепок голоса сможет использовать только пользователь, который его создал – другим пользователям придется получить согласие автора. Копии голосов Барака Обамы и Дональда Трампа – исключение, добавили в Lyrebird.
Образец на базе речи Барака Обамы
Технология находится на ранней стадии разработки, и сгенерированная речь может звучать «несовершенно», признают в компании. Для создания более точной копии голоса требуется больше аудиоматериала.
В ближайшие месяцы компания планирует обновить сервис, чтобы совершенствовать создаваемые пользователями голоса. Также Lyrebird объявила, что собирается выбрать 10 разработчиков, с которыми протестирует собственное API. Компанию интересуют разработчики видеоигр, создатели аудиокниг, цифровых помощников и люди из киноиндустрии.
Отметим, что алгоритмы для имитации речи создавались и ранее, однако нейросетям, как правило, требуется довольно большое количество материала, чтобы научиться ее воспроизводить. Нейросетевой алгоритм Lyrebird, созданный в Монреальском университете – первый сервис, который заявил о сокращении необходимого для этих целей аудиоматериала до одной минуты.
Самые актуальные материалы — в Telegram-канале Rusbase
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
ВОЗМОЖНОСТИ
08 декабря 2024
09 декабря 2024
10 декабря 2024