Сервис для имитации любого голоса Lyrebird запустил бесплатное тестирование
Канадский стартап Lyrebird, работающий над нейросетевым сервисом для имитации любого голоса на базе одной минуты речи, сообщил о запуске открытого тестирования.
Бета-версия позволяет создать цифровую копию голоса на базе одной минуты речи и генерировать с помошью нее любые предложения, говорится в сообщении.
В действительности на подготовку цифрового слепка может уйти больше времени – после регистрации сервис просит последовательно записать и подтвердить запись 30 предложений на английском языке.
В компании уверяют, что цифровой слепок голоса сможет использовать только пользователь, который его создал – другим пользователям придется получить согласие автора. Копии голосов Барака Обамы и Дональда Трампа – исключение, добавили в Lyrebird.
Образец на базе речи Барака Обамы
Технология находится на ранней стадии разработки, и сгенерированная речь может звучать «несовершенно», признают в компании. Для создания более точной копии голоса требуется больше аудиоматериала.
В ближайшие месяцы компания планирует обновить сервис, чтобы совершенствовать создаваемые пользователями голоса. Также Lyrebird объявила, что собирается выбрать 10 разработчиков, с которыми протестирует собственное API. Компанию интересуют разработчики видеоигр, создатели аудиокниг, цифровых помощников и люди из киноиндустрии.
Отметим, что алгоритмы для имитации речи создавались и ранее, однако нейросетям, как правило, требуется довольно большое количество материала, чтобы научиться ее воспроизводить. Нейросетевой алгоритм Lyrebird, созданный в Монреальском университете – первый сервис, который заявил о сокращении необходимого для этих целей аудиоматериала до одной минуты.
Самые актуальные материалы — в Telegram-канале Rusbase
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Популярное
Материалы по теме
-
Пройти курс «Самое важное o 115-ФЗ»
- 1 Маск пообещал отправить робота-гуманоида на Марс в 2026 году По словам бизнесмена, люди могут ступить на другую планету уже в 2029 году 15 марта 11:39
- 2 ИИ-модель Gemini заменит Google Assistant на большинстве устройств в 2025 году Исключение сделают для старых моделей смартфонов 14 марта 22:00
- 3 Google открыла бесплатный доступ к функции Deep research в ИИ Gemini Раньше пользоваться ей могли только обладатели платной подписки 14 марта 19:20
- 4 Bloomberg: Apple добавит в AirPods синхронный перевод Функция должна появиться в конце 2025 года, заявили источники 14 марта 14:32