Канадский сервис для создания цифровой копии голоса на основе одной минуты речи Lyrebird запустил бесплатную бета-версию API, которая позволит сторонним разработчикам синтезировать и использовать голоса своих пользователей. Об этом говорится в рассылке проекта.
В Lyrebird предполагают, что с помощью API разработчики смогут создавать аватары, говорящие голосами пользователей, индивидуально озвучивать приложения и другое.
Инструкция к API размещена здесь. В каждом случае при создании копии голоса пользователи должны будут зарегистрироваться в Lyrebird и дать согласие на использование своих данных, прежде чем разработчики смогут синтезировать их голоса, отмечается в сообщении.
Нейросетевой алгоритм Lyrebird был разработан в Монреальском университете. В апреле 2017 года сервис продемонстрировал работу на копиях голосов Барака Обамы, Дональда Трампа и Хиллари Клинтон, а в сентябре того же года открыл публичное тестирование.
Хотя изначально Lyrebird позиционировал себя как первый сервис, способный синтезировать голос на базе всего одной минуты речи, для создания более достоверной копии ему требуется больше аудиоматериала.
Со времени запуска у Lyrebird появились конкуренты – к примеру, ирландский стартап Voysis недавно объявил об успешной разработке синтезатора речи, который не требует подключения к интернету и может работать в качестве приложения на смартфоне.
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
- Пройти курс «Регистрация бизнеса: самозанятoсть, ИП или ООО»
- 1 Сервис знакомств «Мамба» инвестирует $7 млн в ребрендинг
- 2 Рост доходов «великолепной семерки» IT-гигантов замедлится вдвое в 2025 году
- 3 Bloomberg: назначенный Трампом «криптоцарь» Сакс обладает незначительным опытом в области ИИ и криптовалют
- 4 ИИ-бот Grok Илона Маска стал доступен всем пользователям Х
ВОЗМОЖНОСТИ
10 декабря 2024
10 декабря 2024
11 декабря 2024
14 декабря 2024