OpenAI представила новое поколение ИИ-моделей для озвучки текста
OpenAI представила обновленные голосовые модели на базе искусственного интеллекта GPT-4o, которые преобразуют текст в аудио, а также транскрибируют аудио и распознают речь в реальном времени. Об этом компания сообщила в своем блоге.
Что нового? Модель gpt-4o-mini-tts предлагает для озвучки 11 голосов с разными интонациями, стилем звучания и тембром голоса. Например, можно выбрать голос пирата, средневекового рыцаря, профессионального диктора, спортивного тренера, ковбоя, спокойного учителя, безумного ученого или Санта-Клауса. У каждого голоса есть свои характеристики, но их также можно поменять. Доступно более 100 языков, в том числе русский.
Также компания улучшила технологию распознавания речи. Новые модели gpt-4o-transcribe и gpt-4o-mini-transcribe лучше расшифровывают медиафайлы и допускают меньше ошибок, даже если на записи есть посторонние шумы или спикер говорит быстро.
Как воспользоваться? Разработчики могут получить доступ к моделям через API. Протестировать озвучку текста можно на сайте openai.fm. В бесплатной версии можно ввести до 1 000 символов.
- TechCrunch отметил, что новые модели OpenAI заменят ее предыдущую разработку Whisper, которую компания выпустила в 2022 году.
- В марте OpenAI открыла свободный доступ для зарегистрированных пользователей к продвинутому голосовому режиму Advanced Voice Mode на базе модели GPT-4o mini.
Фото на обложке: Levart_Photographer / Unsplash
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Популярное
Материалы по теме
-
Пройти курс «Искусство переговоров»
- 1 Стартап Ильи Суцкевера привлек $2 млрд на создание «безопасного сверхразума» Компания получила оценку в $32 млрд 13 апреля 14:26
- 2 OpenAI подала встречный иск против Илона Маска, обвинив его в преследовании Компания попросила суд привлечь предпринимателя к ответственности 10 апреля 14:41
- 3 Нейросеть от «Авито» обошла аналоги от Google и OpenAI в независимом бенчмарке A-Vibe уже используется продавцами сервиса для общения с покупателями 07 апреля 14:27
- 4 Популярность ChatGPT побила рекорды благодаря фильтру в стиле Хаяо Миядзаки Среднее количество еженедельных активных пользователей превысило 150 млн 01 апреля 19:19