OpenAI представила новое поколение ИИ-моделей для озвучки текста
Они поддерживают русский язык
OpenAI представила обновленные голосовые модели на базе искусственного интеллекта GPT-4o, которые преобразуют текст в аудио, а также транскрибируют аудио и распознают речь в реальном времени. Об этом компания сообщила в своем блоге.
Что нового? Модель gpt-4o-mini-tts предлагает для озвучки 11 голосов с разными интонациями, стилем звучания и тембром голоса. Например, можно выбрать голос пирата, средневекового рыцаря, профессионального диктора, спортивного тренера, ковбоя, спокойного учителя, безумного ученого или Санта-Клауса. У каждого голоса есть свои характеристики, но их также можно поменять. Доступно более 100 языков, в том числе русский.
Также компания улучшила технологию распознавания речи. Новые модели gpt-4o-transcribe и gpt-4o-mini-transcribe лучше расшифровывают медиафайлы и допускают меньше ошибок, даже если на записи есть посторонние шумы или спикер говорит быстро.
Как воспользоваться? Разработчики могут получить доступ к моделям через API. Протестировать озвучку текста можно на сайте openai.fm. В бесплатной версии можно ввести до 1 000 символов.
- TechCrunch отметил, что новые модели OpenAI заменят ее предыдущую разработку Whisper, которую компания выпустила в 2022 году.
- В марте OpenAI открыла свободный доступ для зарегистрированных пользователей к продвинутому голосовому режиму Advanced Voice Mode на базе модели GPT-4o mini.
Фото на обложке: Levart_Photographer / Unsplash
-
Бизнес Екатерина Лапшина: «У меня всегда был чуть больший аппетит к риску» 07 мая 2026, 16:10
-
Искусственный интеллект Экономика суверенитета: как финансовый сектор, промышленность и ретейл монетизируют новые технологии 28 апреля 2026, 17:00
-
Личное Фёдор Овчинников: «Пять месяцев в тундре — путешествие в другое измерение» 14 мая 2026, 13:18
-
Бизнес Российский медтех: замедление телемедицины, рост ИИ и рывок устройств 18 февраля 2026, 16:47
-
Искусственный интеллект ИИ-сленг в 2026 году: датасет, лосс, RAG и ещё 50 терминов — это уже базовый минимум индустрии 08 февраля 2026, 08:00
-
Искусственный интеллект Нейросети на «русском» — Алиса AI, ГигаЧат и другие: зачем бизнесу свой ИИ в 2026-м 30 января 2026, 20:00
-
Тренды Будущее под камерами: шесть сценариев, как видеонаблюдение перепишет реальность к 2036 году 19 января 2026, 10:57
-
Бизнес Командировки в 2026 году: как экономить на деловых поездках, не жертвуя комфортом сотрудников 13 мая 2026, 10:00
-
Искусственный интеллект «KPI — создать фичи, которые скопирует YouTube»: VK Видео представил ключевые изменения платформы в 2026 году 15 мая 2026, 20:24
-
Искусственный интеллект Яндекс запустил единую подписку на Нейроюриста и справочную систему Гарант — сервис ускорит работу с правовой базой 14 мая 2026, 18:00
-
Искусственный интеллект Как ИИ используют для создания новых продуктов и ингредиентов: в Москве пройдёт Deep Food Tech — 2026 14 мая 2026, 17:31
-
Россия Роскомнадзор предложил соцсетям самостоятельно блокировать дипфейки — ещё до проверки на достоверность 15 мая 2026, 16:40
-
Бизнес OpenAI может подать судебный иск против Apple — внедрение ChatGPT в Siri не принесло ожидаемого роста подписок 15 мая 2026, 14:30
-
Искусственный интеллект Каждый четвёртый запрос к Алисе AI связан с работой — чаще всего нейросеть используют ИТ-специалисты и юристы 15 мая 2026, 13:45
-
Искусственный интеллект Duolingo отказалась от повсеместного использования ИИ — нейросети не сравнятся с лучшими дизайнерами компании 14 мая 2026, 11:00
-
Искусственный интеллект Илон Маск ликвидирует ИИ-стартап xAI — компания станет ИИ-подразделением SpaceX 07 мая 2026, 18:00