OpenAI представила новое поколение ИИ-моделей для озвучки текста
Они поддерживают русский язык
OpenAI представила обновленные голосовые модели на базе искусственного интеллекта GPT-4o, которые преобразуют текст в аудио, а также транскрибируют аудио и распознают речь в реальном времени. Об этом компания сообщила в своем блоге.
Что нового? Модель gpt-4o-mini-tts предлагает для озвучки 11 голосов с разными интонациями, стилем звучания и тембром голоса. Например, можно выбрать голос пирата, средневекового рыцаря, профессионального диктора, спортивного тренера, ковбоя, спокойного учителя, безумного ученого или Санта-Клауса. У каждого голоса есть свои характеристики, но их также можно поменять. Доступно более 100 языков, в том числе русский.
Также компания улучшила технологию распознавания речи. Новые модели gpt-4o-transcribe и gpt-4o-mini-transcribe лучше расшифровывают медиафайлы и допускают меньше ошибок, даже если на записи есть посторонние шумы или спикер говорит быстро.
Как воспользоваться? Разработчики могут получить доступ к моделям через API. Протестировать озвучку текста можно на сайте openai.fm. В бесплатной версии можно ввести до 1 000 символов.
- TechCrunch отметил, что новые модели OpenAI заменят ее предыдущую разработку Whisper, которую компания выпустила в 2022 году.
- В марте OpenAI открыла свободный доступ для зарегистрированных пользователей к продвинутому голосовому режиму Advanced Voice Mode на базе модели GPT-4o mini.
Фото на обложке: Levart_Photographer / Unsplash
-
Технологии Александр Пьянов, «Яндекс Драйв»: «Мы готовы стать агрегатором для всего рынка каршеринга» 08 апреля 2026, 12:26
-
Тренды Туры на 1 и 9 Мая 2026 года: куда поехать, какие есть форматы и сколько стоит 18 апреля 2026, 12:00
-
Ритейл Когда ручная отчётность мешает компании расти: как ускорить аналитику в фешен-ретейле 16 апреля 2026, 18:29
-
Банки Как усилить рост бизнеса и получать пассивный доход: обзор партнёрской программы Альфа-Банка 16 апреля 2026, 14:00
-
Маркетинг Как брендам достучаться до зумеров: почему старые инструменты больше не работают и что делать 12 апреля 2026, 22:11
-
Бизнес Российский медтех: замедление телемедицины, рост ИИ и рывок устройств 18 февраля 2026, 16:47
-
Тренды Будущее под камерами: шесть сценариев, как видеонаблюдение перепишет реальность к 2036 году 19 января 2026, 10:57
-
Кибербезопасность Как пополнить Apple ID в России после 1 апреля 2026 года 03 апреля 2026, 19:34
-
Искусственный интеллект Битрикс24 запускает ИИ-платформу для создания приложений: она сама интегрирует разработку в сервисы компаний 17 апреля 2026, 18:14
-
Искусственный интеллект В России создали ИИ для обнаружения вирусов: нейросеть находит вредоносный код на 20% точнее других моделей 17 апреля 2026, 17:00
-
Маркетплейсы ФАС выдала предупреждения Wildberries и Ozon — регулятор указал на навязывание невыгодных условий продавцам 17 апреля 2026, 19:33
-
Карьера Из Apple уходит вице-президент по продуктовому маркетингу — он проработал в компании 31 год и стоял за релизом iPod 17 апреля 2026, 18:45
-
Искусственный интеллект Инвесторы оценили Anthropic в $800 млрд перед новым раундом финансирования — создатель ИИ Claude готовится к IPO 16 апреля 2026, 20:00
-
Бизнес Uber инвестирует $10 млрд в развитие роботакси — компания будет прямым конкурентом Tesla Илона Маска 16 апреля 2026, 14:40
-
Россия В работе «Ростелекома» произошёл масштабный сбой из-за DDoS-атаки — пользователи жалуются на проблемы с интернетом 06 апреля 2026, 23:59