Нейросеть ruDALL-E, генерирующая изображения на основе текстового описания, теперь может работать с текстами на иностранных языках, сообщила пресс-служба «Сбера». Создать картинку можно также по голосовому запросу в мобильном приложении «Салют» и на устройствах Sber.
По данным «Сбера», за неделю с момента релиза ruDALL-E пользователи по всему миру уже сгенерировали более 3 млн изображений при помощи нейросети, используя для формирования русскоязычных запросов различные системы машинного перевода.
Теперь пользователям стали доступны запросы на английском и других языках. При вводе текста модель самостоятельно определяет язык ввода и генерирует соответствующее изображение. Отправлять запросы можно на 107 языках, говорится на сайте нейросети.
Прототипом для создания ruDALL-E стала нейросеть DALL-E для английского языка, которая была впервые представлена OpenAI в 2021 году. При этом исследователи из американской компании не стали выкладывать модель в открытый доступ, ограничившись общим описанием архитектуры и набором примеров работы модели.
На основе публикации OpenAI команды SberDevices и Sber AI при содействии SberCloud создали аналогичное решение и запустили обучение нейросети на платформе ML Space на базе суперкомпьютера Christofari, получив аналогичный результат для русского языка, а позднее и мультиязычный вариант.
Модель существует в двух вариантах: ruDALL-E XL, содержащая 1,3 млрд параметров, и ruDALL-E XXL с 12 млрд параметров. Возможностями меньшей можно воспользоваться бесплатно, загрузив её с сервиса Github и Hugging Face. Обе модели также можно найти в ML Space в хабе предобученных моделей и датасетов DataHub от SberCloud. Нейросеть был запущена «Сбером» 2 ноября 2021 года.
Предполагается, что большая модель может послужить для создания вариантов дизайна интерьера, стоковых изображений или векторных иллюстраций, материалов для рекламы, копирайтинга, в то время, как уменьшенный вариант в приложении «Салют» и на демо-сайте призван скорее развлечь пользователей и показать им возможности нейросети.
Подписывайтесь на наш TG-канал, чтобы быть в курсе всех новостей и событий!
Фото на обложке: Pedal to the Stock /
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
- Пройти курс «Искусство переговоров»
- 1 OpenAI разрешила редактировать сгенерированные картинки с помощью DALL-E
- 2 Временным гендиректором OpenAI после смещения Сэма Альтмана станет Мира Мурати
- 3 Как работает Copilot — ассистент с генеративным ИИ на Windows 11
- 4 OpenAI представили новое поколение нейросети DALL-E 3 с глубокой интеграцией ChatGPT
ВОЗМОЖНОСТИ
28 января 2025
03 февраля 2025
28 февраля 2025