«Сбер» создал нейросеть ruDALL-E, она генерирует картинки по описанию на русском языке
«Сбер» сообщил, что создал первую в мире нейронную сеть, которая может генерировать изображения на основе текстового описания на русском языке. Она называется ruDALL-E.
Использовать нейросеть предлагается для создания дизайна интерьера, стоковых изображений или векторных иллюстраций, материалов для рекламы, копирайтинга, архитектурного и промышленного дизайна, говорится в сообщении «Сбера».
Попробовать ruDALL-E уже можно на ее сайте.
Изображение на основе нейросети
Нейросеть одновременно обучается на картинках и текстах и позволяет создавать неограниченное число новых изображений по заданному описанию. Модель существует в двух вариантах:
- ruDALL-E XL — содержит 1,3 млрд параметров;
- ruDALL-E 12B — 12 млрд параметров.
Модель ruDALL-E XL доступна бесплатно, ее можно загрузить с сервиса Github. Обе модели в ближайшее время будут доступны на платформе ML Space в хабе предобученных моделей и датасетов DataHub от SberCloud.
Как ruDALL-E создает изображения:
Создание изображений при помощи технологии происходит в три этапа.
- Первая нейросеть принимает текст на вход и генерирует заданное число картинок.
- Вторая выбирает наиболее удачные из них и те, которые больше всего соответствуют описанию.
- Третья увеличивает картинки в размере без потери качества. Таким образом можно получить неограниченное количество новых изображений, подходящих под указанные характеристики.
Архитектура модели DALL-E для английского языка была впервые представлена OpenAI в 2021 году, однако она так и не была полностью выложена в открытый доступ. На основе публикации OpenAI команды SberDevices и Sber AI при помощи SberCloud воспроизвели код и начали обучать нейросеть на платформе ML Space на базе суперкомпьютера Кристофари. Таким образом получился аналогичный результат для русского языка.
Изображение на основе нейросети
Обучение заняло 23 тыс. GPU-часов на массиве данных из 120 млн пар текст-изображение. Проект по обучению ruDALL-E, как сообщается, стал самым крупным нейросетевым вычислительным проектом в России и СНГ.
Подписывайтесь на наш TG-канал, чтобы быть в курсе всех новостей и событий!
Фото на обложке: Unsplash
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Популярное
Как получить больничный, если вы не больны
Материалы по теме
-
Пройти курс «Просто о сложном: первые шаги в бизнесe»
- 1 OpenAI разрешила редактировать сгенерированные картинки с помощью DALL-E Чат-бот также будет выдавать подсказки над полем ввода 05 апреля 10:42
- 2 Временным гендиректором OpenAI после смещения Сэма Альтмана станет Мира Мурати Эксперты ждут неопределенности на рынке AI и перетекания персонала из компании в компанию 18 ноября 14:51
- 3 Как работает Copilot — ассистент с генеративным ИИ на Windows 11 Пишет код и тексты, запускает программы и не только 07 ноября 16:02
- 4 OpenAI представили новое поколение нейросети DALL-E 3 с глубокой интеграцией ChatGPT Полноценный запуск в октябре 21 сентября 14:11