Диффузионная нейросеть «Яндекса» перешла на новую технологию для генерации изображений — латентную диффузию. Компания представила YandexART 1.3., которая лучше понимает текстовые запросы и создает более точные и реалистичные изображения. Об этом рассказали в пресс-службе компании.
Компания увеличила датасет, на котором обучалась модель, более чем в два раза. А технология латентной диффузии требует меньше вычислительных мощностей и при этом позволяет генерировать более совершенную графику, пояснили в «Яндексе».
Как устроена технология латентной диффузии
Технология латентной диффузии создает промежуточное представление изображения в формате латентного кода. Это компактное описание с основными данными об изображении в сжатом формате. После этого нейросеть в один шаг разворачивает код в полноценное изображение высокого разрешения. Как отмечают в компании, данный метод эффективнее многоэтапного уточнения картинки в каскадной диффузии.
Также «Яндекс» увеличил датасет, на котором обучалась нейросеть, в два с половиной раза. В него добавили синтетические тесты. Сам набор данных был увеличен до более чем 850 миллионов пар картинок с текстом.
Для того чтобы YandexART учитывала больше деталей из промта, в новой модели используются не один, а два текстовых энкодера, с помощью которых модель переводит текстовый запрос.
Также теперь с помощью YandexART можно создавать картинки в разных форматах: 16:9, 4:3 или 3:4. Обновление уже действует в «Шедевруме», вскоре оно появится и в других сервисах компании.
Впервые диффузионную нейросеть YandexART компания представила в 2023 году. В «Яндексе» отмечали, что сервис «понимает российский культурный код» и знает важные символы, персонажей и личностей из российской истории.
Фото на обложке: Пресс-служба «Яндекса»
Подписывайтесь на наш Telegram-канал, чтобы быть в курсе последних новостей и событий!
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
- 1 Вечный рейв: обзор наушников Commo One
- 2 Где слушать музыку в России: список музыкальных сервисов
- 3 Как заинтересовать ребёнка программированием: три увлекательных способа
- 4 «Яндекс» продал бизнес в России: причины и предположения, как изменится российский IT-рынок
- 5 Тренды геосервисов 2024: «умная» навигация, ИИ-симуляция маршрута и «соцсети» на картах
ВОЗМОЖНОСТИ
05 мая 2024
10 мая 2024