«Сбер» представил третью модель нейросети Kandinsky
Она за несколько секунд создает высококачественные изображения по текстовому описанию
«Сбер» представил третье обновление модели для генерации изображений по текстовому описанию — Kandinsky 2.1.
Новая генеративная модель может за несколько секунд создавать высококачественные изображения по их текстовому описанию на естественном языке, сообщил RB.RU представитель «Сбера».
Она также может смешивать несколько рисунков, изменять их по текстовому описанию, генерировать изображения, похожие на заданное, дорисовывать недостающие части картинки и формировать изображения в режиме бесконечного полотна (inpainting/outpainting).
Модель распознает запросы на 101 языке (включая русский и английский) и умеет рисовать в различных стилях.
Kandinsky 2.1 унаследовала веса предыдущей версии, которая была обучена на 1 млрд пар «текст — изображение», и прошла дополнительное обучение на 170 млн пар «текст — изображение» высокого разрешения. Также она учла отдельно собранный датасет из 2 млн пар картинкок с описаниями в традиционно сложных для нейросетей областях — тексты и лица людей.
Изображения Kandinsky 2.0 и Kandinsky 2.1
Новая версия Kandinsky 2.1 содержит 3,3 млрд параметров вместо 2 млрд в Kandinsky 2.0 и использует не только закодированное текстовое описание, но и специальное представление изображения моделью CLIP. В таком виде нейросеть формирует представление картинки на основе текстовой информации и подает его на вход основной генеративной модели.
- «Сбер» впервые представил модель для генерации изображений по текстовому описанию Kandinsky в июне 2022 года — она представляла собой улучшенную версию уже созданной нейросети ruDALL-E.
- В ноябре того же года «Сбер» представил усовершенствованную мультиязычную модель Kandinsky 2.0, которая работала с 2 млрд параметров и позволяла создавать картинки в 20 разных стилях, например, ренессансе, классицизме, хохломе.
Фото на обложке: Potashev Aleksandr /
-
Партнёрский материал Как компании из Архангельска растут на терпении, связях и самоиронии 29 мая 2026, 14:33
-
Личное Дарио Амодеи. Как обыграть OpenAI и создать самый дорогой ИИ-стартап в мире 16 июня 2026, 12:05
-
Личное Фёдор Овчинников: «Пять месяцев в тундре — путешествие в другое измерение» 14 мая 2026, 13:18
-
Тренды «Пухосос купить»: как россияне поверили в фейк, а бренды — заработали на меме 11 июня 2026, 19:59
-
Технологии Что сдерживает модернизацию ЖКХ: итоги отраслевой дискуссии на ПМЭФ 09 июня 2026, 12:14
-
Искусственный интеллект Как подключить Яндекс Дропс и использовать все функции Алисы AI: полный обзор первых ИИ-наушников от Яндекса 09 июня 2026, 11:00
-
Тренды Загородный рынок — 2026: тренды, цены и возможности для покупателей и инвесторов 03 июня 2026, 12:16
-
Россия Запрет рекламы в Telegram: что важно знать маркетологам и бизнесу 23 мая 2026, 09:00
-
Россия 2ГИС запустил «Ленту друзей» — теперь пользователи могут увидеть отзывы и рекомендации мест от знакомых 16 июня 2026, 15:00
-
Технологии Яндекс Фабрика выпустила полноразмерные наушники Commo Etude — цена начинается от 8 тыс. ₽ 16 июня 2026, 09:00
-
IT Разработчик облачных сервисов Cloud.ru готовится к первому размещению облигаций — его объём оценивают в 10 млрд ₽ 16 июня 2026, 14:11
-
Россия Самозанятые получили возможность создавать публичные каналы в MAX — до этого функция была доступна юрлицам и ИП 15 июня 2026, 18:10
-
Бизнес Альфа-Банк подвёл итоги первой программы для импортёров: шесть компаний получили гранты по 1 млн ₽ 15 июня 2026, 18:01
-
Реклама Т-Банк будет использовать банковские данные клиентов при показе рекламы — юристы говорят о правовых рисках 10 июня 2026, 14:00
-
Технологии Видеоигры стали второй по величине категорией UGC-контента на RUTUBE —на платформе работает 50 тыс. игровых каналов 08 июня 2026, 13:00
-
Технологии Яндекс Карты добавили 120 тыс. отметок о доступности мест маломобильным людям: данные обновляет ИИ — автоматически 05 июня 2026, 20:42
