«Сбер» представил третью модель нейросети Kandinsky
Она за несколько секунд создает высококачественные изображения по текстовому описанию
«Сбер» представил третье обновление модели для генерации изображений по текстовому описанию — Kandinsky 2.1.
Новая генеративная модель может за несколько секунд создавать высококачественные изображения по их текстовому описанию на естественном языке, сообщил RB.RU представитель «Сбера».
Она также может смешивать несколько рисунков, изменять их по текстовому описанию, генерировать изображения, похожие на заданное, дорисовывать недостающие части картинки и формировать изображения в режиме бесконечного полотна (inpainting/outpainting).
Модель распознает запросы на 101 языке (включая русский и английский) и умеет рисовать в различных стилях.
Kandinsky 2.1 унаследовала веса предыдущей версии, которая была обучена на 1 млрд пар «текст — изображение», и прошла дополнительное обучение на 170 млн пар «текст — изображение» высокого разрешения. Также она учла отдельно собранный датасет из 2 млн пар картинкок с описаниями в традиционно сложных для нейросетей областях — тексты и лица людей.
Изображения Kandinsky 2.0 и Kandinsky 2.1
Новая версия Kandinsky 2.1 содержит 3,3 млрд параметров вместо 2 млрд в Kandinsky 2.0 и использует не только закодированное текстовое описание, но и специальное представление изображения моделью CLIP. В таком виде нейросеть формирует представление картинки на основе текстовой информации и подает его на вход основной генеративной модели.
- «Сбер» впервые представил модель для генерации изображений по текстовому описанию Kandinsky в июне 2022 года — она представляла собой улучшенную версию уже созданной нейросети ruDALL-E.
- В ноябре того же года «Сбер» представил усовершенствованную мультиязычную модель Kandinsky 2.0, которая работала с 2 млрд параметров и позволяла создавать картинки в 20 разных стилях, например, ренессансе, классицизме, хохломе.
Фото на обложке: Potashev Aleksandr /
-
Технологии Александр Пьянов, «Яндекс Драйв»: «Мы готовы стать агрегатором для всего рынка каршеринга» 08 апреля 2026, 12:26
-
Искусственный интеллект Экономика суверенитета: как финансовый сектор, промышленность и ретейл монетизируют новые технологии 28 апреля 2026, 17:00
-
Маркетинг Как брендам достучаться до зумеров: почему старые инструменты больше не работают и что делать 12 апреля 2026, 22:11
-
Бизнес Отказ от завода и ставка на интеллект: как Катерина Карпова реанимировала PURE LOVE 02 марта 2026, 11:45
-
Бизнес Анна Симакова: «В кризис выживают крупные структуры» 20 февраля 2026, 10:06
-
Бизнес «Точно розовый?»: как Eburet из табурета-трансформера вырос в B2B-бренд, который заходит на рынок в 50 млрд ₽ 11 февраля 2026, 19:48
-
Бизнес Таможенные пошлины в 2026 году: виды, расчёт, оплата и оптимизация 27 апреля 2026, 20:00
-
Бизнес Школы для писателей: сколько стоит мечта написать книгу 27 апреля 2026, 11:01
-
Технологии «Возможность конкурировать с криптобиржами — вызов»: в России появится законопроект по регуляции рынка криптовалюты 28 апреля 2026, 19:12
-
Искусственный интеллект Яндекс опубликовал финансовые итоги за I квартал 2026 года: выручка выросла на 22% — до 372,7 млрд ₽ 28 апреля 2026, 11:10
-
Банки В начале 2026 года кредитные договоры с уступками приблизились к полумиллиону — ипотека и автокредиты в приоритете 28 апреля 2026, 20:00
-
Бизнес Flowwow открывает первый офлайн-магазин в центре Москвы: помимо товаров в нём будут кафе и лаундж-зоны 28 апреля 2026, 19:35
-
Реклама В Яндексе доля рекламных бюджетов под управлением ИИ достигла 85% — нейросети генерируют почти каждый третий баннер 28 апреля 2026, 18:21
-
Тренды «Массового замещения людей машинами» не будет: главным барьером для бизнеса станет не ИИ, а дефицит кадров 28 апреля 2026, 16:01
-
Банки В Москве проходит Альфа-Саммит — топ-менеджеры обсуждают ключевые вызовы бизнеса и экономики 28 апреля 2026, 10:00
-
Бизнес Тим Кук покидает пост CEO Apple — его преемником станет главный инженер компании Джон Тернус 21 апреля 2026, 00:07
