«Сбер» представил третью модель нейросети Kandinsky
Она за несколько секунд создает высококачественные изображения по текстовому описанию
«Сбер» представил третье обновление модели для генерации изображений по текстовому описанию — Kandinsky 2.1.
Новая генеративная модель может за несколько секунд создавать высококачественные изображения по их текстовому описанию на естественном языке, сообщил RB.RU представитель «Сбера».
Она также может смешивать несколько рисунков, изменять их по текстовому описанию, генерировать изображения, похожие на заданное, дорисовывать недостающие части картинки и формировать изображения в режиме бесконечного полотна (inpainting/outpainting).
Модель распознает запросы на 101 языке (включая русский и английский) и умеет рисовать в различных стилях.
Kandinsky 2.1 унаследовала веса предыдущей версии, которая была обучена на 1 млрд пар «текст — изображение», и прошла дополнительное обучение на 170 млн пар «текст — изображение» высокого разрешения. Также она учла отдельно собранный датасет из 2 млн пар картинкок с описаниями в традиционно сложных для нейросетей областях — тексты и лица людей.
Изображения Kandinsky 2.0 и Kandinsky 2.1
Новая версия Kandinsky 2.1 содержит 3,3 млрд параметров вместо 2 млрд в Kandinsky 2.0 и использует не только закодированное текстовое описание, но и специальное представление изображения моделью CLIP. В таком виде нейросеть формирует представление картинки на основе текстовой информации и подает его на вход основной генеративной модели.
- «Сбер» впервые представил модель для генерации изображений по текстовому описанию Kandinsky в июне 2022 года — она представляла собой улучшенную версию уже созданной нейросети ruDALL-E.
- В ноябре того же года «Сбер» представил усовершенствованную мультиязычную модель Kandinsky 2.0, которая работала с 2 млрд параметров и позволяла создавать картинки в 20 разных стилях, например, ренессансе, классицизме, хохломе.
Фото на обложке: Potashev Aleksandr /
-
Россия Запрет рекламы в Telegram: что важно знать маркетологам и бизнесу 23 мая 2026, 09:00
-
Личное Фёдор Овчинников: «Пять месяцев в тундре — путешествие в другое измерение» 14 мая 2026, 13:18
-
Бизнес Екатерина Лапшина: «У меня всегда был чуть больший аппетит к риску» 07 мая 2026, 16:10
-
Искусственный интеллект Экономика суверенитета: как финансовый сектор, промышленность и ретейл монетизируют новые технологии 28 апреля 2026, 17:00
-
Бизнес «Малый бизнес драйвит всё»: как компании из Архангельска растут на терпении, связях и самоиронии 25 мая 2026, 18:03
-
Деньги Налоговый вычет для самозанятых: как получить и кому положен в 2026 году 24 мая 2026, 19:00
-
Бизнес Смена юридического адреса ООО в 2026 году: пошаговая инструкция 24 мая 2026, 14:00
-
Бизнес Как открыть ИП в 2026 году: регистрация бизнеса за один день — без ошибок и отказов налоговой 24 мая 2026, 09:00
-
Технологии В Москве могут построить автономные дата-центры: они будут работать от собственных электростанций 25 мая 2026, 21:30
-
Реклама Ozon запустил партнёрскую программу для авторов: блогеры в MAX и VK смогут зарабатывать на рекомендациях товаров 25 мая 2026, 22:00
-
Бизнес Число самозанятых подростков в России составило 608 тыс. — за год их количество выросло на 70% 25 мая 2026, 21:00
-
Россия Минцифры смягчило закон о поддержке Почты России — правительство пошло на уступки после критики от участников рынка 25 мая 2026, 20:00
-
IT Выручка российского ИТ-рынка впервые за несколько лет снизилась — сектор потерял 60 млрд ₽ за 2025 год 25 мая 2026, 19:30
-
Деньги Только 30% россиян имеют опыт инвестирования: большинство отказываются от вложений из-за страха потерять деньги 25 мая 2026, 19:12
-
Искусственный интеллект IT-рынок без «единорогов», дефицит ЦОДов и постоянные разговоры об ИИ: чем запомнился ЦИПР в 2026 году 22 мая 2026, 23:30
-
Деньги Объём крипторынка России превысил 32 трлн ₽ в 2025 году — большая часть операций проходит через легальные площадки 22 мая 2026, 20:30
