Top.Mail.Ru
Новости / Россия

«Сбер» представил усовершенствованную модель для генерации изображений по тексту

Kandinsky 2.0 мультиязычна и работает с 2 млрд параметров

Кирилл Билык
Текст:
23 ноября 2022, 22:31
Продолжение сюжета от 04 False 2023 «Сбер» представил третью модель нейросети Kandinsky

«Сбер» представил усовершенствованную мультиязычную модель для генерации изображений по текстовому описанию. Kandinsky 2.0 работает с 2 млрд параметров и позволяет создавать картинки в 20 разных стилях, например, ренессансе, классицизме, хохломе.

О запуске Kandinsky 2.0 рассказали в пресс-службе Сбербанка. Опробовать работу модели можно по ссылке, также по команде «Запусти художника» на «умных» устройствах «Сбера» и в приложении «Салют».

В создании модели разработчики использовали диффузионный подход, поскольку он дает лучшие результаты почти во всех задачах генерации контента по сравнению с трансформерами, рассказали в «Сбере».

Модель мультиязычна и может обрабатывать запросы на 101 языке, в том числе на редких, например, монгольском. Алгоритм поймет задачу, даже если в одном запросе будут слова на разных языках.

Также Kandinsky 2.0 различает одинаковые по смыслу лингвистические конструкции в зависимости от языка и культуры.

«Например, если сформулировать запрос “национальное блюдо” на русском языке, нейросеть чаще всего рисует щи, а на японском это будет мисо суп и суши», – пояснили в пресс-службе.

В июне Сбербанк представил модель для генерации изображений по текстовому описанию Kandinsky.

Фото: Сбербанк

Подписывайтесь на наш Telegram-канал
Материалы по теме