Top.Mail.Ru
Новости

«Сбер» представил усовершенствованную модель для генерации изображений по тексту

Новости
Кирилл Билык
Кирилл Билык

Редактор отдела «Новости»

Продолжение сюжета от 04 False 2023 «Сбер» представил третью модель нейросети Kandinsky
Кирилл Билык

«Сбер» представил усовершенствованную мультиязычную модель для генерации изображений по текстовому описанию. Kandinsky 2.0 работает с 2 млрд параметров и позволяет создавать картинки в 20 разных стилях, например, ренессансе, классицизме, хохломе.

«Сбер» представил усовершенствованную модель для генерации изображений по тексту
  1. Новости

О запуске Kandinsky 2.0 рассказали в пресс-службе Сбербанка. Опробовать работу модели можно по ссылке, также по команде «Запусти художника» на «умных» устройствах «Сбера» и в приложении «Салют».    

В создании модели разработчики использовали диффузионный подход, поскольку он дает лучшие результаты почти во всех задачах генерации контента по сравнению с трансформерами, рассказали в «Сбере».

Модель мультиязычна и может обрабатывать запросы на 101 языке, в том числе на редких, например, монгольском. Алгоритм поймет задачу, даже если в одном запросе будут слова на разных языках.

Также Kandinsky 2.0 различает одинаковые по смыслу лингвистические конструкции в зависимости от языка и культуры.

«Например, если сформулировать запрос “национальное блюдо” на русском языке, нейросеть чаще всего рисует щи, а на японском это будет мисо суп и суши», – пояснили в пресс-службе.

В июне Сбербанк представил модель для генерации изображений по текстовому описанию Kandinsky.

Фото: Сбербанк

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

FutureFood
Кто производит «альтернативную» еду
Карта