«Сбер» представил усовершенствованную модель для генерации изображений по тексту
«Сбер» представил усовершенствованную мультиязычную модель для генерации изображений по текстовому описанию. Kandinsky 2.0 работает с 2 млрд параметров и позволяет создавать картинки в 20 разных стилях, например, ренессансе, классицизме, хохломе.
О запуске Kandinsky 2.0 рассказали в пресс-службе Сбербанка. Опробовать работу модели можно по ссылке, также по команде «Запусти художника» на «умных» устройствах «Сбера» и в приложении «Салют».
В создании модели разработчики использовали диффузионный подход, поскольку он дает лучшие результаты почти во всех задачах генерации контента по сравнению с трансформерами, рассказали в «Сбере».
Модель мультиязычна и может обрабатывать запросы на 101 языке, в том числе на редких, например, монгольском. Алгоритм поймет задачу, даже если в одном запросе будут слова на разных языках.
Также Kandinsky 2.0 различает одинаковые по смыслу лингвистические конструкции в зависимости от языка и культуры.
«Например, если сформулировать запрос “национальное блюдо” на русском языке, нейросеть чаще всего рисует щи, а на японском это будет мисо суп и суши», – пояснили в пресс-службе.
В июне Сбербанк представил модель для генерации изображений по текстовому описанию Kandinsky.
Фото: Сбербанк
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
-
Пройти курс «Самое важное o 115-ФЗ»
- 1 «Яндекс» запустил новую линейку генеративных нейросетей YandexART У платных подписчиков будет безлимит на генерацию картинок и видео 20 марта 14:56
- 2 Машинное обучение и большие данные: как они связаны? Прежде чем данные смогут «обучить» алгоритмы машинного обучения, они проходят этапы 19 марта 06:30
- 3 Топ-7 идей Data Science проектов — пет-проекты и примеры анализа данных Полезные проекты на каждый день 03 марта 18:55
- 4 Чем различаются слабый, сильный и супер-ИИ Широко распространен только один из них 27 декабря 20:50