«Сбер» представил самую большую на данный момент (так заявили разработчики) модель для генерации изображений по текстовому описанию. Kandinsky создает всевозможные картинки – интерьерные, архитектурные, рекламные – с любым соотношением сторон.
О разработке рассказали в пресс-службе «Сбера». Генеративная модель получила название Kandinsky – это улучшенная версия уже созданной «Сбером» нейросети ruDALL-E.
Kandinsky может генерировать любые изображения с произвольным соотношением сторон, что открывает новые возможности для бизнеса, отметили разработчики.
В «Сбере» доработали базовую генеративную модель, обучив ее дополнительно на 179 млн изображений.
«Отличительным преимуществом модели Kandinsky по сравнению с предыдущими версиями является более высокая степень детализации создаваемых изображений», – подчеркнули в компании.
Воспользоваться Kandinsky можно в приложении «Салют» от «Сбера» и на «умных» устройствах, введя запрос «Включи художника».
В апреле «Сбер» выложил в открытый доступ генеративную модели mGPT, которая может создавать тексты на 61 языке, а несколько дней назад представил новый VoiceTech-сервис SmartSpeech YourVoice – в нем можно заказать озвучку нешаблонного текста с интонацией и паузами.Нашли опечатку? Выделите текст и нажмите Ctrl + Enter