«Яндекс» представил прототип собственной нейросети для генерации картинок по текстовым запросам пользователей, сообщила компания. Протестировать ее работу можно в бета-версии 0.1.4 приложения «Шедеврум», которое доступно на Android и iOS.
«Шедеврум» распознает русский и английский языки и лучше всего реагирует на конкретные запросы.
Нейросеть также учитывает особые пожелания (например, «фотореализм» или «высокая детализация»), может подражать известным живописцам и работать в заданных художественных стилях.
Нейросеть «Шедеврума» создает изображения по методу каскадной диффузии: сначала формирует картинки в соответствии с запросом, после чего поэтапно увеличивает их разрешение и насыщает деталями.
Гусь-зомби
Первую версию генеративной модели обучили на 240 млн примеров картинок с текстовыми описаниями. В настоящее время обучение продолжается на наборе данных из 500 млн примеров, и уже в следующих обновлениях «Яндекс» обещает улучшить качество.
Кот с рюкзаком на спине в заброшенном городе
Чтобы генерировать картинки по собственным запросам, необходимо оставить заявку и дождаться ее подтверждения. Позднее такую возможность получат все зарегистрированные пользователи.
По словам руководителя управления машинного интеллекта и исследований «Яндекса» Алексея Гусакова, к моменту финального релиза нейросеть сможет генерировать баннеры, иллюстрации, создавать изображения для интернет-витрин.
Над созданием нейросети для генерации изображений по текстовому описанию также работает «Сбер». Накануне компания представила третье обновление своей модели Kandinsky, которая была обучена на 1 млрд пар «текст — изображение» и создает изображения за несколько секунд.
Фото на обложке: «Яндекс»
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
-
Пройти курс «Как открыть кофейню»
- 1 Чем различаются слабый, сильный и супер-ИИ
- 2 Обзор технологии и применение машинного обучения с подкреплением
- 3 Apple решила зарегистрировать в России название функции камеры в iPhone
- 4 билайн Big Data & AI разработал решение для отслеживания потенциальных случаев мошенничества со стороны персонала