Top.Mail.Ru
Списки и рейтинги

Самые интересные нейросети: топ-14 сервисов для раскрашивания изображений, генерации текста и не только

Списки и рейтинги
Полина Соломенцева
Полина Соломенцева

Редактор отдела интервью и лонгридов

Полина Соломенцева

Нейросети — далеко не новое явление, но в 2022 году эта сфера привлекла особое внимание как СМИ, так и инвесторов. Только за прошлый год в приложения, которые генерируют контент с помощью ИИ, было вложено не меньше $1,37 млрд — это больше чем за все предыдущие пять лет вместе взятые.

На сегодняшний день самые яркие и интересные нейросети открывают абсолютно новые горизонты для творчества и развлечения. Некоторые — генерируют изображения, с помощью других эти изображения можно озвучивать или анимировать.

В этой статье редакция RB собрала подборку нейросетей, с которыми будет интересно поэкспериментировать и оценить масштаб «наступившего будущего».

Самые интересные нейросети: топ-14 сервисов для раскрашивания изображений, генерации текста и не только

 Содержание:


DALL-E 2


 

Открывает наш топ интересных нейросетей нашумевшая DALL-E 2. Эта программа была анонсирована в апреле 2022 года, разработчиком выступила исследовательская лаборатория искусственного интеллекта OpenAI. 

Что умеет: 

  • Генерировать изображения по текстовому описанию на английском языке;
  • «Дорисовать» картину, расширив изображение за его исходные пределы;
  •  Вносить изменения, добавляя объекты;
  • Создавать несколько вариантов похожих изображений на основе оригинала.

Как пользоваться: чтобы получить доступ к DALL-E 2, нужно пройти регистрацию через электронную почту, а затем подтвердить номер телефона. 

 

Возможности DALLE-2

Возможности DALLE-2

 

Стоит отметить, что нейросеть не работает на территории России. То есть для работы из России потребуется VPN (список качественных VPN-сервисов можно посмотреть здесь), а также купить номер телефона страны для подтверждения (например, здесь). 

В первый месяц доступно 50 кредитов, одна операция (например, генерация изображения по запросу) стоит один кредит. Каждый последующий месяц пользователю доступны 15 кредитов.

Если нет желания включать VPN и настраивать иностранный номер, можно протестировать российскую DALL-E от от SberDevices и Sber AI. Российская программа не требует регистрации, бесплатна и генерирует изображения по запросу на русском и других языках.

 

Генерация Kandinsky по запросу «Собака в самолете пьет шампанское»

Генерация Kandinsky по запросу «Собака в самолете пьет шампанское»

 


Stable Diffusion


 

Нейросеть Stable Diffusion достаточно популярна за счет качества и реалистичности сгенерированных изображений и точно входит в список бесплатных нейросетей, которые стоит попробовать.

Stable Diffusion — это ПО с открытым исходным кодом, его релиз состоялся в 2022 году. В разработке приняли участие группа компаний CompVis, Runway, EleutherAI и LAION.

Что умеет: генерировать изображения по текстовому описанию на английском языке.

Как пользоваться: сервис представляет собой классический веб-сайт с кратким описанием функций и полем для описания изображения. Достаточно ввести нужный текст или воспользоваться предложенными вариантами и нейросеть меньше чем за минуту сгенерирует четыре варианта изображения.

 

 Генерация Stable Diffusion по запросу «Собака сидит в самолете и пьет шампанское»

Генерация Stable Diffusion по запросу «Собака сидит в самолете и пьет шампанское»

 

Stable Diffusion не требует регистрации и полностью бесплатна. Обратите внимание, что из-за высокой популярности сервис может выдавать ошибку при генерации изображения — возможно попытку придется повторить несколько десятков раз.

 


Midjourney


 

Midjourney входит в тройку самых популярных нейросетей для генерации изображений. Автор программного обеспечения — научный сотрудник NASA и основатель Leap Motion Дэвид Хольц, проект стал доступен широкому кругу пользователей в июле 2022 года.

Что умеет: 

  • Генерировать изображения по текстовому описанию на английском языке;
  • Объединять несколько изображений в одно;
  • Создавать аватары в разных стилях.

Как пользоваться: сейчас нейросеть доступна в виде чат-бота в Discord, поэтому, чтобы начать ей пользоваться, потребуется зайти в свой аккаунт или завести новый. 

 

Генерация MidJourney по запросу "Собака сидит в самолете и пьет шампанское"

Генерация MidJourney по запросу «Собака сидит в самолете и пьет шампанское»

 

После входа в Discord нужно нажать на кнопку «Присоединиться к бета-версии» на сайте нейросети — сайт автоматически перенаправит на нужный канал. Обратите внимание, что бот по умолчанию публичный и другие пользователи также будут видеть ваши изображения (при желании бота можно добавить на личный сервис).

Картинки генерируются в специальных комнатах Newcomer rooms — нужно выбрать любую и перейти в чат.

Следующие шаги:

  • В поле ввода указать /setting, нажать Enter — базовые настройки уже будут применены по умолчанию;
  • В поле ввода указать /imagine, нажать Enter — написать любое слово на английском языке — отправить в чат;
  • Принять настройки.

После этих шагов пользователь может начать генерировать собственные изображения. Каждому новому юзеру выдается 25 бесплатных кредитов — один кредит на один запрос.

У бота большое количество команд и программ, полное руководство стоит изучить на сайте нейросети в специальном разделе

 


Gnod


 

Gnod — проект немецкого специалиста по искусственному интеллекту Марека Гибни. Сам создатель описал его как самообучающуюся систему рекомендаций, которая «общается с каждым, кто заходит на сайт, пытаясь понять его картину мира». Gnod точно входит в список нейросетей, которые отлично подойдут для досуга.

Сервис специализируется на четырех основных направлениях — фильмах, изобразительном искусстве, литературе и музыке, и на основе уже знакомых и любимых подбирает похожие, новые для пользователя лица и произведения.

Что умеет: 

  • Gnod Music рекомендует музыкальных исполнителей;
  • Gnod Art рекомендует художников;
  • Gnod Literature рекомендует авторов;
  • Gnod Movies рекомендует фильмы;
  • Gnod Search помогает сравнивать поисковые системы.

Как пользоваться: интерфейс сервиса полностью на английском языке. Для начала пользователю нужно выбрать интересующую его сферу — допустим, фильмы. После этого потребуется ввести три любимых фильма, на их основе нейросеть предложит кинокартину. Если ответ Gnod не устроил пользователя, можно нажать «мне не нравится» и она выдаст новую рекомендацию.

Обратите внимание, что могут возникнуть проблемы с десктопной версией сайта, рекомендуем пользоваться мобильной версией.

 


Imaginary soundscape


 

Imaginary soundscape — нейросеть от команды ученых Токийского университета, разработанная в 2018 году. Проект можно описать как звуковую инсталляцию, где зрители могут передвигаться по Google Street View и погружаться в воображаемые звуковые ландшафты, созданные с помощью моделей глубокого обучения.

Что умеет:

  • Озвучивать случайное место на земле на Google Map;
  • Озвучивать изображения.

Как пользоваться: чтобы озвучить изображение, достаточно загрузить его в соответствующее окно на сайте — в базе нейросети более 52 тысяч звуков.

 

 

При открытии Google Street View пользователь попадает на случайную точку на карте — редактор RB в первый раз очутилась на улочке Камбоджи, а во второй раз — на службе в кафедральном соборе. После этого можно остаться на локации и исследовать ее, переключиться на случайную новую или вбить в поисковую строку нужное место.

 


Autodraw


 

Инструмент для рисования Autodraw был разработан Дэном Мотценбекером и Кайлом Филлипсом в Google Creative Lab. Как заявлено на сайте самого проекта, «он сочетает машинное обучение с рисунками талантливых художников, чтобы помочь каждому создавать что-то креативное».

Что умеет: дорисовывает и преображает изначальный рисунок пользователя.

Как пользоваться: интерфейс сервиса напоминает упрощенный Paint. Из кнопок есть кисть, автокисть, текст, заполнение, фигуры и выбор цвета. Пользователь выбирает автокисть и начинает рисовать фигуру — программа автоматически пытается «угадать», что имеет в виду юзер, и предлагает похожие готовые фигурки. 

 

Рисунок на Autodraw

Рисунок на Autodraw

 

Готовые фигуры можно двигать, перекрашивать, закрашивать, менять в размере и создавать из них цельные изображения. Пожалуй, главный минус этой программы — в ней не предусмотрен ластик.

 


ThisPersonDoesNotExist


 

Самые интересные нейросети иногда бывают еще и одними из самых пугающих. Сайт разработчика Uber Филиппа Ванга ThisPersonDoesNotExist точно можно отнести к последним.

Что умеет: раз в несколько секунд генерирует человеческое лицо, картину, лошадь, кошку или химическую решетку.

Как пользоваться: на сайте нет кнопок, разделов и тому подобного — по умолчанию, когда пользователь открывает сервис, он видит только сгенерированное человеческое лицо. Лицо человека, которого в реальной жизни не существует. Чтобы сгенерировать новое — нужно просто обновить страницу.

 

Коллаж из сгенерированных лиц нейросетью ThisPersonDoesnotExist

Коллаж из сгенерированных лиц нейросетью ThisPersonDoesnotExist

 

В нижнем углу при посещении сайта появится всплывающее окно — в нем можно будет перейти на генератор картин, кошек, лошадей, химических решеток или изучить исходный код на GitHub.

 


Ostagram


 

Ostagram — достаточно популярный сервис для обработки изображений. Программа работает на основе сверточных нейронных сетей и алгоритма художественного стиля Леона Гатиса, Александра Эккера и Матиаса Бетге.

Что умеет: объединяет стили двух разных изображений и генерирует на их основе одно новое.

Как пользоваться: для обработки своих изображений потребуется пройти регистрацию. Далее в разделе «Изображения» нужно загрузить картинку для обработки (за раз можно обработать до 10 штук), а затем выбрать один из предложенных фильтров или добавить свой вариант. Дополнительно можно регулировать масштаб и вес стиля — от этого зависит глубина наложения фильтра.

 

Обработка фото в Ostagram

Обработка фото в Ostagram

 

Бесплатная обработка фотографии занимает от одной до нескольких минут. Есть платная версия, которая позволяет ускорить процесс и получить качество в HD.

Посмотреть работы других пользователей можно в ленте сервиса.

 


GauGAN


 

Нейросеть GauGAN — проект американской технологической компании NVIDIA. Первую версию компания представила еще в 2019 году, вторую презентовала в 2021. Чтобы выдавать качественным результат, нейросеть была натренирована на 10 миллионах фотографий видов природы.

Что умеет:

  • Генерирует изображения по текстовому запросу;
  • Генерирует изображения на основе эскиза.

Как пользоваться: если пользователь хочет получить сгенерированное изображение по текстовому запросу, нужно выполнить следующие действия:

  • Принять условия и положения внизу страницы (без этого будет невозможно выполнять какие-либо действия);
  • В Input visualization выбрать все варианты;
  • В Input utilization выбрать только «текст»;
  • В строке ввода текста на английском языке (весь интерфейс сервиса англоязычный) указать нужное описание, допустим, rainy forest;
  • Нажать на стрелку render output;
  • Нейросеть выдаст сгенерированное изображение, оно будет полностью меняться, если использовать разные стили.

Понятный и подробный гайд можно посмотреть здесь.

 

Генерация изображения по эскизу

Генерация изображения по эскизу

 

Если пользователь хочет получить изображение на основе скетча, нужно выполнить все те же шаги, в input utilization указать «скетч» и нарисовать набросок в левом окне.

 


«Балабоба»


 

Генератор фраз и предложений «Балабоба» — сервис на основе языковой модели YaLM, разработанной «Яндексом». Другие модели семейства компания использует в «Яндекс.Поиске», умной колонке «Алисе» и множестве других проектов.

Что умеет: «дописывает» начатое предложение в разных стилях: инструкциях, рецептах, предсказаниях и так далее.

 

Генерация текста от «Балабоба»

Генерация текста от «Балабоба»

 

Как пользоваться: выбрать стиль, допустим, народные мудрости. Начать вводить предложение, нажать «Набалабобить». Обратите внимание, что на некоторые темы, такие как политика, экономика, религия и так далее, нельзя сгенерировать продолжение.

 


Colorize


 

Colorize — это российский сервис на основе искусственного интеллекта, который позволяет раскрашивать черно-белые фотографии и видео. По данным сайта, с помощью сервиса раскрасили уже более миллиона фотографий.

Что умеет:

  • Делает черно-белые фото и видео цветными;
  • Реставрирует фотографии.

Как пользоваться: чтобы раскрасить черно-белую фотографию, нужно загрузить файл с ней в соответствующее окно. Реставрировать фотографии можно только платно — стоимость пакета начинается от 600 рублей.

 

 Окрашенное семейное фото с помощью Colorize

Окрашенное семейное фото с помощью Colorize

 


Deep Nostalgia


 

Deep Nostalgia — функция генеалогического онлайн-сервиса MyHeritage, которую компания запустила в начале 2021 года. Функция произвела настоящий фурор среди пользователей — за время ее существования было анимировано более 106 миллионов снимков.

Что умеет: улучшает качество фотографий и оживляет лица на снимках.

Как пользоваться: для начала необходимо пройти бесплатную регистрацию на сервисе. После этого нужно загрузить фотографию (цветная или черно-белая — неважно), на которых изображены люди. Анимация одного лица занимает от 10 до 20 секунд.

 

 

После обработки пользователь получит видеоролик, на котором лицо с фотографии будет улыбаться, моргать и наклонять голову. 

Читайте также: Не только Deep Nostalgia: 5 приложений, оживляющих фото

 


Sketch Metademolab


 

Список интересных нейросетей пополняет Sketch Metademolab — сервис, который позволяет оживлять детские рисунки. Проект разработан Meta AI* (принадлежит Meta, признанной экстремистской организацией на территории РФ) и находится в бесплатном онлайн-доступе для всех желающих.

Что умеет делать: оживляет скетчи и детские рисунки, анимируя движения изображенных существ.

Как пользоваться: для начала, если пользователь находится на территории России, нужно включить VPN. Потом анимирование происходит в четыре этапа:

  • Загрузка нужного рисунка;
  • Выделение конкретного персонажа на картинке;
  • Отделение персонажа от фона;
  • Выделение точек анимирования.  

 

 

После этого нейросеть предложит варианты движений персонажа — танец, бег, прыжки и так далее.

 


Riffusion


 

Riffusion — музыкальная нейросеть, созданная Сетом Форсгреном и Айком Мартиросом. Для своего проекта Riffusion Форсгрен и Мартирос произвели тонкую настройку Stable Diffusion на спектрограммах — визуальных представлениях звука, показывающих амплитуду различных частот во времени.

Это довольно точное систематическое представление звука, которое можно снова преобразовать в аудио, выполнив тот же процесс в обратном порядке.

Что умеет: генерирует мелодии по текстовым подсказкам.

Как пользоваться: сервис максимально прост в использовании — в строке с текстом нужно описать мелодию, которую хочет услышать пользователь. После того, как она будет сгенерирована, — нажать на play и прослушать.

 

 

Интересно, что необязательно описывать музыкальные стили или инструменты. Riffusion сгенерирует мелодию, даже если написать название города или слово «собака».

 


Guess the Line


 

Проект-игра от художников-резидентов Google Arts & Culture Lab Эмиля Вальнера и Ромена Казье Guess the Line предлагает пользователю проверить свои навыки рисования, пока робот с ИИ будет угадывать, что изображено.

Что умеет: угадывает, что изображено на рисунке пользователя.

Как пользоваться: пользователю в начале игры выдаются карточки, где описано то, что ему нужно нарисовать, и 60 секунд времени (за каждый отгаданный робот рисунок начисляется дополнительное время).

 

 Интерфейс игры Guess the line

Интерфейс игры Guess the line

 

После того, как пользователь закончил рисунок, он должен нажать на кнопку «скан», и робот-ассистент попробует угадать, что изображено. Один отгаданный рисунок — один балл. Если рисунок не получается — можно нажать на кнопку «пропустить» и начать рисовать следующий.


Обложка: генерация Midjourney по запросу russian businessmen in anime style

Подписывайтесь на наш Telegram-канал, чтобы быть в курсе последних новостей и событий!

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 Новый паспорт за минуту в ИИ-сервисе Only Fake: как отличить настоящий документ от поддельного
  2. 2 Перспективы и риски использования нейросетей в бизнесе
  3. 3 Управление состоянием и формирование команд: как еще применяют нейротехнологии в HR
  4. 4 «Почему у нас получился диптех-стартап, а у вас не получится» — опыт компании, которая привлекла 500 млн рублей
  5. 5 Instagram борется с буллингом, а нейроимплант читает мысли парализованного: технологии добра, которые меняют мир
ArtTech — карта разработчиков арт-технологий
Все игроки российского рынка технологий для искусства
Перейти