Такие программы, как Midjourney и DALL-E, уже научились преобразовывать абзац текста в настоящее произведение искусства. По мере того, как эти инструменты усложняются, подготовка шаблонов для них также превращается в ремесло. И некоторые авторы уже начали выставлять их на продажу.
В материале — о том, как создаются шаблоны и сколько можно на них заработать.
Один из примеров — маркетплейс PromptBase, запущенный летом 2022 года. На нем представлены текстовые описания, с помощью которых можно воссоздать определенный стиль искусства или тему с помощью генеративных алгоритмов.
Покупатель получает строку текста, который можно вставить в Midjourney, DALL-E или иную систему. И, если шаблон составлен качественно, в результате получится изображение дизайна ногтей, аниме в стиле пин-ап или футуристичных суккулентов.
Такие описания включают ключевые слова, описывающие предполагаемую эстетику, важные элементы обстановки и скобки, в которые можно вставить собственные переменные для адаптации контента. Так, на изображении маникюра можно задать положение рук, угол «снимка», стиль и тематику дизайна ногтей.
PromptBase берет комиссию в 20%, а авторы сохраняют право собственности на свои работы, хотя пока статус авторских прав на ИИ-искусство и инструкции остается туманным.
Впрочем, далеко не каждый пользователь генеративных программ готов заплатить за абзац текста $2-5. Как создать хороший коммерческий шаблон для ИИ и сколько денег приносит это занятие? Автор The Verge Ади Робертсон обсудил эти вопросы с дизайнером Джастином Реклингом. Приводим пересказ интервью.
— Как и когда вы занялись разработкой инструкций? Были ли у вас какие-то особые навыки, которые помогли преуспеть в этом деле?
— Я занялся разработкой текстов в апреле 2022 года, когда добрался до инструмента генерации текста GPT-3 от OpenAI. Я быстро понял, что у меня есть к этому склонность, и смог создать несколько отличных инструкций для преобразования текста в изображения.
Среди моих смежных навыков — программирование и контроль качества программного обеспечения. Кроме того, у меня есть эстетический вкус, который помогает создавать визуально привлекательные инструкции.
— Как вы приступаете к созданию текста — как художник, программист, разработчик или что-то еще?
— Я рассматриваю процесс с точки зрения художника, программиста и инженера. Я использую свой опыт программирования, чтобы помочь мне понять, как служба может интерпретировать мое описание, что помогает эффективнее работать с ним и добиться желаемых результатов. Мой опыт в области обеспечения качества ПО — важный фактор, который позволяет рассуждать в духе «что произойдет, если...».

— Сколько инструкций вы обычно продаете в день или неделю? Есть ли у вас представление о том, для чего люди их покупают?
— Обычно я продаю от 3 до 5 текстовых описаний в день, причем каждое в среднем продается 2-3 раза в течение месяца или двух. Сейчас у меня есть запас из 50 инструкций, и новые регулярно добавляются. Кажется, что большинство покупают скорее ради удовольствия, чем для деловых целей.
— Как вы решаете, что собираетесь создавать и продавать? Вы в большей степени исходите из личных интересов или запроса сообщества?
— Это сочетание и личных интересов, и запроса сообщества. Я хочу создавать то, что другие сочтут и полезным, и вдохновляющим. И очень здорово, когда эти две вещи пересекаются. Я также должен следить за тем, что хорошо продается, чтобы я мог понять потребности сообщества и продолжать предоставлять то, что ему нужно.
Я использую список «самые популярные инструкции» на главной странице. Скоро будут доступны метрики по конкретным продавцам.
— Какая из ваших инструкций самая популярная?
— Больше всего продаж у Block Cities. Наилучшее соотношение просмотров и покупок у серии T-Shirt Product Shots.
Шаблон Block cities для DALL-E. Иллюстрация: PromptBase
— С чего начинается создание шаблона?
— Сначала у меня появляется приблизительная идея того, что я хочу сделать, а потом я сужаю задачи до людей, мест и вещей — ключевых персонажей или главных стимулов в изображении. Я использую сервис, чтобы создать несколько набросков шаблонов и понять, как приблизительно будет выглядеть картинка. Гораздо проще взять что-то, что хорошо работает, а затем постепенно улучшать его.
— Насколько вы погружаетесь в тему, прежде чем создать что-то? Например, при подготовке шаблона с маникюром приходится ли изучать специальную терминологию и предпочтительные позы рук, или вы руководствуетесь интуицией?
— Для каждого шаблона приходится проводить немало исследований. Я начинаю с того, что задаю вопросы по теме GPT-3, чтобы лучше понять сюжет, который пытаюсь создать. Например, если я создаю подсказку о том, что кто-то делает маникюр, я могу использовать команду: «Кто-то делает маникюр; объясни, что видишь».
Это позволяет мне получать более конкретные сведения от эксперта, а не полагаться на статьи или другие источники информации, которые могут быть не столь точными.
— Есть ли какие-то особые навыки или приемы, которым вы научились за время работы и которые упрощают работу над шаблоном?
— При создании текстовых подсказок может быть полезно использовать кавычки, чтобы разделять основные идеи. Кроме того, может быть полезно ознакомиться с такими терминами, как «гиперреалистичный», «макросъемка», «октановый рендеринг», «сверхдетализированный», «кинематографическое освещение», «дальний план», «средний план» и так далее.
Читайте по теме:
30+ ресурсов для креативной работы с ИИ
Энтузиаст создает научно-фантастический фильм, целиком сгенерированный нейросетями
Это даст лучшее представление о том, как добавить глубину и детализацию шаблонам, а также поможет контролировать расстояние и фокусировку. Например, в конец шаблона можно добавить фразы «кинематографическое освещение» и «предзакатный час», чтобы создать более утонченное и специфичное изображение.
— Похоже, вы в основном работете с DALL-E. Насколько отличается создание шаблонов для других систем, таких как Midjourney?
— На самом деле зависит от того, что вам нужно и для чего требуется текстовая инструкция. Если нужен более совершенный и профессиональный результат, например, замена стокового изображения, то лучшим выбором, пожалуй, станет DALL-E. Однако, если требуется что-то более творческое и практичное, то подойдет скорее Midjourney.
Этот инструмент позволяет задать вес слов, нужное разрешение и прочие настройки. Но для получения желаемых результатов требуется больше времени и усилий.
— Что дает регулировка веса слов?
— Увеличение веса как бы увеличивает силу «аромата» этого слова, так что есть больше шансов, что он проявится более заметным образом.
Кстати, мне очень нравится Midjourney. Я бы предположил, что большая часть моих шаблонов будет создана для Midjourney, но до недавнего времени PromptBase принимала только инструкции DALL-E, так что именно ими я и занимался в первую очередь.
Отмечу, что существует генератор преобразования текста в изображение под названием Stable Diffusion, который можно запустить локально на компьютере. Однако для этой модели нужна довольно мощная видеокарта, поэтому она не так широко доступна.
Я считаю, что в долгосрочной перспективе локальные модели, свободные от ограничений, в конечном итоге превзойдут крупных игроков на рынке. В последнее время я довольно много экспериментировал с этим.
Для меня очень привлекательна возможность работать с шаблонами и не тратить много денег. Сейчас мне приходится тратить $10-15 на каждый шаблон, чтобы получить желаемые результаты.
— Сравнивая это с предыдущими цифрами, кажется, что вы тратите на каждое приглашение больше, чем зарабатываете на продажах.
— Да, мне нужно продать шаблон 5-10 раз, чтобы выйти на безубыточность. Создание некоторых из них не займет много времени, и по мере того, как я буду лучше находить текст для повторного использования между подсказками, мне понадобится меньше вариантов для достижения конечной цели. Инвестиции в эту технологию имеют смысл в долгосрочной перспективе, поскольку интерес к ее использованию продолжает расти.
Я также изучаю навыки, которые могу применить к другим моделям, так что на данный момент я не считаю это большим недостатком... Конечно, любой может напечатать такой текст, но вряд ли кто-то сможет с первого раза задать инструкцию, чтобы получить ухоженные руки в нужном положении. Ценность шаблонов заключается в том, что они дают последовательный результат.
Шаблон снимка футболки для DALL-E. Иллюстрация: ProptBase
— Что вы думаете о праве собственности на свою работу? Представляете ли вы, насколько ваши шаблоны защищены авторским правом, и насколько это вас волнует?
— Я не слишком задумываюсь об этом — я просто пытаюсь создать что-то, чем я горжусь и что понравится другим. Что касается защиты авторских прав, меня это не очень беспокоит, потому что мне платят за мою работу.
Я думаю, что наше общество должно обеспечить системы социальной защиты, такие как всеобщий базовый доход, чтобы помочь тем, кто работает в творческой сфере и может испытывать финансовые трудности. Это будет становиться все более важным, поскольку автоматизация продолжает влиять на различные профессии.
Читайте по теме:
7 бизнес-идей для заработка в креативной экономике
Эстетика и общение: что должен знать начинающий дизайнер интерьеров
— Вы также сделали несколько текстовых подсказок для GPT-3. Можете ли вы написать текстовый алгоритм с ИИ, который автоматически генерировал бы шаблоны для нейросетей?
У меня есть обученная модель в OpenAI, доступная по адресу typestitch.com. Она обучалась на довольно большом количестве данных из реальных инструкций, поэтому она может взять одно-два ключевых слова и сгенерировать примеры инструкций. Они подойдут для развлечения или подадут несколько концептуальных идей для работы.
Я использую модель каждый день, чтобы стимулировать творчество или случайно придумать что-то безумное, чем можно поделиться с друзьями. Однако я никогда не продавал шаблон в том виде, в котором он был сгенерирован. Потребности аудитории все еще слишком неоднородны. Но при достаточном количестве примеров модель может дать вам много новых и странных идей, с которыми можно поиграть.
Фото на обложке: jiang jie feng /
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
-
Пройти курс «Как управлять командой»
- 1 OpenAI разрешила редактировать сгенерированные картинки с помощью DALL-E
- 2 Временным гендиректором OpenAI после смещения Сэма Альтмана станет Мира Мурати
- 3 Как работает Copilot — ассистент с генеративным ИИ на Windows 11
- 4 OpenAI представили новое поколение нейросети DALL-E 3 с глубокой интеграцией ChatGPT