Изображения созданные нейросетями Midjourney и DALL-E превратились из абстрактных картинок в осознанные шедевры искусства с высокой детализацией. Для получения достойных результатов необходимо составить грамотное описание — своего рода алгоритм, по которому искусственный интеллект начинает генерировать арты. Как и в случае с любым ценным навыком, появились «умельцы» общаться с нейросетями, которые предлагают свои услуги за деньги.
Сайт The Verge рассказал о платформе для продажи таких навыков — PromptBase. Она помогает «операторам нейросетей» торговать текстовыми описаниями для получения конкретных результатов. Работает очень просто — находим исполнителя, подробно описываем, что хотим получить, а в ответ за деньги получаем кусок текста, который нужно «скоромить» Midjourney или DALL-E.
Изображение сгенерировано с помощью DALL-E
На словах такой вид заработка может звучать как халтура. На деле покупатель получает почти код, который содержит определенные ключевые слова для получения конкретного результата, а также специальную орфографию, позволяющую вводить в описание различные переменные.
Журналисты The Verge пообщались с дизайнером Джастином Реклингом платформы PromptBase, а мы выделили самое главное из этого интервью.
С чего вы начали и какие смежные навыки у вас были?
Я начал работу с нейросетями в апреле 2022 года. Тогда я быстро обнаружил, что умею очень точно преобразовывать текст в изображение. Среди моих смежных навыков: программирование.
Перед созданием описания я пытаюсь понять, как нейросеть распознает его. Для этого мне пригодился опыт программирования. Буквально у каждого слова в тексте для генерации изображения имеется свой вес.
Изображение сгенерировано с помощью DALL-E
Сколько описаний для создания изображений вы продаете в день? Как думаете, для чего люди их покупают?
Обычно я продаю от трех до пяти описаний в день. Сейчас в моем арсенале около 50 кусков текста, которые можно адаптировать под конкретный случай. Я периодически добавляю новые. Большинство проданных мною описаний, на мой взгляд, используются для развлечений.
Как вы создаете новые описания?
Чаще всего я использую сочетание личных интересов и запросов сообщества. Мне хочется делать вещи, которые будут полезны людям. Я также слежу за тем, что хорошо продается.
Какое ваше самое популярное описание?
Мой лидер продаж — Block Cities. Кажется, его используют для принтов на футболках.
С чего начать?
Сначала у меня появляется приблизительное представление, что я хочу получить, а потом пытаюсь сузить круг задач до людей, мест, основных действующих лиц и прочих деталей. Я использую нейросеть, чтобы создать несколько приблизительных описаний — они помогают понять, как может выглядеть сцена. Мне кажется проще взять что-то, что уже хорошо работает, а затем добавить что-то новое. Начинать лучше с больших важных штрихов, а затем переходить к мелким деталям.
Я провожу довольно много исследований для каждой работы. Начинаю с того, что задаю вопросы по теме GPT-3 (генеративная языковая модель, которая работает по принципу автодополнения: вы вводите начало текста, а программа генерирует наиболее вероятное его продолжение). Например, я создаю описание для получения изображения с маникюром, в таком случае я могу спросить: «Кто-то делает маникюр, объясните, что вы видите». Это позволяет мне получить конкретные сведения для создания наиболее точных ключевых слов.
Есть ли какие-то особые навыки или приемы, которым вы научились во время работы с нейросетями?
При создании текста для преобразования в изображения может быть полезно использовать цитаты для разделения основных идей. Кроме того, не будет лишним изучить полезные термины, такие как «гиперреалистичный», «макросъемка», «кинематографическое освещение», «дальний план», «средний план» и прочие. Это поможет добавить глубину, детализацию, а также контролировать фокус и расстояние.
Как отличается процесс работы с нейросетями DALL-E и Midjourney?
Это зависит от того, что вам нужно сделать. Если вы хотите получить что-то наиболее профессиональное, например, замену стоковой фотографии, то наилучшим выбором будет DALL-E. На мой взгляд, Midjourney выдает наиболее творческие результаты, но для работы с ней требуется больше времени и усилий.
Сколько зарабатываете?
Мне приходится тратить от 10 до 15 долларов за каждое приглашение для доступа к нейросетям. Чтобы выйти в ноль мне нужно продать от 5 до 10 описаний. Для меня это инвестиции в технологию, которые окупятся в долгосрочной перспективе.
Это немного проливает свет на ценность описаний для генерации изображений. Много людей критикует мой заработок, поскольку они видят только конечный результат и им кажется, что я не прилагаю особых усилий.
Как вы относитесь к авторским правам на свою работу? Как думаете она защищена авторским правом?
Я почти не думаю на эту тему, поскольку просто пытаюсь создать что-то, чем горжусь и что понравится другим. Мне платят за мою работу и мне этого достаточно.
В качестве вывода
С учетом развития и прогресса нейросетей для работы с визуальным контентом появляется вероятность замещения целого ряда творческих профессий, среди которых иллюстраторы и дизайнеры. Судите сами — попросту будет нецелесообразно и неэффективно держать в штате узкоспециализированного специалиста, если условная нейросеть может сгенерировать десятки или даже сотни изображений и логотипов.Есть вероятность, что сейчас мы наблюдаем эволюционный процесс перехода от работы с графическими редакторами к написанию «алгоритма», в который можно будет задавать свои переменные и получать необходимые результаты. Есть повод задуматься и освоить навыки «общения» с нейросетями.