Профессия «оператор нейросетей»: они скоро заменят иллюстраторов и дизайнеров

Георгий


Изображения созданные нейросетями Midjourney и DALL-E превратились из абстрактных картинок в осознанные шедевры искусства с высокой детализацией. Для получения достойных результатов необходимо составить грамотное описание — своего рода алгоритм, по которому искусственный интеллект начинает генерировать арты. Как и в случае с любым ценным навыком, появились «умельцы» общаться с нейросетями, которые предлагают свои услуги за деньги.

Подписаться на iGuides в Telegram, чтобы узнать обо всем первым — t.me/iguides

Сайт The Verge рассказал о платформе для продажи таких навыков — PromptBase. Она помогает «операторам нейросетей» торговать текстовыми описаниями для получения конкретных результатов. Работает очень просто — находим исполнителя, подробно описываем, что хотим получить, а в ответ за деньги получаем кусок текста, который нужно «скоромить» Midjourney или DALL-E.


Изображение сгенерировано с помощью DALL-E

На словах такой вид заработка может звучать как халтура. На деле покупатель получает почти код, который содержит определенные ключевые слова для получения конкретного результата, а также специальную орфографию, позволяющую вводить в описание различные переменные. 

Журналисты The Verge пообщались с дизайнером Джастином Реклингом платформы PromptBase, а мы выделили самое главное из этого интервью.

С чего вы начали и какие смежные навыки у вас были?

Я начал работу с нейросетями в апреле 2022 года. Тогда я быстро обнаружил, что умею очень точно преобразовывать текст в изображение. Среди моих смежных навыков: программирование.

Перед созданием описания я пытаюсь понять, как нейросеть распознает его. Для этого мне пригодился опыт программирования. Буквально у каждого слова в тексте для генерации изображения имеется свой вес. 


Изображение сгенерировано с помощью DALL-E

Сколько описаний для создания изображений вы продаете в день? Как думаете, для чего люди их покупают?

Обычно я продаю от трех до пяти описаний в день. Сейчас в моем арсенале около 50 кусков текста, которые можно адаптировать под конкретный случай. Я периодически добавляю новые. Большинство проданных мною описаний, на мой взгляд, используются для развлечений.

Как вы создаете новые описания?

Чаще всего я использую сочетание личных интересов и запросов сообщества. Мне хочется делать вещи, которые будут полезны людям. Я также слежу за тем, что хорошо продается.

Какое ваше самое популярное описание?

Мой лидер продаж — Block Cities. Кажется, его используют для принтов на футболках.



С чего начать?

Сначала у меня появляется приблизительное представление, что я хочу получить, а потом пытаюсь сузить круг задач до людей, мест, основных действующих лиц и прочих деталей. Я использую нейросеть, чтобы создать несколько приблизительных описаний — они помогают понять, как может выглядеть сцена. Мне кажется проще взять что-то, что уже хорошо работает, а затем добавить что-то новое. Начинать лучше с больших важных штрихов, а затем переходить к мелким деталям.

Я провожу довольно много исследований для каждой работы. Начинаю с того, что задаю вопросы по теме GPT-3 (генеративная языковая модель, которая работает по принципу автодополнения: вы вводите начало текста, а программа генерирует наиболее вероятное его продолжение). Например, я создаю описание для получения изображения с маникюром, в таком случае я могу спросить: «Кто-то делает маникюр, объясните, что вы видите». Это позволяет мне получить конкретные сведения для создания наиболее точных ключевых слов.

Есть ли какие-то особые навыки или приемы, которым вы научились во время работы с нейросетями?

При создании текста для преобразования в изображения может быть полезно использовать цитаты для разделения основных идей. Кроме того, не будет лишним изучить полезные термины, такие как «гиперреалистичный», «макросъемка», «кинематографическое освещение», «дальний план», «средний план» и прочие. Это поможет добавить глубину, детализацию, а также контролировать фокус и расстояние.

Как отличается процесс работы с нейросетями DALL-E и Midjourney?

Это зависит от того, что вам нужно сделать. Если вы хотите получить что-то наиболее профессиональное, например, замену стоковой фотографии, то наилучшим выбором будет DALL-E. На мой взгляд, Midjourney выдает наиболее творческие результаты, но для работы с ней требуется больше времени и усилий.

Сколько зарабатываете?

Мне приходится тратить от 10 до 15 долларов за каждое приглашение для доступа к нейросетям. Чтобы выйти в ноль мне нужно продать от 5 до 10 описаний. Для меня это инвестиции в технологию, которые окупятся в долгосрочной перспективе.

Это немного проливает свет на ценность описаний для генерации изображений. Много людей критикует мой заработок, поскольку они видят только конечный результат и им кажется, что я не прилагаю особых усилий.

Как вы относитесь к авторским правам на свою работу? Как думаете она защищена авторским правом?

Я почти не думаю на эту тему, поскольку просто пытаюсь создать что-то, чем горжусь и что понравится другим. Мне платят за мою работу и мне этого достаточно.


В качестве вывода

С учетом развития и прогресса нейросетей для работы с визуальным контентом появляется вероятность замещения целого ряда творческих профессий, среди которых иллюстраторы и дизайнеры. Судите сами — попросту будет нецелесообразно и неэффективно держать в штате узкоспециализированного специалиста, если условная нейросеть может сгенерировать десятки или даже сотни изображений и логотипов.

Есть вероятность, что сейчас мы наблюдаем эволюционный процесс перехода от работы с графическими редакторами к написанию «алгоритма», в который можно будет задавать свои переменные и получать необходимые результаты. Есть повод задуматься и освоить навыки «общения» с нейросетями.
-4
iGuides в Дзене —  dzen.ru/iguides
iGuides в Telegram — t.me/iguides
iGuides в VK —  vk.com/iguides
iGuides в Ok.ru — ok.ru/iguides

Рекомендации

Рекомендации

Будь в курсе последних новостей из мира гаджетов и технологий

Мы в соцсетях

Комментарии

Читайте также