Как сгенерировать серию изображений героя в нейросетях?
Задача: нарисовать героя по нашему запросу и получить несколько вариаций с этим героем.
Для этого будем использовать Midjourney V6 через бот в Telegram.
Для начала опишем в промпе, какой герой нам нужен и в каком стиле.
Лайфхак #1
Для нашего удобства напишем, что герой нужен на белом фоне.
Лайфхак #2
И сразу добавим, что мы хотим несколько таких иллюстраций! Лучше ввести количество не больше 10, чтобы изображения по размеру были пригодны для дальнейшего использования. Я выбрала «5». Бот понимает, что нужно нарисовать несколько вариантов, при этом количество не всегда совпадает с запросом.
Prompt: 5 variations of illustrations of blue female cat in different poses body completely with big eyes in pink t-short and white skirt, anime style white background
Midjourney предложил 4 варианта наборов.
Иллюстрации внутри каждого набора выглядят как один и тот же горой в разных позах.
Один из вариантов мне понравился, и я продолжила рисовать этих котят.
Как получить больше вариаций этого героя
Запросы на вариацию
Сначала я пробовала запросы на вариацию изображения. Котята были очень похожи по стилю на исходных, но, если присмотреться, заметно, что мордочки немного отличаются (глаза, форма ушей и др.) Некоторые варианты могут оказаться рабочими (герой сбоку, сзади, в детстве и др.)
Неудачная попытка через промпт
Пробовала создать промпт со ссылкой на изображение-референс, но это вообще не сработало — стиль и характеристики были утрачены.
Дальше я пробовала неочевидные опции для этой задачи.
Лайфхак #3 — запрос на дорисовку фона изображения
Использовала инструмент в виде стрелок, указывающих, с какой стороны нужно дорисовать. При дорисовке снизу и сверху нейросеть чаще генерирует героев в горизонтальной ориентации (например, лежа), при дорисовке справа и слева — в вертикальной.
Запрос на Zoom
Также дорисовывает героев по периметру, сохраняя стиль и черты, но хуже, чем в предыдущем варианте.
По итогу десятков генераций можно собрать набор изображений одного героя в разных вариантах (позы, эмоции, кадрирование и др.) Позы и эмоции предлагает нейросеть.
Этот пример будет полезен тем, кто планирует создать стикеры и эмодзи в мессенджерах или ищет героя для встраивания в иллюстрации.
Если есть вопросы — напишите мне в TG