Как сгенерировать серию изображений героя в нейросетях?

Задача: нарисовать героя по нашему запросу и получить несколько вариаций с этим героем.

Aleksandra Burova
3 min readJun 25, 2024

Для этого будем использовать Midjourney V6 через бот в Telegram.

Для начала опишем в промпе, какой герой нам нужен и в каком стиле.

Лайфхак #1

Для нашего удобства напишем, что герой нужен на белом фоне.

Лайфхак #2

И сразу добавим, что мы хотим несколько таких иллюстраций! Лучше ввести количество не больше 10, чтобы изображения по размеру были пригодны для дальнейшего использования. Я выбрала «5». Бот понимает, что нужно нарисовать несколько вариантов, при этом количество не всегда совпадает с запросом.

Prompt: 5 variations of illustrations of blue female cat in different poses body completely with big eyes in pink t-short and white skirt, anime style white background

Midjourney предложил 4 варианта наборов.

Иллюстрации внутри каждого набора выглядят как один и тот же горой в разных позах.

Один из вариантов мне понравился, и я продолжила рисовать этих котят.

Как получить больше вариаций этого героя

Запросы на вариацию

Сначала я пробовала запросы на вариацию изображения. Котята были очень похожи по стилю на исходных, но, если присмотреться, заметно, что мордочки немного отличаются (глаза, форма ушей и др.) Некоторые варианты могут оказаться рабочими (герой сбоку, сзади, в детстве и др.)

Неудачная попытка через промпт

Пробовала создать промпт со ссылкой на изображение-референс, но это вообще не сработало — стиль и характеристики были утрачены.

Дальше я пробовала неочевидные опции для этой задачи.

Лайфхак #3 — запрос на дорисовку фона изображения

Использовала инструмент в виде стрелок, указывающих, с какой стороны нужно дорисовать. При дорисовке снизу и сверху нейросеть чаще генерирует героев в горизонтальной ориентации (например, лежа), при дорисовке справа и слева — в вертикальной.

Запрос на Zoom

Также дорисовывает героев по периметру, сохраняя стиль и черты, но хуже, чем в предыдущем варианте.

По итогу десятков генераций можно собрать набор изображений одного героя в разных вариантах (позы, эмоции, кадрирование и др.) Позы и эмоции предлагает нейросеть.

Этот пример будет полезен тем, кто планирует создать стикеры и эмодзи в мессенджерах или ищет героя для встраивания в иллюстрации.

Если есть вопросы — напишите мне в TG

--

--