Kandinsky 2.1 и иррациональные запросы

Дисклеймер - пост написан любителем и может не нести полезной инфы, мои знания вероятно поверхностны со всеми вытекающими.

О чем пост?

После знакомства с такими сетями как SD и MJ (и ещё пара браузерных сеток) стало понятно, что промт-инженерия решает многое, превращая  твой запрос в узкий коридор для выдачи. Тестами Kandinsky с детальным промтом, я остался доволен. Но потом наткнулся на надписи в выдачах и стало любопытно куда они ведут.

На фото ChatGPT представил, что «мой город это человек и выдал портретное описание этого человека в 60-ти пунктах», Kandinsky без изменений запроса его изобразил.

Я начал вбивать всё, что Kandinsky выдал и удивился результатам. Внутри Kandinsky 2.1 много своих имен для результатов выдачи и коротких путей к конечным точкам.

Я не буду описывать с какими запросами и как я экспериментировал, какие веса и последовательности расставлял. В общем я начал вбивать запросы генерируемые сеткой и смотреть на результат. По 5-10 генерации на один запрос.

Для себя выделил генерации трёх типов и проверил их на сочетание с другим промтом:

1. Рандомные (нет постоянных общих черт).

2. Генерации с повторяющимся признаком, но вариативность все же широкая (на примере заметно вертикальное разделение на всех изображения).

3. Узкая вариативность. (у Kandinsky четко сформирован ответ на запрос).

Почему мне стало это интересно? Да, грамотный запрос сделает выдачу предсказуемой и нужного результата добьёшься быстрее с понятным запросом. Это если цель получит условного "кота в сапогах". Но эти иррациональные запросы часто рождают довольно интересные устойчивые выдачи, описание для которых нужно ещё постараться придумать. Все три типа могут помочь в творчестве убрать проблему белого листа, а какие то стать фирменным стилем (они часто взаимодействуют с другим промтом). Так же они могут значительно сжать величину запроса.

Само собой хотелось бы услышать мнения. Возможно я совсем не туда думаю. Но пока я скидываю эти мутации в телегу - welcome.

1 комментарий

с оформлением беда - я заметил