Приручить нейросеть: будни цифрового конюха

Приручить нейросеть: будни цифрового конюха

В дополнение к предыдущему посту о нейросетях в видеопроизводстве.

На данном этапе развития генеративных моделей их основная проблема - «распущенность». И нет, это не значит, что во время обработки запроса они нашёптывают тебе пошлости в наушники. Под «распущенностью» я имею в виду сильную тягу искусственного интеллекта додумывать за тебя условия, которые ты не указывал.

И самое обидное - даже если постараться закрыть все дыры и максимально подробно описать задачу, он всё равно оставит свой «творческий след».

Особенно это заметно на персонажах, освещении и ракурсах внутри одного сюжета. Добиться идентичного выражения лица, настроения и позы героя в разных кадрах пока невозможно. Можно лишь сократить различия. То же касается окружения: ИИ пока плохо справляется с большим количеством объектов. Подобных слабостей еще хватает (если будет интересно, расскажу о них отдельно).

На прикреплённых примерах видно, что повторить стрёмного деда один в один не удалось, хотя промпт для него был идентичный.

Поэтому «стать продвинутым промпт-инженером» - это не значит знать волшебную формулу, гарантирующую точный результат. Это значит научиться максимально минимизировать отсебятину от робота, суметь удержать его в узде и не позволить овладеть творческой инициативой.

А вообще, звучит как новая профессия будущего: «конюх для нейросети»

1 комментарий