Искали и нашли. Выпуск 1

Дважды в месяц ИскателИ и Big Bag Films собираются вместе, чтобы обсудить новости из мира искусственного интеллекта. В мире, где нейросети — не игрушка для айтишников, а мощный креативный инструмент, ускоряющий и упрощающий работу с самыми разными типами контента, за ними нужен глаз да глаз!

Решили поделиться с вами самыми, что там удалось напромптить 👀

Luma AI: от фотографии к короткометражке

Главная «фишка»: Luma AI позволяет брать обычное изображение и буквально в несколько кликов преобразовывать его в анимированное видео. Инструмент способен дорисовывать промежуточные кадры, делать картинку динамичнее, а теперь ещё и добавлять аудио-дорожку к видео-ряду.

Где и как это использовать?

  • Рекламные тизеры: превращая статику продукта (например, баночки с кремом) в завораживающее микро-видео, вы сразу повышаете шанс «зацепить» внимание зрителя в ленте соцсетей;
  • Контент для мероприятий: если нужно быстро сделать «залипательное» фоновое видео на стенде или в холле, Luma AI сэкономит массу времени.

Мы тестировали Luma на нескольких референсах и обнаружили, что качество результата во многом зависит от исходника: если исходное изображение чёткое и контрастное, а сюжет понятен (к примеру, яркий объект на нейтральном фоне), шансы получить «вау»-эффект гораздо выше. При более сложных сценах нужна ручная доработка.

Глядите, что получилось!

Microsoft Copilot: когда голос быстрее клавиатуры

Честно, иногда нам лень писать. В такие моменты мы радуемся появлению системы Copilot, которую Microsoft встраивает в свои продукты (от Office до Teams). Она способна понимать голосовые команды и обрабатывать их на русском языке. То есть вместо того чтобы «бомбить» Chat GPT запросами ручным вводом, вы можете просто озвучить вопрос, а Copilot сгенерирует ответ, подберёт данные, оформит документ или письмо.

Почему это удобно?

  • Сокращение времени: иногда наговорить что-то (особенно, если это раздумья вслух) проще, чем напечатать — руки за мыслями попросту не поспевают;
  • Меньше рутины: если вы много работаете с документами, Copilot преобразует голосовые инструкции в форматированную информацию в Word, Excel или PowerPoint.

Но куда тут без нюансов… Голосовое распознавание в нейросетях всё ещё может путать слова, особенно если человек говорит очень быстро или со сложными именами собственными. Так что итоговый текст стоит проверять. Но даже при необходимости доработки это — большой шаг вперёд, если будем сравнивать сервис со «старыми» голосовыми ассистентами.

«Это же ДжоДжо!» — как быть с авторскими правами

Честно, в нашей команде — много поклонников азиатской культуры, поэтому мы часто обсуждаем нейросетевые генерации, которые выполнены в аниме-стилистике. Поэтому, когда мы находим проекты, один в один копирующий стиль знакомых нам тайтлов, — невольно начинаем задумываться: «А как быть с авторским правом?»

Модели обучаются на тысячах (а то и миллионах) самых разных изображений, и если вы «просите» её воссоздать стиль известного художника (будь то Хаяо Миядзаки или Макото Синкай), то ступаете на тонкий лёд.

Чтобы не попасть в проблемы, мы рекомендуем:

  • Давать ссылки на референсы: если вы вдохновляетесь конкретной манерой, лучше признаться в этом заказчику или аудитории;
  • Избегать плагиата: когда речь идёт о коммерческих проектах, прямое копирование стиля без согласования может вызвать недовольство правообладателей, а все мы знаем, чем это чревато;
  • Развивать собственный визуальный стиль.

Как мы побывали на «Новом железе»

Сходили мы, значит, на крупное мероприятие, которое проводил Креативный Кластер Домна, чтобы понять, что людей в нейросетях больше всего интересует.

Найдите Искателей
Найдите Искателей

Пришли к следующим выводам:

  • Люди путают ручную и нейросетевую работу: мы пустили на экран несколько сгенерированных роликов. Люди подходили, разглядывали его, но быстро испарялись, потому что не понимали, что видео сгенерировано нейросетями (настолько реалистично сделали!);
  • Каждый хочет получить свой нейросетевой портрет: наш ассистент Вия, генерирующий арт по фото в реальном времени, вызвал интерес;
  • Все любят карты Таро: так случилось, что нейросети и таро — одинаково таинственны и непонятны для людей, вот мы и решили создать собственную колоду (с помощью ИИ, конечно же!), снабдив каждую карту бизнес-советом.

Офлайн-коммуникация для тех, кто привык жить в Google Meets — самый настоящий вызов, но общаться с людьми нам понравилось так же сильно, как и с искусственным интеллектом, хех!

Семейный мультфильм: шесть человек в кадре — тот ещё квест

Нейросети отлично создают анимацию в реалистичном стиле, но вот когда дело доходит до мультяшности — от стиля «Клинка, рассекающего демонов» до стиля пиксаровской «Души» — начинаются проблемы. Потому ИИ-артисты удивились, когда в нашу AI-студию пришёл заказ на анимационную вставку в фильм (это был подарок на день рождение), но принялись за работу с энтузиазмом.

Задача анимационной вставки — показать конкретных членов семьи (шесть человек) в стиле мультфильмов Пиксар так, чтобы они были узнаваемы на экране.

Фанфакт: нейросети сейчас не слишком любят генерировать «множество лиц» в одном кадре — что-то да пойдёт не так: или глаза «расползутся», или персонажи станут одинаковыми, теряя всю свою индивидуальность.

Как мы справились:

  • Раздробили сцены на несколько крупных планов (2–3 человека максимум);
  • «Подчищали» результат генерации в Фотошопе (правили глаза, детали одежды);
  • Показывали промежуточные варианты клиенту, чтобы тот подтвердил сходство.

В итоге у нас вышел добрый мультфильм, в персонажах которого люди действительно узнали себя. Но на будущее мы всегда напоминаем заказчикам: чем больше персонажей в кадре, тем будет больше итераций правок.

И что в конце концов?..

Нейросети — тот ещё ящик Пандоры.

ИскателИ уже успели потестить их в самых разных ситуациях — и офлайн-презентации готовили, и рекламу делали, и мульфильмы пилили. И можем сказать точно: если вы хотите добавить в проект «магическую искру» и ускорить процесс производства контента, — обращайтесь к генеративным моделям. Но всё же лучше иметь команду, которая знакома с подводными камнями и сумеет выжать максимум из этих технологий.

Подписывайтесь на нас, чтобы оставаться в курсе новостей!

1
Начать дискуссию