Подключил Claude к генератору картинок — а получил комбайн для презентаций

Меня зовут Александр Поляков, занимаюсь рекламой и AI-автоматизацией. Недавно рассказывал, как подключил Claude к Вордстату — модель начала находить дыры в семантике, которые легко пропустить. Сегодня — про генерацию картинок и неожиданный поворот.

Claude отлично пишет код, анализирует документы, работает с данными. Но картинки генерировать не умеет — это ограничение платформы.

Сейчас лучше всего для моих задач работает Nano Banana Pro от Google. Но есть нюанс: в стандартном интерфейсе Gemini она лепит видимый водяной знак. Чтобы получить чистую картинку, нужно идти в fal.ai или Vertex AI — отдельный интерфейс, отдельные действия.

Каждый раз одно и то же: переключиться, сгенерировать, скачать, вернуться в Claude. На одной картинке — мелочь. На серии из десяти — раздражает.

Я решил это исправить — написал навык, который даёт Claude прямой доступ к Nano Banana Pro через fal.ai. Без водяных знаков, без переключений.

Вот внизу справа звезда: то есть прийдется либо кропать, либо использовать изображение с ней.

Можно было интегрироваться напрямую с Midjourney, DALL-E или Vertex AI. Но fal.ai даёт единый API для разных моделей генерации. Не нужно разбираться в особенностях каждого сервиса — один интерфейс для всего. Завтра появится модель лучше — меняю одну строчку в конфиге.

Главный бонус Nano Banana Pro: модель отлично рендерит текст. Никаких кривых букв и абракадабры вместо надписей — частая боль других генераторов.

Сделать инфографику — не вопрос. Nano Banana Pro отлично справляется с русским текстом.

Начал с простого: генерация картинок по текстовому описанию. Пишешь «инфографика для карточки товара на маркетплейсе, минималистичный стиль» — получаешь картинку.

Кажется проблема карточек для марктплейсов решена

Можно даже просить объяснять сложные теории из книг.

Подключил Claude к генератору картинок — а получил комбайн для презентаций

Потом добавил генерацию по референсам: загружаешь картинку — получаешь новую в том же стиле. Удобно для серий: сделал одну карточку товара, остальные генерируешь по её образцу.

И тут щёлкнуло.

Референс — это же мастер-слайд.

Просишь сгенерировать презентацию про искусственный интеллект, Claude сам придумывает тебе научный мастер-слайд

В конце осени я уже пробовал делать презентации через навыки Claude — не взлетело. Создать шаблон .pptx оказалось сложнее, чем саму презентацию. Но с генерацией картинок по референсу всё встало на место.

Дописал генерацию PDF-презентаций в едином визуальном стиле. Загружаешь один слайд как образец, описываешь содержание — получаешь презентацию, где все слайды выглядят консистентно.

Немного промптов и pdf-презентация готова.

Маркетплейсы. Карточки товаров, инфографика, визуалы для A/B-тестов. Раньше на серию из 10 картинок уходил час переключений между инструментами. Теперь — один диалог с Claude.

Реклама. Быстрые макеты для согласования с клиентом. Не финальный креатив, но достаточно, чтобы показать идею и получить фидбек до того, как дизайнер потратит время.

Инфографика. Схемы, диаграммы с пояснениями. Текст читаемый — это критично для информационных материалов.

Личные эксперименты. Читаю книгу — хочу построить иллюстрацию для визуализации сцены. Помогает запоминать и глубже погружаться в материал.

$0.15 за картинку — примерно 10 рублей по текущему курсу
~70 генераций на 1000₽
Презентации — пока медленные, около 6 минут на документ. Буду оптимизировать.

Для сравнения: Midjourney Pro стоит $30/мес за безлимит. Если генерируете меньше 200 картинок в месяц — fal.ai выгоднее. Если больше — считайте под свои объёмы.

Когда тестировал навык в веб-версии Claude, заметил странность: при генерации нескольких картинок подряд каждая создавалась последовательно. Одна закончилась — началась следующая. На десяти картинках это ощутимо.

Полез разбираться и нашёл способ узнать реальные возможности любой AI-платформы — какие инструменты доступны, что можно параллелить, а что нет. Один промпт показывает всю «начинку». Об этом расскажу в следующий раз.

Зарегистрируйтесь на fal.ai и пополните баланс
Скачайте навык: https://github.com/artwist-polyakov/polyakov-claude-skills/tree/main/plugins/fal-ai-image
Положите папку в .claude/skills вашего проекта
API-ключ положите в .env внутри папки config

Работает с Claude Code, веб-версией Claude и даже с GLM. Можно запустить в Cursor — под капотом обычные скрипты с промптами.

Весь код открыт: https://github.com/artwist-polyakov/polyakov-claude-skills

Интересно, почему продуктовые команды Яндекса или Сбера еще не положили глаз на эту техологию и не делают сервис?

Другие инструменты по AI-автоматизации — в моем Telegram: https://t.me/countwithsasha

Подключил Claude к генератору картинок — а получил комбайн для презентаций

Проблема: Claude не умеет рисовать

Почему fal.ai

Как инструмент эволюционировал

Для чего я это использую

Экономика

Техническая заметка

Как подключить

Вопрос к аудитории