Подключил Claude к генератору картинок — а получил комбайн для презентаций
Меня зовут Александр Поляков, занимаюсь рекламой и AI-автоматизацией. Недавно рассказывал, как подключил Claude к Вордстату — модель начала находить дыры в семантике, которые легко пропустить. Сегодня — про генерацию картинок и неожиданный поворот.
Проблема: Claude не умеет рисовать
Claude отлично пишет код, анализирует документы, работает с данными. Но картинки генерировать не умеет — это ограничение платформы.
Сейчас лучше всего для моих задач работает Nano Banana Pro от Google. Но есть нюанс: в стандартном интерфейсе Gemini она лепит видимый водяной знак. Чтобы получить чистую картинку, нужно идти в fal.ai или Vertex AI — отдельный интерфейс, отдельные действия.
Каждый раз одно и то же: переключиться, сгенерировать, скачать, вернуться в Claude. На одной картинке — мелочь. На серии из десяти — раздражает.
Я решил это исправить — написал навык, который даёт Claude прямой доступ к Nano Banana Pro через fal.ai. Без водяных знаков, без переключений.
Почему fal.ai
Можно было интегрироваться напрямую с Midjourney, DALL-E или Vertex AI. Но fal.ai даёт единый API для разных моделей генерации. Не нужно разбираться в особенностях каждого сервиса — один интерфейс для всего. Завтра появится модель лучше — меняю одну строчку в конфиге.
Главный бонус Nano Banana Pro: модель отлично рендерит текст. Никаких кривых букв и абракадабры вместо надписей — частая боль других генераторов.
Как инструмент эволюционировал
Начал с простого: генерация картинок по текстовому описанию. Пишешь «инфографика для карточки товара на маркетплейсе, минималистичный стиль» — получаешь картинку.
Можно даже просить объяснять сложные теории из книг.
Потом добавил генерацию по референсам: загружаешь картинку — получаешь новую в том же стиле. Удобно для серий: сделал одну карточку товара, остальные генерируешь по её образцу.
И тут щёлкнуло.
Референс — это же мастер-слайд.
В конце осени я уже пробовал делать презентации через навыки Claude — не взлетело. Создать шаблон .pptx оказалось сложнее, чем саму презентацию. Но с генерацией картинок по референсу всё встало на место.
Дописал генерацию PDF-презентаций в едином визуальном стиле. Загружаешь один слайд как образец, описываешь содержание — получаешь презентацию, где все слайды выглядят консистентно.
Для чего я это использую
Маркетплейсы. Карточки товаров, инфографика, визуалы для A/B-тестов. Раньше на серию из 10 картинок уходил час переключений между инструментами. Теперь — один диалог с Claude.
Реклама. Быстрые макеты для согласования с клиентом. Не финальный креатив, но достаточно, чтобы показать идею и получить фидбек до того, как дизайнер потратит время.
Инфографика. Схемы, диаграммы с пояснениями. Текст читаемый — это критично для информационных материалов.
Личные эксперименты. Читаю книгу — хочу построить иллюстрацию для визуализации сцены. Помогает запоминать и глубже погружаться в материал.
Экономика
- $0.15 за картинку — примерно 10 рублей по текущему курсу
- ~70 генераций на 1000₽
- Презентации — пока медленные, около 6 минут на документ. Буду оптимизировать.
Для сравнения: Midjourney Pro стоит $30/мес за безлимит. Если генерируете меньше 200 картинок в месяц — fal.ai выгоднее. Если больше — считайте под свои объёмы.
Техническая заметка
Когда тестировал навык в веб-версии Claude, заметил странность: при генерации нескольких картинок подряд каждая создавалась последовательно. Одна закончилась — началась следующая. На десяти картинках это ощутимо.
Полез разбираться и нашёл способ узнать реальные возможности любой AI-платформы — какие инструменты доступны, что можно параллелить, а что нет. Один промпт показывает всю «начинку». Об этом расскажу в следующий раз.
Как подключить
- Зарегистрируйтесь на fal.ai и пополните баланс
- Скачайте навык: https://github.com/artwist-polyakov/polyakov-claude-skills/tree/main/plugins/fal-ai-image
- Положите папку в .claude/skills вашего проекта
- API-ключ положите в .env внутри папки config
Работает с Claude Code, веб-версией Claude и даже с GLM. Можно запустить в Cursor — под капотом обычные скрипты с промптами.
Весь код открыт: https://github.com/artwist-polyakov/polyakov-claude-skills
Вопрос к аудитории
Интересно, почему продуктовые команды Яндекса или Сбера еще не положили глаз на эту техологию и не делают сервис?
Другие инструменты по AI-автоматизации — в моем Telegram: https://t.me/countwithsasha