«Чёрное зеркало» подъехало: GPT-5 стал рабочей лошадью, TikTok крадёт личности, Krea рисует видео в реальном времени — что с этим делать прямо сейчас
Привет, VC! Я Ринат, делаю и обучаю AI-ботов и автоматизацию для бизнеса. За неделю накопилась такая сводка по ИИ, что без плана вы легко потеряете фокус: GPT-5 уже дефолт, Google выкатил голос в реальном времени, видеогенерация ускорилась, а академики показали прототип «чтения мыслей». Ниже — 12 новостей без хайпа и пошагово, что из этого выжать предпринимателю и продуктовой команде уже на этой неделе.
Спойлер: есть 3 сценария, где вы можете обогнать рынок в ближайшие 30 дней — голосовые агенты для поддержки/продаж, real-time видео-рестайлинг для контента и «анти-deepfake» политика для бренда.
- TikTok-аватары: 750$ за цифровую личность — и ваш «я» продаёт страховки на испанском
Что случилось: актёру заплатили $750 за создание AI-аватара, после чего сеть наводнили ролики с его цифровой копией и сомнительной рекламой. История реальная, договор, по ощущениям, был из серии «мы будем беспощадно использовать».
Почему это важно: цена ошибки копеечная, удар по доверию — дорогой. Если у вас бренд, эксперты, амбассадоры — вы в зоне риска.
Что делать:
- Пропишите AI-права в договоре: где, как и сколько может использоваться голос/лицо, право на отзыв согласия, штрафы.
- Введите в компанию AI-политику бренда: что считается deepfake, кто согласовывает, что делать при инциденте (каналы оповещения, форма опровержения, запросы в платформы).
- Техконтроль: мониторим в TikTok/YouTube по векторным отпечаткам (поиск похожего лица/голоса). Есть недорогие SaaS-сервисы с алертами — хватит 1–2 часа на интеграцию.
Инструменты: Hive Moderation / Pimeyes (визуал) + кастомный мониторинг по ключам в соцсетях.
- OpenAI Realtime API: голосовые ассистенты стали проще и дешевле
Что случилось: голосовая модель обновлена, Realtime API вышел из беты, стало на ~20% дешевле, появились новые голоса и мультимодальность на входе (картинки + речь). Агент «видит» экран, говорит и действует.
Где применить за 7 дней:
- Голосовой «фронт» поддержки 24/7 (FAQ, статус заказа, базовый трблшут).
- Пресейл-ассистент: проговаривает выгоды, собирает требования, пишет на лету бриф менеджеру.
- Разговорный онбординг на сайте: агент «смотрит» на экран, объясняет, куда нажимать.
Быстрый план:
- Сценарий: 10–15 FAQ, ветки «не знает — эскалация».
- Макеты экранов, куда агент «смотрит».
- Подключение Realtime API + MCP-инструменты (база знаний, CRM-карточки).
- A/B: бот vs. живой оператор на части трафика.
- Метрики: FCR (решили с первого контакта), CSAT, среднее время ответа.
3. CodeX + IDE: нормальный ИИ для кода без подписки на IDE
Что случилось: расширение для VS Code/форков, нормальный CLI, обновлён UI, умение работать с картинками и веб-поиском. Можно юзать по подписке ChatGPT вместо платных IDE-надстроек.
Практика:
- Ускоряем боевые фиксы: «вот стектрейс скрина — почини и напиши тест».
- Пишем рутинные миграции, парсеры, скрипты ETL.
- ОТГРУЖАЕМИ (договоритесь с безопасностью!): секреты/приватный код — через self-hosted-прокси или redaction.
4. GPT-5 против GPT-4: быстрее ≠ всегда лучше, но «роутер» решает
Факт: на простых задачах GPT-5 быстрее на 30–50%, но магия — в единой модели с роутингом: сама выбирает «легкий» или «reasoning» режим. Не надо вспоминать, чем O3 отличается от 4-mini-high.
Как использовать:
- Дефолт: GPT-5 для всего.
- Если «галлюцинирует» — добавляйте источники (RAG, ссылки) и требуйте цитаты.
- Для массивов документов/таблиц — готовьте структурированные подсказки: TASK: ... / DOC: ... / CONSTRAINTS: ... / OUTPUT: JSON.
Антипаттерн: просить «думай пошагово» — reasoning-модели и так думают; лучше явные критерии проверки результата.
5. Claude-оператор (браузерный агент) ограниченно в хроме, но тренд очевиден
Нативные веб-агенты с браузером и инструментами — это наш «секретарь на стероидах»: заполнить форму, проверить статусы, собрать таблицу цен, подготовить сравнение.
Шаги на месяц:
- 3–5 задач, где ассистент «ходит» по сайту и заполняет/сверяет.
- Лимит доступа (только публичные зоны, логирование действий).
- Пилот на одном отделе, затем масштаб.
6. Grok Code Fast 1 и опенсорс Grok-2: «бесплатно потыкать» — да, в прод — пока нет
Код-модель быстрая и дешёвая, но по бенчам она скромна. Хороша, чтобы раскидать идеи/болванки в курсоре/VSCode. В проде для критичных задач оставить GPT-5/Claude-3.5.
7. Видео-гонка: PixVerse v5, Minimax keyframe, Krea Realtime-рестайлинг
Что нового:
- PixVerse v5 — сильные результаты на арене, реалистичнее движения.
- Minimax — генерация между двумя ключевыми кадрами (стабильнее переходы).
- Krea Realtime — рестайлинг видео «на лету», кадры трансформируются плавно, а не диффузятся.
Совет: держите дешёвый стек: Krea/Runway для серийки, Veo-3 — точечно, где нужен вау-эффект (дорого).
8. Apple FastVLM (HF): бесплатный авто-описатель видео с приемлемым качеством
Зачем вам:
- Реферирование длинных записей (демо, созвоны).
- Индексация UGC/вебинаров по содержанию.
- База данных фрагментов для RAG (перепривязка к FAQ/гайды).
Как внедрить:
- Берёте пайплайн: видео → посекундные описания → chunking → векторная БД.
- Простой поиск «покажи, где мы говорим про X», и ассистент кидает метку времени.
9. Open-source аудио-генерация SOTA: звук, который не стыдно подкладывать
Музыка/FX/амбисоника под видео теперь без стоков. Пакуйте в пайплайн генерации видео → ген звук → мастеринг. Отлично для рекламных тизеров, explainer-роликов.
10. Hixfield: 2 000 мини-аппов «картинка → видео» и Speak-липсинки
Кейсы для SMM:
- Быстрая анимация статичных креативов (вращение, zoom, 3D-иллюзия).
- Липсинк для локализации роликов без перезаписи.
- Сборник «темплейтов» для контент-плана (ставите стандарты под брендинг).
11. ComfyUI + NVIDIA: до 40% ускорения генерации изображений
Кому жить: тем, кто гонит серийные креативы/лендинговую графику. На GRID/RTX локально теперь можно реально работать, а не ждать. Практика: соберите один стабильный workflow (контроль поз/фон/стилизация), на нём и делайте серийку.
12. «Чтение мыслей»: академическое — да, домашнее шапито — нет (пока)
Факт: лабораторные системы уже декодируют мысленные команды/слова (с ЭЭГ/инвазивные датчики). Это про помощь людям с параличом. Опасность — «прозрачность мыслей»: система улавливает то, что вы не хотели сказать (внутренний счёт, случайные образы).
Что сделать бизнесу:
- Внести в политику приватности запрет на сбор нейровоздействий без явного согласия.
- Для проектов с биометрией — этический комитет/чек-лист (параметры, время хранения, отзыв согласия).
- PR-готовность: «Мы не читаем мысли» — и объяснение, что реально собирается.
Роботы играют в пинг-понг, а мы — в план
Да, роботы докачались до стабильной «соточки» в настольном теннисе. Для нас смысл простой: моторика+зрение скоро будут стоить дёшево. Рыночная дистанция до роботов-промоутеров/укладчиков/курьеров — сокращается. Планируйте человек+агент+робот-процессы уже в 2026-м.
Вопрос к вам
Что из этого вы уже пробовали? Голосовые ассистенты, real-time рестайлинг, автоописание видео? Где «зашло», а где сломалось? Напишите в комментариях — разберём кейсы/ошибки.
Частые ошибки (и как их не делать)
- Ошибка: «Попросим ИИ думать пошагово — будет умнее». Правильно: для GPT-5 задайте критерии, тесты и формат вывода, а не «думай».
- Ошибка: «Возьмём дорогой Veo-3 на весь контент-план». Правильно: 80% серийки — Krea/Runway; Veo — под витринный контент.
- Ошибка: «Запустим голосового бота без эскалации». Правильно: правило 90/10 — 90% закрывает бот, 10% уходит к живому оператору.
Кратко, что важно запомнить
- Голос real-time стал зрелым: делайте 24/7 фронт поддержки/пресейла.
- Единая GPT-5 с роутером меняет правила — меньше выбора моделей, больше фокуса на задаче.
- Видео ускорилось и подешевело: завод контента — не роскошь, а must-have для маркетинга.
- Бренд-защита от deepfake — это уже не юрподвеска, а часть продуктовой ответственности.
- Автоописание видео (FastVLM) — ваш бесплатный RAG-костыль для корпоративной памяти.
Забирай мой бесплатный закрытый урок и схему по выходу на стабильный доход через AI-ботов по ссылке ниже
👉 Закрытый урок →https://clck.ru/3NxEb3
Подробнее про рынок нейросетей рассказываю на своем YouTube канале
На связи был Ринат. Увидимся в закрытом уроке!