Что произошло в мире AI за неделю
Да в целом ничего серьезного, так, пару мелких анонсов и все на этом. Но не тут то было, эта неделя — еще одна череда громких выходов и обновлений. Вот, что случилось на этот раз:
👀 Google выпустил свой генератор речи. В нем можно сделать крутую озвучку и даже выбрать несколько спикеров для создания полноценного подкаста. Пока доступно бесплатно, поддерживает русский язык.
🤡 Появился ИИ-агент для UI-дизайна и веб-разработки HeroUI. В нем достаточно написать, какое приложение или сайт вы хотите — агент сам соберет интерфейс, добавит стили, анимации и предложит готовый результат. Можно загружать референсные изображения,например, скриншоты сайтов — агент повторит их почти точно. Либо импортировать макеты из Figma, а также усиливать подсказки через специальный бустер — он добавит детали по структуре, стилю и функционалу. Есть бесплатный тариф — 5 генераций в день. Этого хватит, чтобы собрать 1–2 макета. Платные подписки стартуют от $20 в месяц.
💪 Telegram и xAI договорились о партнерстве сроком на 1 год. Правда, договорился только Дуров с Маском пока что, Маск с Дуровым не договорился 😎. Но это вопрос времени. Говорят, на основе Grok можно будет генерить тексты, создавать стикеры, обрабатывать информацию, управлять чатами и настроить автоматическую генерацию ответов. Кстати, напоминаем — премиум пользователи могут использовать Grok бесплатно прямо в Telegram.
🗿 DeepSeek обновили свои модельки. Теперь нейронка рассуждает намного глубже, как модели от Google. При этом нейросеть стала лучше писать и форматировать текста. А еще модель может тратить на одну задачу до 30–60 минут непрерывной работы и не ломаться.
😱 Релизнулся главный конкурент VEO 3 — Kling 2.1. Вышло сразу две версии: обычный Kling 2.1 работает в стандартном (720p) и профессиональном (1080p). И Kling 2.1 Master, который отлично понимает физику движений, создает кинематографичные кадры в разрешении 1080p.
👏 Opera анонсировала Opera Neon — браузер со встроенным ИИ-агентом, который cможет сам читать страницы, давать советы, заполнять формы и даже покупать билеты/ В браузере будет 3 функции: Neon Chat, Neon Do и Neon Make. C Neon Chat можно будет общаться на любые темы и отвечать в контексте открытой страницы. Neon Do будет выполнять задачи по команде: заполнять формы, бронировать поездки и добавлять вещи в корзину - автоматически. А Neon Make сможет планировать, исследовать, строить и доставлять. Полный доступ будет по подписке, но сейчас можно попасть в лист ожидания — через Discord.
😨 Perplexity выкатил новый инструмент — Perplexity Labs, который может разрабатывать и развертывать интерактивные мини-приложения прямо в вашем проекте — базовые дашборды, слайд-шоу и веб-сайты. Все созданные файлы: документы, таблицы, диаграммы, изображения, код — будут храниться в папке «Активы». Доступ пока только у Pro-подписчиков.
👀 Black Forest Labs выпустили FLUX.1 Kontext — набор моделей с фокусом на сохранение персонажей и точечное редактирование. Основные фишки: согласованность персонажей и сохранение элементов в разных сценах, локальное редактирование отдельных частей на фото без влияния на остальное изображение, быстрая скорость генерации.
☺ Runway добавил Layout Sketch для Gen-4 References — теперь в нейронке можно рисовать эскизы с нуля или прямо поверх уже сгенерированных картинок, чтобы добавить новые элементы. Поддерживается во всех тарифах.
Подписывайтесь на Telegram-канал Нейроцех.