😮 Что произошло в мире AI за неделю
На этой неделе было очень много обнов и новостей, поэтому обо всем рассакажу очень кратенько.Поехали!
😎 Tencent выкатил HunyuanVideo-Avatar — нейронку, которая оживляет фотографии. Загружаете фото + аудио (до 14 секунд) — ИИ сам понимает контекст сцены и эмоции, а потом создает реалистичную говорящую/поющую картинку. Фишка в том, что нейронка поддерживает любые стили: фотореализм, мультяшный, 3D-рендеры и т. д. Умеет делать портреты, видео по пояс и в полный рост.
🤯 Captions запустил Mirage Studio — первую нейронку для создания ультрареалистичных видео с актерами, которые смотрятся как живые. Просто загружаете аудио или описываете сцену, и ИИ генерит полноценное видео с микровыражениями, жестами и эмоциями. Бесплатно дают 600 кредитов (примерно 60 секунд видео), платная подписка стоит $399/месяц за 8000 кредитов. Новичкам первый месяц со скидкой 50% — $199
😏 Microsoft выпустил Bing Video Creator на базе Sora. Пока доступен только в мобильном приложении Bing. Генерит видео по 5 секунд в формате 9:16 (скоро появится 16:9). Можно ставить в очередь максимум 3 видео одновременно, сохраняются они 90 дней. Бесплатникам дают 10 быстрых генераций.
🎩Компания H выкатила бета-версию Runner H — одного из самых продвинутых ИИ-агентов. Ое умеет разбираться в интерфейсах, перемещаться по сети, кликать, писать, скачивать файлы, автоматически логиниться и управлять разными задачами. Доступно бесплатно в бета-тесте.
🕺Suno обновился по-крупному: теперь в нейронке есть улучшенный редактор песен с возможностью любых изменений, извлечение стемов (разделение трека на 12 чистых стемов — вокал, ударные, бас), расширенные загрузки полных песен до 8 минут и творческие ползунки для управления генерацией.
🧠Manus добавил генерацию видео — пишете подсказки, а нейронка превращает их в полноценные истории со структурой, последовательностью и готовыми кадрами к просмотру. Одна подсказка — и Manus планирует каждую сцену, создает визуальные эффекты и оживляет ваше видение. Доступно для пользователей Basic, Plus, Pro.
😃Fish Audio выпустил OpenAudio S1 — передовую модель преобразования текста в речь. Обучена на 2+ миллионах часов аудио, поэтому генерации получаются естественными и выразительными. Идеально для видео, аудиокниг, подкастов, ИИ-компаньонов и игр.
📸 ChatGPT получил три крупных обновления: подключение к внутренним источникам (Outlook, Teams, Google Drive, Gmail) с получением данных в реальном времени, режим записи для пользователей Team на macOS (расшифровка встреч и голосовых заметок с извлечением ключевых моментов) и возможность использовать DeepResearch для поиска информации в ваших данных.
😚Luma выпустил Modify Video — инструмент для редактирования видео через обычный текст или изображения. Теперь обычными запросами можно менять цвета, стили, объекты, окружение или мгновенно обрабатывать уже отснятый материал.
🗿Google обновил Gemini 2.5 Pro — теперь он превосходит конкурентов в программировании, математике, естественных науках и рассуждениях. Плюс улучшили стиль и структуру для более отформатированных ответов.
👀 HeyGen выпустил AI Studio с полным контролем над аватарами: дублирование голоса (загружаете/записываете голос — аватар его копирует), автоматические субтитры с настройкой стилей, режиссер озвучивания с разными тонами (спокойный, взволнованный, сердитый), фоновая музыка из библиотеки + загрузка своей, переходы между сценами.
❤Higgsfield добавил Speak — быстрый способ создавать видео с говорящими героями. Выбираете стиль и аватар, вводите скрипт — получаете полноценный ролик с озвучкой и реалистичными эмоциями. Доступно 16 встроенных типов сцен: видеоблог, стрим, подкаст, автомобильный разговор, коучинг, мода, красота и многое другое.
🤨Eleven Labs выпустил v3 — самую выразительную модель преобразования текста в речь. Поддерживает 70+ языков, диалоги с несколькими говорящими и звуковые теги типа [взволнованный], [вздох], [смех], [шепот]. Новая архитектура глубоко понимает текст и обеспечивает намного большую выразительность.
Подписывайтесь на Telegram-канал Нейроцех.