Обзор новостей AI за неделю: новые инструменты и технологии

😮 Что произошло в мире AI за неделю

Обзор новостей AI за неделю: новые инструменты и технологии

Буквально 2 недели мы с вами отдыхали и разрабы не закидывали нас новыми апдейтами, как опять началось: вайб-кодинг, генерация музыки, МСР и многое другое. Вот самое основное:

💪 Anthropic выпустил каталог Connectorsс большим количеством тщательно отобранных MCP. Теперь к профилю в один клик можно подключить Figma, Notion, Stripe и множество других коннекторов.

🤵 ♂ Runway выкатили новую модель захвата движений — Act-Two. Это новая модель захвата движений с улучшенным качеством генерации Она способна анимировать любого персонажа одним движением, включая голову, мимику, верхнюю часть тела, руки и фон. В ближайшие дни откроют доступ для всех желающих.

😱 NotebookLM от Google выпустил Featured Notebooks. Featured Notebooks — это коллекции, составленные экспертами и охватывающие науку, литературу, историю и многое другое. Короче, новый вид онлайн-библиотеки, где нейронка голос расскажет вам о любой вещи.

😐 Amazon выпустил бесплатный инструмент для вайб-кодеров — Kiro. Это не просто редактор кода с AI-помощником, а целая среда для разработки. Вы можете описать, что именно хотите создать простым языком или схемами, а Kiro поймёт задачу и начнёт действовать. Дополнительно Kiro автоматически выполняет скучные, но важные задачи: пишет документацию, создаёт тесты и оптимизирует производительность.

Пока Kiro доступен бесплатно в бета-версии и поддерживает большинство популярных языков программирования.

😂Mistral представил открытые модели распознавания речи — Voxtral 3B и Voxtral 24B. Модели лучше других существующих переводит текст в речь и побеждает GPT-4o mini Transcribe и Gemini 2.5 Flash во всех задачах. За раз модель может транскрибировать до 30 минут аудио или прослушать 40 минут записи для осмысленного общения.

Также в модели есть встроенные функции вопросов и ответов и обобщения. Вы можете задавать вопросы непосредственно об аудиоконтенте или генерировать структурированные резюме.

😁Higgsfield представил Higgsfield UGC Builder. UGC Builder позволяет создавать полноценное рекламное видео с любым персонажем и товаром в кадре. Просто загружаете лицо и товар, выбираете анимацию и получаете полностью отыгранную сцену.

😂 OpenAI выпустил режим агента в ChatGPT. Этот новый мощный ИИ-агент сочетает в себе глубокие исследования, поиск или просмотр веб-страниц, компьютерные операции и многое другое.

Вы можете запустить несколько маленьких «работников», чтобы они выполняли задачи и следили за тем, как они одновременно просматривают ваш список дел. Доступно последовательно для планов Pro, Plus и Teams.

😃 Вышла ИИ-модель клонирования голоса — EVI 1 от Hume AI. Это новая модель преобразования речи в речь, которая клонирует любой стиль речи всего за 15-20 секунд аудио. И позволяет озвучить любой текст с эмоциями, паузами и т. д.

🤨Manus выпустил функцию визуализацию данных. Теперь вы можете загружать необработанные данные и превращать их в интерактивные диаграммы и презентации.

Подписывайтесь на Telegram Нейроцех.

Начать дискуссию