Обзор новостей AI за неделю: новые инструменты и технологии
😮 Что произошло в мире AI за неделю
Буквально 2 недели мы с вами отдыхали и разрабы не закидывали нас новыми апдейтами, как опять началось: вайб-кодинг, генерация музыки, МСР и многое другое. Вот самое основное:
💪 Anthropic выпустил каталог Connectorsс большим количеством тщательно отобранных MCP. Теперь к профилю в один клик можно подключить Figma, Notion, Stripe и множество других коннекторов.
🤵 ♂ Runway выкатили новую модель захвата движений — Act-Two. Это новая модель захвата движений с улучшенным качеством генерации Она способна анимировать любого персонажа одним движением, включая голову, мимику, верхнюю часть тела, руки и фон. В ближайшие дни откроют доступ для всех желающих.
😱 NotebookLM от Google выпустил Featured Notebooks. Featured Notebooks — это коллекции, составленные экспертами и охватывающие науку, литературу, историю и многое другое. Короче, новый вид онлайн-библиотеки, где нейронка голос расскажет вам о любой вещи.
😐 Amazon выпустил бесплатный инструмент для вайб-кодеров — Kiro. Это не просто редактор кода с AI-помощником, а целая среда для разработки. Вы можете описать, что именно хотите создать простым языком или схемами, а Kiro поймёт задачу и начнёт действовать. Дополнительно Kiro автоматически выполняет скучные, но важные задачи: пишет документацию, создаёт тесты и оптимизирует производительность.
Пока Kiro доступен бесплатно в бета-версии и поддерживает большинство популярных языков программирования.
😂Mistral представил открытые модели распознавания речи — Voxtral 3B и Voxtral 24B. Модели лучше других существующих переводит текст в речь и побеждает GPT-4o mini Transcribe и Gemini 2.5 Flash во всех задачах. За раз модель может транскрибировать до 30 минут аудио или прослушать 40 минут записи для осмысленного общения.
Также в модели есть встроенные функции вопросов и ответов и обобщения. Вы можете задавать вопросы непосредственно об аудиоконтенте или генерировать структурированные резюме.
😁Higgsfield представил Higgsfield UGC Builder. UGC Builder позволяет создавать полноценное рекламное видео с любым персонажем и товаром в кадре. Просто загружаете лицо и товар, выбираете анимацию и получаете полностью отыгранную сцену.
😂 OpenAI выпустил режим агента в ChatGPT. Этот новый мощный ИИ-агент сочетает в себе глубокие исследования, поиск или просмотр веб-страниц, компьютерные операции и многое другое.
Вы можете запустить несколько маленьких «работников», чтобы они выполняли задачи и следили за тем, как они одновременно просматривают ваш список дел. Доступно последовательно для планов Pro, Plus и Teams.
🤨Manus выпустил функцию визуализацию данных. Теперь вы можете загружать необработанные данные и превращать их в интерактивные диаграммы и презентации.
Подписывайтесь на Telegram Нейроцех.