Новости нейросетей - декабрь 2024

Обзор нейросети Sora от OpenAI: создание видео и сравнение с конкурентами

OpenAI представила миру Sora, нейросеть, генерирующую видео по текстовому описанию. Пока Sora не идеальна: наблюдаются сложности с анимацией, особенно конечностей персонажей. Однако потенциал Sora огромен. Нейросеть способна создавать сложные сцены с несколькими объектами и персонажами, редактировать видео, следуя текстовым инструкциям пользователя, и даже реалистично анимировать объекты. Если сравнивать Sora с конкурентами, такими как китайская модель Halucination или Runway, то можно заметить, что у каждой модели свои сильные и слабые стороны. Halucination хорошо справляется с генерацией, но также имеет проблемы с анимацией ног. Runway пока отстает по качеству и разнообразию движений в кадре. В целом, Sora — это прорыв в области генерации видео, хотя и требует дальнейшего совершенствования.

Gemini 2.0 от Google: возможности новой мультимодальной нейросети и доступ в AI Studio

Google выпустил Gemini 2.0 — мощную мультимодальную нейросеть нового поколения. Gemini 2.0 способна обрабатывать не только текст, но и изображения, аудио и видео. По результатам бенчмарков, Gemini 2.0 превосходит свою предыдущую версию и многих конкурентов, демонстрируя впечатляющие результаты в понимании контекста и генерации текста, а также в работе с другими модальностями. Отличительная особенность Gemini 2.0 — умение искать информацию в интернете и интегрироваться с другими сервисами Google, например, с Google Картами. Это открывает совершенно новые возможности для пользователей.

Новости нейросетей: Chat GPT, Midjourney, Grok и умное кольцо от Сбера

В мире нейросетей постоянно происходят изменения. Chat GPT от OpenAI получил важные обновления: добавлена функция Screen Share, позволяющая пользователям делиться своим экраном с нейросетью для более эффективного обучения и решения задач.

Также реализована интеграция с Apple, благодаря которой Siri может отправлять запросы в Chat GPT. Стоимость подписки Chat GPT Pro остается на уровне 200 долларов в месяц.

Midjourney представила Patchwork — инновационный инструмент для совместной работы над изображениями и создания уникальных визуальных миров.

Компания Илона Маска x разработала нейросеть Grok, которая умеет искать информацию в интернете и показывает отличные результаты в тестах на понимание инструкций.

Сбербанк не отстает от мировых трендов и представил умное кольцо с нейросетью GigaChat, способной анализировать показатели здоровья пользователя, такие как сон, стресс и физическая активность.

3 комментария

Дело в том что Сору очень громко презентовали и было просто огромное количество завышенных ожиданий, что естественно дало свои результаты. Однако мы знаем, что компания все доводит до идеала и ожидаем что Сора в конечном итоге станет именно той моделью которую нам представили на презентации когда то давно)

Это еще что - помните как первую модель Джемини презентовали и что получилось в итоге))) Главное что технология есть и она будет развиваться)