FABULAai

+219
с 2024
12 подписчиков
0 подписок

OpenAI снова наделали шума в мире искусственного интеллекта, запустив preview-версию своей новой модели o1, также известной как Strawberry (и Q* для тех, кто в теме). Эта модель — следующий шаг после GPT-4o и обещает значительно улучшить способность машин к рассуждениям.

Что это значит для нас, простых пользователей? Вот краткий гид:

Adobe представила Firefly Video Model — инструмент, который поможет создавать видео с помощью текстовых запросов. Эта модель была анонсирована как часть генеративных AI решений Adobe, уже применяемых для фото и дизайна, и теперь она будет доступна и для видеомонтажа.

Что умеет Firefly Video?

StoryGraph — бесплатное приложение для тех, кто хочет не только отслеживать прочитанные книги, но и получать более глубокое понимание своих читательских привычек. Приложение предлагает детализированную статистику: количество книг, страниц, скорость чтения по месяцам и даже анализ настроения при выборе книг.

FusionBrain Lab представила новый метод редактирования изображений под названием Guide-and-Rescale, который был принят на конференцию ECCV 2024. Этот метод использует диффузионные модели для выполнения изменений в изображениях на основе текстовых описаний, сохраняя при этом основные структурные элементы.

FusionBrain Lab анонсировала новый метод редактирования изображений Guide-and-Rescale

В то время как одни стартапы едва дотягивают до своего первого года, компания Safe Superintelligence (SSI), основанная уроженцем Нижнего Новгорода Ильей Суцкевером, бывшим главой науки OpenAI, привлекла ошеломляющие 1 миллиард долларов всего за три месяца своего существования. Оценка стартапа на данный момент составляет колоссальные 5 миллиардов до…

Появился новый инструмент для создания музыки — Melodio AI, который предлагает пользователям возможность генерировать бесконечные музыкальные потоки, идеально подходящие под их настроение или задачи. Это особенно полезно для YouTube-каналов, стримингов, или как фоновая музыка для работы или отдыха. Сервис обещает адаптироваться в реальном времени,…

Melodio AI: бесконечная генерация text2music

FluxMusic — это новый проект, который предлагает способ создания музыки на основе текстовых описаний, используя архитектуру Flux. По замыслу модель напоминает такие проекты, как Stable Audio и MusicLM, но с уникальной реализацией диффузионной модели с ректифицированным потоком.

Как работает FluxMusic? Основная идея FluxMusic — преобразовывать…

Вышла MARS5 — нейросеть от CAMB.AI, способная клонировать голос на более чем 140 языках. Это одна из самых многоязычных моделей среди аналогов. Ключевая особенность MARS5 — способность сохранять интонацию и эмоциональную окраску оригинального голоса при клонировании.

1

Компания Luma выпустила обновление для своего популярного генератора видео Dream Machine, добавив в версию 1.6 расширенные возможности управления виртуальной камерой. Теперь пользователи могут не только создавать впечатляющие 3D-анимации, но и управлять движением камеры, добавляя динамики и глубины в свои проекты.

2

Тиаго Порто, человек с внушительным послужным списком, связанный с такими гигантами, как Mill VFX, Deep Voodoo LA и Technicolor, заставляет мир машинного обучения и компьютерного зрения двигаться в новом направлении. Его работа на передовой постпродакшена говорит о том, что за плечами у него не одна тысяча часов работы с топовыми студиями по всему…

1

Команда Hugging Face представила новую разработку — Speech-to-Speech модель, которая, по их словам, является шагом на пути к созданию опенсорсной и модульной версии GPT-4. В отличие от мультимодальных решений от OpenAI, эта модель построена на основе комбинации отдельных компонентов, что дает пользователям больше гибкости.

Проект собрал уже б…

1

Napkin AI представляет новый подход к созданию визуального контента, превращая текст в наглядные графики и схемы. Этот инструмент может стать полезным для улучшения презентаций, отчетов и других документов.

1