25.12.2024

Китайская Alibaba выпустила ИИ-модель QVQ — она может рассуждать и анализировать изображения

Доступна бесплатная демоверсия.

QvQ-72B-Preview — мультимодальная ИИ-модели с открытым исходным кодом, которая может анализировать графики и изображения, чтобы решать задачи. Демоверсия доступна на Hugging Face, код есть на GitHub.
Разработчики заявляют, что QvQ-72B лучше показывает себя в математике, по сравнению с o1 и GPT-4o от OpenAI и Claude 3.5 Sonnet. В примере на сайте компании нейросеть решает математическую задачу, используя данные из таблицы.

В коротком тесте редактора vc.ru модель смогла проанализировать изображение и дать верный ответ на задачу по физике. Она понимает запросы на русском, при этом показывает цепочку рассуждений на английском.

Слева изображение для анализа, справа — «рассуждения» модели.

Это экспериментальная версия, она может менять язык и выдавать «многословные ответы без каких-либо выводов», предупреждают в компании.

Alibaba Cloud выпустила свою первую модель с возможностью рассуждений QwQ-32B-Preview 27 ноября 2024 года. Она может обрабатывать запросы на 32 тысячи слов, а в некоторых тестах превосходит модель o1 от OpenAI. Также доступна по лицензии Apache 2.0 на Hugging Face.
Другие модели с возможностью рассуждений — Gemini 2.0 Flash Thinking от Google, o1 и o3 от OpenAI и китайская DeepSeek 2.5. Все они могут анализировать визуальный контент.

#новости

1414

разместить

41 комментарий

Наил

25.12.2024

перестаньте использовать везде слово "ИИ".

Ответить

Griby Lenina

25.12.2024

Ехал ИИ через ИИ,
Видит ИИ в ИИ Мак
Сунул ИИ ИИ в ИИ
Мак за ИИ ИИ цап!

Ответить

Edward

25.12.2024

Искусственный интеллект звучит лучше? Или нейросеть

Ответить

Раскрывать всегда

NeuroЭнтузиаст (Алексей)

28 янв

DeepSeek-R1? Не доверяйте новостям. Действительно ли эта модель с открытым исходным кодом превосходит даже OpenAI, или это очередная фейковая новость?

Я не верю тому, что они говорят, и вы тоже не должны верить. А если быть последовательным, то и вы не должны доверять моим словам. Но я докажу свои слова фактами и доказательствами.

2626

Ася Карпова

29 янв

Новая Qwen 2.5-Max от Alibaba и модели DeepSeek — чем отличаются продукты китайских разработчиков

Последняя модель Qwen, по заявлениям компании, превосходит DeepSeek V3.

Qwen 2.5-Max написала код для игры «Змейка»

3131

Fred Lao

Мнения

12м

Между утопией и инновацией: вечный вопрос «Что делать?»

Непервоапрельское.

Таня Боброва

27 янв

Китайский DeepSeek представил модели Janus Pro для генерации картинок

По словам стартапа, в двух тестах Janus-Pro-7B превосходит Stable Diffusion 3 Medium и DALL-E 3 от OpenAI.

Сравнение результатов Janus и Janus-Pro-7B. Источник: DeepSeek

3232

Ребята решили просто уничтожить кое-кого и заодно обвалить свои серваки (-: Но и молодцы, давайте! К утру должна быть новость о запуске опенсорсного Скайнет 😁

Ася Карпова

ChatGPT

15 янв

Пользователи заметили, что o1 от OpenAI может неконтролируемо переключаться на китайский и другие языки во время решения задач

Исследователи предполагают, что причина не только в иностранных данных для обучения, пишет TechCrunch.

Ася Карпова

20 янв

Китайские разработчики выпустили модель DeepSeek-R1 «уровня» o1 от OpenAI

Ей можно задавать 50 бесплатных запросов в день.

Показатели o1, R1 и других моделей DeepSeek в тестах на математику, программирование и логику. Источник: DeepSeek

1717

Все "непродажные" паблики: "ОН ЛУЧШЕ, чем ChatGPT 4o".. Правда только на 0,6 процентов (не везде) + цензура как при диктатуре

Microsoft Project вам не понадобится: рассказываем про достойную замену системы

Microsoft пока не возвращается в Россию, из-за чего пользователи Microsoft Project сталкиваются со сложностями: поддержки нет, перейти на новые версии нельзя и связать с другими системами тоже. У этих проблем есть решение — отечественные аналоги. Один из них — система Kaiten, которая в чем-то даже превосходит зарубежный продукт.

Alibaba выпустила модель ИИ Qwen 2.5 которая, по ее словам, превосходит DeepSeek и GPT-4o🧧🎆

Необычное время выхода Qwen 2.5-Max — в первый день Лунного Нового года, когда большинство китайцев отдыхают и проводят время с семьями, — указывает на то, что стремительный рост китайского стартапа DeepSeek за последние три недели оказал давление не только на зарубежных конкурентов, но и на местных.

Кто лучше решает задачи: DeepSeek или ChatGPT?

Впервые после релиза рассуждающих моделей обеих компаний состоялось серьезное мероприятие, и можно независимо оценить качество решений моделей.

<a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fmatharena.ai%2F&postId=1800028" rel="nofollow noreferrer noopener" target="_blank">Источник</a>

Alibaba представила Qwen 2.5-Omni-7B — мультимодальную модель с открытым кодом

Она распознаёт текст, изображения, аудио и видео, а также отвечает текстом и голосом.

Andrey Butakov

28 февр

🤯 Обзор актуальных LLM

Наташа Хазеева

7 февр

Исследователи обучили конкурента OpenAI за полчаса и менее чем за $50

На прошлой неделе DeepSeek поверг в шок технологический и финансовый рынок США, заявив, что смог создать свою модель в 20 раз дешевле, чем у OpenAI. А тут – даже не за $6 000, а $50! И не китайцы (голь на выдумку хитра), а американцы! О чем речь и почему это так важно?

Знаменитый простой вопрос, на котором ломаются многие ИИ модели. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Farxiv.org%2Fpdf%2F2501.19393&postId=1797795" rel="nofollow noreferrer noopener" target="_blank">Источник</a><br />