Китайская Alibaba выпустила ИИ-модель QVQ — она может рассуждать и анализировать изображения

Доступна бесплатная демоверсия.

  • QvQ-72B-Preview — мультимодальная ИИ-модели с открытым исходным кодом, которая может анализировать графики и изображения, чтобы решать задачи. Демоверсия доступна на Hugging Face, код есть на GitHub.
  • Разработчики заявляют, что QvQ-72B лучше показывает себя в математике, по сравнению с o1 и GPT-4o от OpenAI и Claude 3.5 Sonnet. В примере на сайте компании нейросеть решает математическую задачу, используя данные из таблицы.
Источник: Qwen
Источник: Qwen
  • В коротком тесте редактора vc.ru модель смогла проанализировать изображение и дать верный ответ на задачу по физике. Она понимает запросы на русском, при этом показывает цепочку рассуждений на английском.
Слева изображение для анализа, справа — «рассуждения» модели.
Слева изображение для анализа, справа — «рассуждения» модели.
Итоговый ответ модель дала на русском.
Итоговый ответ модель дала на русском.
  • Это экспериментальная версия, она может менять язык и выдавать «многословные ответы без каких-либо выводов», предупреждают в компании.
  • Alibaba Cloud выпустила свою первую модель с возможностью рассуждений QwQ-32B-Preview 27 ноября 2024 года. Она может обрабатывать запросы на 32 тысячи слов, а в некоторых тестах превосходит модель o1 от OpenAI. Также доступна по лицензии Apache 2.0 на Hugging Face.
  • Другие модели с возможностью рассуждений — Gemini 2.0 Flash Thinking от Google, o1 и o3 от OpenAI и китайская DeepSeek 2.5. Все они могут анализировать визуальный контент.
44
44
11
11
37 комментариев

перестаньте использовать везде слово "ИИ".

2

Ехал ИИ через ИИ,
Видит ИИ в ИИ Мак
Сунул ИИ ИИ в ИИ
Мак за ИИ ИИ цап!

5

Искусственный интеллект звучит лучше? Или нейросеть

Только это не слово, это сокращение двух слов) Так просто удобнее писать

А привыкайте, без ИИ уже никуда не деться на сегодняшний день. Наоборот будет тревожно, если мы не встретим эти волшебные "ИИ" хоть один день)))

А как? Все, что похоже на ИИ или имитирует ИИ - давно так и называют для упрощения.
Вас же не бесили статьи об ИИ в играх, где иногда просто 10 строчек if/else .

А он подскажет если товар говно?

2