Китайская Alibaba выпустила ИИ-модель QVQ — она может рассуждать и анализировать изображения
Доступна бесплатная демоверсия.
- QvQ-72B-Preview — мультимодальная ИИ-модели с открытым исходным кодом, которая может анализировать графики и изображения, чтобы решать задачи. Демоверсия доступна на Hugging Face, код есть на GitHub.
- Разработчики заявляют, что QvQ-72B лучше показывает себя в математике, по сравнению с o1 и GPT-4o от OpenAI и Claude 3.5 Sonnet. В примере на сайте компании нейросеть решает математическую задачу, используя данные из таблицы.
- В коротком тесте редактора vc.ru модель смогла проанализировать изображение и дать верный ответ на задачу по физике. Она понимает запросы на русском, при этом показывает цепочку рассуждений на английском.
- Это экспериментальная версия, она может менять язык и выдавать «многословные ответы без каких-либо выводов», предупреждают в компании.
- Alibaba Cloud выпустила свою первую модель с возможностью рассуждений QwQ-32B-Preview 27 ноября 2024 года. Она может обрабатывать запросы на 32 тысячи слов, а в некоторых тестах превосходит модель o1 от OpenAI. Также доступна по лицензии Apache 2.0 на Hugging Face.
- Другие модели с возможностью рассуждений — Gemini 2.0 Flash Thinking от Google, o1 и o3 от OpenAI и китайская DeepSeek 2.5. Все они могут анализировать визуальный контент.
Я не верю тому, что они говорят, и вы тоже не должны верить. А если быть последовательным, то и вы не должны доверять моим словам. Но я докажу свои слова фактами и доказательствами.
По словам стартапа, в двух тестах Janus-Pro-7B превосходит Stable Diffusion 3 Medium и DALL-E 3 от OpenAI.
Исследователи предполагают, что причина не только в иностранных данных для обучения, пишет TechCrunch.
Microsoft пока не возвращается в Россию, из-за чего пользователи Microsoft Project сталкиваются со сложностями: поддержки нет, перейти на новые версии нельзя и связать с другими системами тоже. У этих проблем есть решение — отечественные аналоги. Один из них — система Kaiten, которая в чем-то даже превосходит зарубежный продукт.
Необычное время выхода Qwen 2.5-Max — в первый день Лунного Нового года, когда большинство китайцев отдыхают и проводят время с семьями, — указывает на то, что стремительный рост китайского стартапа DeepSeek за последние три недели оказал давление не только на зарубежных конкурентов, но и на местных.
Впервые после релиза рассуждающих моделей обеих компаний состоялось серьезное мероприятие, и можно независимо оценить качество решений моделей.
На прошлой неделе DeepSeek поверг в шок технологический и финансовый рынок США, заявив, что смог создать свою модель в 20 раз дешевле, чем у OpenAI. А тут – даже не за $6 000, а $50! И не китайцы (голь на выдумку хитра), а американцы! О чем речь и почему это так важно?
перестаньте использовать везде слово "ИИ".
Ехал ИИ через ИИ,
Видит ИИ в ИИ Мак
Сунул ИИ ИИ в ИИ
Мак за ИИ ИИ цап!
Искусственный интеллект звучит лучше? Или нейросеть