Alibaba выпустила модель ИИ Qwen 2.5 которая, по ее словам, превосходит DeepSeek и GPT-4o🧧🎆
Необычное время выхода Qwen 2.5-Max — в первый день Лунного Нового года, когда большинство китайцев отдыхают и проводят время с семьями, — указывает на то, что стремительный рост китайского стартапа DeepSeek за последние три недели оказал давление не только на зарубежных конкурентов, но и на местных.
Следим за развитием гонки моделей ИИ 😎 и подписываемся на мой ТГ-канал:
«Qwen 2.5-Max превосходит почти по всем параметрам GPT-4o, DeepSeek-V3 и Llama-3.1-405B», — говорится в объявлении облачного подразделения Alibaba, опубликованном в официальном аккаунте WeChat.
Qwen2.5-VL привносит мультимодальные возможности в портфолио Alibaba Cloud
Визуально-языковая модель Qwen2.5-VL компании расширяет возможности своей предшественницы, предлагая размеры параметров от 3 до 72 миллиардов. Технология объединяет текстовую и визуальную обработку для анализа изображений, диаграмм и видеоконтента.
Модель обрабатывает видеоконтент, длительность которого превышает один час, и определяет конкретные временные сегменты для запросов. Эта возможность позволяет пользователям выполнять поиск в видеоконтенте и извлекать информацию из определенных моментов.
Основная функция Qwen2.5-VL — это функциональность вывода структурированных данных. Технология включает в себя функции анализа и локализации, которые позволяют ей работать как визуальному помощнику для задач компьютера и мобильного устройства.
Флагманская модель Qwen2.5-VL-72B-Instruct доступна через платформу Qwen Chat. Модель демонстрирует возможности чтения документов, интерпретации диаграмм и визуального ответа на вопросы в различных секторах, включая образование и математику.
Alibaba Cloud представляет контекст на миллион токенов с Qwen2.5-1M
Alibaba Cloud также объявила о запуске Qwen2.5-1M, версии своей языковой модели, способной обрабатывать до миллиона токенов. Токены — это основные единицы текста, которые обрабатывают языковые модели, причем каждый токен обычно представляет слово или часть слова.
- Qwen2.5-1M обрабатывает до 1 миллиона токенов в одном контекстном окне
- Новая структура обрабатывает входные данные в 3–7 раз быстрее, чем традиционные методы
- Qwen2.5-VL предлагает версии от 3 до 72 миллиардов параметров.
Согласно технической документации компании, платформа обрабатывает миллионы токенов со скоростью, в три-семь раз превышающей скорость традиционных методов.
Qwen2.5-VL и Qwen2.5-1M доступны через каналы с открытым исходным кодом, включая Hugging Face и Model Scope, платформу сообщества разработчиков Alibaba.
Китайский технологический гигант Alibaba представил новую версию своей модели искусственного интеллекта — Qwen 2.5-Max, заявив, что она превосходит недавно выпущенную DeepSeek-V3. Примечательно, что релиз состоялся в первый день Лунного Нового года, что подчеркивает стремление Alibaba укрепить свои позиции на фоне стремительного роста популярности…
Часть функций доступна бесплатно на сайте, а для запуска ИИ-агента есть исходный код.
Сегодня удалось пообщатсья с Яниной Познянской — экспертом в области инвестиций в недвижимость, основателем агентства недвижимости и наставником для многих начинающих инвесторов. В интервью она рассказала о своем пути, взлетах и падениях, а также поделилась ценными советами для тех, кто хочет добиться успеха в инвестициях.
Для этого готовую модель Qwen они дообучили методом «дистилляции» с помощью Gemini 2.0 Flash Thinking.
Предпринимательство в России - это не только возможность реализовать мечту, но и серьезный вызов. По данным Росстата, около 70% малых бизнесов закрываются в первые три года. Почему? Чаще всего из-за отсутствия четкого плана, непонимания рынка и финансовых просчетов. Но есть и хорошие новости: этих ошибок можно избежать.
Поднебесная пошла ва-банк и вложила 1 триллион юаней (~140 миллиардов долларов) в развитие ИИ. Bank of China обязался выделить эту сумму в течение пяти лет.