Alibaba представила Qwen 2.5-Omni-7B — мультимодальную модель с открытым кодом
Она распознаёт текст, изображения, аудио и видео, а также отвечает текстом и голосом.
- Компания заявляет, что модель можно запустить на смартфонах и ноутбуках.
- Qwen2.5-Omni-7B на 7 млрд параметров. Она предназначена для разработки «гибких ИИ-агентов», особенно в сфере голосовых приложений.
- Модель могла бы составлять аудиоописания окружения для людей с нарушением зрения, давать подсказки во время готовки, анализируя ингредиенты на видео, стать основой сервиса клиентской поддержки и не только.
- Модель уже доступна для разработчиков на Hugging Face, GitHub, ModelScope, а также её добавят в Qwen Chat.
- 24 февраля 2025 года Alibaba заявила, что инвестирует более $52 млрд в создание облачных платформ и ИИ-инфраструктуры.
- Alibaba представила Qwen2.5 в сентябре 2024 года, в январе 2025 — модель Qwen 2.5-Max.
- 6 марта 2025-го компания выпустила QwQ-32B. В некоторых тестах она превзошла o1-mini от Open AI и приблизилась к результатам DeepSeek-R1, хотя не смогла обойти её в тестах на программирование.
Среди множества нейросетей появилось новое перспективное решение — китайская модель Qwen с мощным интерфейсом. В статье расскажу про перспективы китайской нейросетки и чем она может быть полезна.
В этой статье вы узнаете, почему конверсия сайта, его качество значительно влияет на рекламу и в итоге на продажи. Распишу детально основные проблемы на сайте, которые влияют на эффективность рекламных кампаний и снижают количество заявок, лидов, заказов. Также поделюсь, что нужно делать, чтобы увеличить конверсию сайта, какие есть варианты решения…
Необычное время выхода Qwen 2.5-Max — в первый день Лунного Нового года, когда большинство китайцев отдыхают и проводят время с семьями, — указывает на то, что стремительный рост китайского стартапа DeepSeek за последние три недели оказал давление не только на зарубежных конкурентов, но и на местных.
Qwen2.5 — это мощная нейросеть с открытым исходным кодом, разработанная компанией Alibaba. Она построена на базе большой языковой модели (LLM) и поддерживает несколько языков, включая русский. Исходный код модели доступен на GitHub, что позволяет разработчикам использовать её в собственных проектах.
Новости достижений маркетплейов в России:
- Ozon перекрасил кнопку
- WB планирует что-то запустить
- ЯМ ввел плату
- Мегамаркте разорился
- Магнит .. да хуй с ним
Алибабу не с маркетплейсами стоит сравнивать, а с тем же Яндексом целиком (не только ям).
Жаль, что Яндекс не выкидывает свои модели в открытый доступ, интересно было бы взглянуть.
Настолько маленькие модельки очень интересны как концепт, но пока не очень понимаю применение. Apple Intelligence наглядно показал, что если даже простейшую задачу дать локальной, и от того слишком маленькой модельке, получится шляпа (см. суммирование уведомлений и даже пруфридинг текста)
У МС локальная модель в recall занимает 40+ Гб и то, ее никак в прод нормально не запустят. У эпла локальная модель около 10гб.
В любом случае, что МС, что эпл пытаются сэкономить на датацентрах.
утомили уже
https://suno.com/song/de5adde9-cbd2-47ed-a6e3-f100c0e0204d?sh=DCiqA8htmNHDp32p
Устал от новостей про ИИ