Подборка новых моделей
✦ Baidu представила модели ERNIE X1.1 и 4.5
ERNIE X1.1 превосходит DeepSeek R1 и стоит в 2 раза дешевле. ERNIE 4.5 обходит GPT-4.5 при цене всего 1% от стоимости конкурента. Точность фактов X1.1 выросла на 34.8%, следование инструкциям на 12.5%. X1.1 показывает уровень GPT-5 и Gemini 2.5 Pro в некоторых тестах. ERNIE 4.5 основан на 21B параметрах с 3B активными и поддерживает контекст 128K токенов
✦ HunyuanImage-2.1 от Tencent: генератор картинок в 2K
Поддерживает разрешение 2048×2048 (2K) и использует VAE со сжатием 32×32. Refiner Model улучшает детализацию и устраняет артефакты. DIT-архитектура с двойным потоком, как у FLUX, и MLLM + ByT5 в составе. По качеству сопоставима с Qwen Image
Подробнее - GitHub - HuggingFace - Тех. отчёт
✦ Seedream 4.0 от ByteDance: генерация картинок в 4K
Модель выдаёт изображения размером до 4096×4096px. Стоимость генерации одной картинки $0.03. Поддерживает редактирование: добавление и удаление объектов
Попробовать: Higgsfield - Glif - Freepik
✦ Qwen-3-ASR от Alibaba: модель распознавания речи
Модель поддерживает 11 языков, включая русский. Авто-распознавание языка и работа с речью, песнями и шумами. Поддержка кастомных словарей без дообучения модели. Стоимость: $0.000032 за сек аудио через API
Подписывайтесь на Telegram EFEMERA: AI news.