Часик назад OpenAI выпустила (https://github.com/huggingface/transformers/releases/tag/v4.55.0) новую семейство моделей GPT OSS с открытым кодом.

В линейку входят две модели -большая на 117 миллиардов параметров и меньшая на 21 миллиард. Обе используют схему MoE (смесь экспертов) и 4-битное квантование, что позволяет быстро работать даже на обычном оборудовании: большая модель помещается на один H100, а меньшая — работает даже на видеокарте с 16 гигабайтами памяти.

Кроме того, был представлен Command A Vision - современная мультимодальная модель для работы с текстом и изображениями. Она умеет создавать подписи к фото, отвечать на вопросы по изображениям, анализировать графические документы, и поэтому подходит для ИИ-задач в разных сферах - от анализа медицинских снимков до поиска по картинкам и модерации контента.

Токены, нам нужно снижение цен на токены :) Мы платим около 20к в месяц за них, и меня слегка душит жаба :)

Русский ИТ бизнес (https://t.me/bezsmuzi)

Начать дискуссию