Компания OpenAI работает над созданием мультимодальной большой языковой модели под кодовым названием Gobi.

Она будет способна обрабатывать и воспринимать различные формы данных, такие как текст и изображения, стремясь превзойти новейшую большую языковую модель Gemini компании Google, которая возможно выйдет этой осенью.

OpenAI активно работает над включением в GPT-4 мультимодальных возможностей, аналогичных тем, что будут реализованы в Gemini и готовится вывести эти функции, получившие название GPT-Vision, на широкую аудиторию.

Постойте, теперь OpenAI в роли догоняющего?

Больше новостей в Телеграм канале:

@neuro_trends8

НЕЙРОСЕТИ | НЕЙРОТРЕНДЫ | CHATGPT | MIDJORNEY | STABLE DIFFUSION

Подпишись в Телеграм и будь в курсе: https://t.me/neuro_trends8

Начать дискуссию