Компания OpenAI работает над созданием мультимодальной большой языковой модели под кодовым названием Gobi.
Она будет способна обрабатывать и воспринимать различные формы данных, такие как текст и изображения, стремясь превзойти новейшую большую языковую модель Gemini компании Google, которая возможно выйдет этой осенью.
OpenAI активно работает над включением в GPT-4 мультимодальных возможностей, аналогичных тем, что будут реализованы в Gemini и готовится вывести эти функции, получившие название GPT-Vision, на широкую аудиторию.
Постойте, теперь OpenAI в роли догоняющего?
Больше новостей в Телеграм канале:
@neuro_trends8
НЕЙРОСЕТИ | НЕЙРОТРЕНДЫ | CHATGPT | MIDJORNEY | STABLE DIFFUSION
Подпишись в Телеграм и будь в курсе: https://t.me/neuro_trends8