Covariant объединяет визуальные данные с камер с текстовыми данными, подобно тому, как работает новый видеогенератор Sora от OpenAI. Это улучшает понимание роботом окружающей его обстановки. Основанный Питером Аббеелем и его бывшими учениками, Covariant применил аналогичные методики, используемые для чат-ботов, чтобы эффективно управлять складскими роботами.