RT-2 обладает способностью выполнять задания, требующие анализа промежуточных этапов. Модель способна планировать последовательность действий на основе как визуальных, так и текстовых данных, что позволяет осуществлять планирование на основе визуальной информации.