Оптические вычисления могут стать основой AGI: учёные продемонстрировали тензорные операции, производимые со скоростью света
Учёные из Университета Аалто продемонстрировали технологию, которую всё чаще рассматривают как возможную основу аппаратных систем следующего поколения — в том числе и будущих AGI-моделей. Исследователям удалось выполнить сложные тензорные операции при помощи света и сделать это «одним проходом», без каких-либо электронных вычислений. Такой подход радикально отличается от того, как устроена современная ИИ-инфраструктура.
Тензорные вычисления лежат в центре работы всех крупных нейросетей. Это и операции, которые позволяют моделям распознавать структуры в данных, и механизмы внимания, и математические преобразования, необходимые для обработки изображений, текста или аудиосигналов. Сегодня всё это выполняют GPU, но рост объёмов данных уже упирается в пределы электронной архитектуры — в её скорость, масштабируемость и энергопотребление.
Разработка Aalto предлагает иной путь: не ускорять электронику, а заменить её принцип. Команда под руководством Юфэна Чжана научилась кодировать цифровую информацию в амплитуду и фазу световых волн. В процессе распространения такие волны естественным образом взаимодействуют и выполняют тензорные операции, которые в электронных процессорах реализуются шаг за шагом и требуют огромных вычислительных ресурсов. В оптической же системе расчёт происходит за время пролёта луча — фактически мгновенно.
Ключевое преимущество метода — многоканальность света. Он позволяет обрабатывать множество данных параллельно, а использование разных длин волн расширяет возможности работы с более высокими порядками тензоров. То, что электронная схема выполняет за тысячи тактов, оптическая система делает за один физический процесс.
Исследователи подчёркивают и технологическую простоту. Оптические операции возникают пассивно — просто в ходе распространения света. А сама методика может быть реализована на самых разных оптических платформах. Следующая цель — интеграция на фотонные чипы, которые позволят выполнять такие вычисления в компактном и энергоэффективном форм-факторе. По оценке Чжана, первые версии подобных систем могут появиться на коммерческих платформах уже через три–пять лет.
Для индустрии искусственного интеллекта этот переход может оказаться фундаментальным. Если тензорные вычисления в полном объёме удастся перенести на фотонику, новые системы смогут обрабатывать большие модели с минимальными энергозатратами и на скоростях, которые недостижимы для кремниевых процессоров. Это делает оптическое вычисление одним из наиболее перспективных направлений для аппаратных платформ, способных обеспечить работу моделей уровня AGI.