60 кубитов против вселенной: квантовый AI от MIT

Исследователи из Caltech, Google Quantum AI и MIT опубликовали работу, которая может серьезно изменить расклад сил в машинном обучении. Если коротко: они доказали, что маленький квантовый компьютер на 60 логических кубитов способен решать задачи классификации и снижения размерности на массивных датасетах, для которых классической машине потребовалась бы экспоненциально большая память.

Ключевая проблема квантового ML всегда была в загрузке данных. Квантовые алгоритмы хотят обрабатывать данные в суперпозиции, но реальные данные приходят из классического мира по одному сэмплу за раз. Это называется data loading problem, и именно она годами мешала квантовым вычислениям выйти за рамки узких задач вроде симуляции квантовых материалов.

Авторы предложили фреймворк Quantum Oracle Sketching. Идея в том, что данные обрабатываются как поток: каждый классический сэмпл проходит через маленький квантовый поворот, после чего сразу отбрасывается. Последовательно накапливая эти повороты, система строит точное приближение квантового оракула, который потом можно использовать в любом квантовом алгоритме. Никакого хранения датасета целиком, никаких гигантских дата-центров.

Цена за сборку квантовых запросов из классических данных - квадратичная зависимость по числу сэмплов от числа квантовых запросов. Авторы доказали, что это оптимальная граница, и она фундаментально следует из правила Борна (квадратичная связь между квантовыми амплитудами и классическими вероятностями).

Для считывания результатов из квантовых состояний разработан протокол interferometric classical shadow. Вместе с Quantum Oracle Sketching он позволяет обойти узкое место загрузки/считывания данных и строить экспоненциально компактные классические модели из огромных датасетов.

Масштаб преимущества впечатляет. Квантовый процессор на 300 логических кубитов теоретически превосходит классическую машину, построенную из каждого атома наблюдаемой вселенной. На практике, конечно, нужны вселенских масштабов датасеты для такого контраста, но на реальных данных результаты тоже убедительные: на датасетах single-cell RNA sequencing и анализа тональности отзывов на фильмы авторы показали сокращение требуемой памяти в 10 000 - 1 000 000 раз при использовании менее 60 логических кубитов.

Контекст для понимания: Большой адронный коллайдер в CERN генерирует петабайты данных в час, но из-за ограничений хранения приходится выбрасывать почти все, оставляя примерно одно событие из ста тысяч. Квантовый подход позволил бы сжимать все данные в компактный квантовый чип и выполнять downstream-задачи без потерь информации.

Важно: пока это не про LLM и генеративный AI. Результаты касаются фундаментальных задач ML - линейной классификации высокой размерности и снижения размерности. Но автор статьи Haimeng Zhao проводит параллель с эпохой SVM и случайных лесов, которая в итоге породила революцию глубокого обучения. По его мнению, квантовый AI сейчас находится в аналогичной исторической точке.

Фреймворк с открытым исходным кодом написан на JAX с поддержкой GPU/TPU и автоматического дифференцирования, так что его можно встраивать в существующие ML-пайплайны.

Ссылки:

Статья на arXiv: https://arxiv.org/pdf/2604.07639

Блог-пост: https://quantumfrontiers.com/2026/04/09/unleashing-the-advantage-of-quantum-ai/

GitHub: https://github.com/haimengzhao/quantum-oracle-sketching