Привет! Разработал легковесный гибридный движок для высокоскоростной обработки и квантования массивов данных. Главная фишка — выжать максимум из обычного процессора (CPU) через низкоуровневые векторные инструкции AVX2 на C++20, полностью отказавшись от привязки к CUDA.


Сверху накинул Python-обертку для удобной интеграции в скрипты.


Чтобы не тратить время на сборку и зависимости, настроил и протестировал готовый шаблон окружения. Всё заводится буквально в одну ячейку прямо в интерактивной среде Google Colab.

Код полностью открытый, буду рад фидбеку по архитектуре ядра:

https://github.com/nlozkina19-crypto/vector-zero-compute

Пожалусто перейдите по ссылке и оставте коментарий мне 11 и заранее большое спасибо

1 комментарий