Привет! Разработал легковесный гибридный движок для высокоскоростной обработки и квантования массивов данных. Главная фишка — выжать максимум из обычного процессора (CPU) через низкоуровневые векторные инструкции AVX2 на C++20, полностью отказавшись от привязки к CUDA.
Сверху накинул Python-обертку для удобной интеграции в скрипты.
Чтобы не тратить время на сборку и зависимости, настроил и протестировал готовый шаблон окружения. Всё заводится буквально в одну ячейку прямо в интерактивной среде Google Colab.
Код полностью открытый, буду рад фидбеку по архитектуре ядра:
https://github.com/nlozkina19-crypto/vector-zero-compute
Пожалусто перейдите по ссылке и оставте коментарий мне 11 и заранее большое спасибо
1 комментарий