🦾 Обучите и запустите GPT-2 у себя на пк
Андрей Карпатый выпустил llm.c для CUDA чуть больше тысячи строк чистого C кода без зависимостей, которые компилируются меньше чем за секунду.
llama.c – предыдущий проект Карпатого, позволяет запускать llama на любых умных устройствах, а llm.c теперь даёт возможность ещё и тренировать.
Текущее время выполнения каждой итерации в е <3 A 100 40GB PCIe, B=4, T=1024:
- llm.c: 111 мс
- PyTorch: 180 мс
- +torch.compile: 86 мс
- +тензорные ядра fp32: 26 мс
• Github
694
показа
58
открытий
0
Комментарии