Справочник по выбору GPU для работы с большими языковыми моделями Llama
Dalle-3
3.3K3.3K показов
9.5K9.5K открытий

​UPADATE 6 апреля 2024 - На RTX 8000 load_in_8bit=True через свежие HF либы стал работать, что делает теперь эти карты очень выгодными для инференса больших моделей. У RTX 8000 нет Flash Attention 2

Ответить