Справочник по выбору GPU для работы с большими языковыми моделями Llama
Dalle-3
2727
22

​UPADATE 6 апреля 2024 - На RTX 8000 load_in_8bit=True через свежие HF либы стал работать, что делает теперь эти карты очень выгодными для инференса больших моделей. У RTX 8000 нет Flash Attention 2