Так и всё-таки, зачем обычному бизнесу мощности на суперкомпьютере?
Если нейросетки гонять, то кажется проще n серверов с gpu (в режиме предсказания они обычно помещаются на одну карточку), а большие сети типа gpt-2/3 нужны очень редким компаниям. По крайней мере сейчас. При этом под параллельные вычисления на gpu почти все есть из коробки у современных фреймворков.
Ну есть такое понятие как fine tuning. Это когда берется почти подходящая сетка и дообучается под конкретную задачу. Для этого может понадобиться довольно большая мощность на не очень долгий срок. Так что такие проекты могут понадобиться hpc-as-a-service
Так и всё-таки, зачем обычному бизнесу мощности на суперкомпьютере?
Если нейросетки гонять, то кажется проще n серверов с gpu (в режиме предсказания они обычно помещаются на одну карточку), а большие сети типа gpt-2/3 нужны очень редким компаниям. По крайней мере сейчас.
При этом под параллельные вычисления на gpu почти все есть из коробки у современных фреймворков.
Ну есть такое понятие как fine tuning. Это когда берется почти подходящая сетка и дообучается под конкретную задачу. Для этого может понадобиться довольно большая мощность на не очень долгий срок. Так что такие проекты могут понадобиться hpc-as-a-service