Alexander Shuklin

с 2020
0 подписчиков
27 подписок

Модель может и быть обучена и на 512 видеокартах как https://github.com/NVIDIA/Megatron-LM, и потом до обучить её на своём множестве на обычной 1080Ti или CPU, но в современном мире крутой тот кто больше эпох сделал, так что если у Яндекса карты ниже https://www.nvidia.com/ru-ru/data-center/tesla-t4/ то смысла в их сервисе нету.

Модель получить легко, она описывается в вычислительном графе, где указанный все настройки и занимает около 10 строчек кода, которые легко разными способами получить. TPU, GPU или CPU в них через разные бекенды загружается это граф. TPU быстрее их в разы и дешевле, есть уже и китайские варианты https://sophon.cn/. Яндекс опоздал на столько что уже не когда не догонит их, так как нету отечественных разработок на ИИ.

Походу народ не в теме. Яндекс просто хочет за счет пользователей получать модели. И какие CPU и GPU в 2020? У google TPU которые дешевле выходят https://habr.com/ru/post/422317/

5