Alexander Shuklin

с 2020

0 подписчиков

27 подписок

в посте

«Яндекс.Облако» запустило сервис для разработчиков в области машинного обучения Yandex DataSphere 28.05.2020

Модель может и быть обучена и на 512 видеокартах как https://github.com/NVIDIA/Megatron-LM, и потом до обучить её на своём множестве на обычной 1080Ti или CPU, но в современном мире крутой тот кто больше эпох сделал, так что если у Яндекса карты ниже https://www.nvidia.com/ru-ru/data-center/tesla-t4/ то смысла в их сервисе нету.

Ответить

Alexander Shuklin

в посте

«Яндекс.Облако» запустило сервис для разработчиков в области машинного обучения Yandex DataSphere 28.05.2020

Модель получить легко, она описывается в вычислительном графе, где указанный все настройки и занимает около 10 строчек кода, которые легко разными способами получить. TPU, GPU или CPU в них через разные бекенды загружается это граф. TPU быстрее их в разы и дешевле, есть уже и китайские варианты https://sophon.cn/. Яндекс опоздал на столько что уже не когда не догонит их, так как нету отечественных разработок на ИИ.

Ответить

Alexander Shuklin

в посте

«Яндекс.Облако» запустило сервис для разработчиков в области машинного обучения Yandex DataSphere 28.05.2020

Походу народ не в теме. Яндекс просто хочет за счет пользователей получать модели. И какие CPU и GPU в 2020? У google TPU которые дешевле выходят https://habr.com/ru/post/422317/

habr.com

Почему TPU так хорошо подходят для глубинного обучения?

Ответить