«Яндекс.Облако» запустило сервис для разработчиков в области машинного обучения Yandex DataSphere

Сервис позволит разработчикам переключаться между разными типами виртуальных машин без остановки вычислений и оплачивать только время расчётов.

«Яндекс.Облако» открыло доступ к сервису Yandex DataSphere — облачной среде для использования инструментов машинного обучения, рассказали vc.ru в компании.

Сервис использует технологию бессерверных вычислений: при редактировании и просмотре кода не задействуются мощности CPU (обычные процессоры) или GPU (графические процессоры), а виртуальная машина нужного типа подключается только на время непосредственных расчётов (обучение моделей, запуск и других вычислений).

Это позволяет пользователю оплачивать только время реального использования вычислительных мощностей, отмечают в компании. Время редактирования и просмотра кода, случайный простой машины не учитываются.

Также Yandex DataSphere поддерживает бесшовное переключение между разными типами мощностей. Пользователи могут без остановки вычислений и с сохранением прогресса применять разные типы виртуальных машин: экономичные с CPU и быстрые с GPU.

В «Яндексе» отмечают, что это позволит ускорить разработку, сэкономить и повысить эффективность применения более дорогих вычислительных мощностей.

Позже компания планирует добавить функцию сохранения версий расчётов моделей по трём измерениям — данные, код и состояние ноутбука. Это позволит упростить командную работу специалистов по работе с данными и сделать ML-разработку более управляемым процессом для корпоративных пользователей. Среди других ожидаемых функций — проверка качества кода и рекомендации по оптимальному использованию машин.

Пока Yandex DataSphere доступен в тестовом режиме по предварительной регистрации, сервис бесплатный до конца июня 2020 года. После часть функций могут стать платными, уточнили в «Яндексе». Окончательные тарифы компания определит к моменту коммерческого запуска, дату в компании не уточнили.

66
13 комментариев

Не совсем понятно, как Яндекс может получить модели пользователей, если это cloud, где разработчики не имеют доступа к данным пользователей. Относительно TPU тоже не совсем понятно: именно в обучении им бесконечно далеко до топовых GPU, нужны они в основном для дешевого inference.

6
Ответить

На TPU работает не все и оно есть только в облаке. В то время как на GPU можешь наобучать модель, а заказчик будет её эксплуатировать на своем оборудовании.
Есть куча заказчиков, начиная от банков, для которых критично, чтобы чуствительные данные не ходили за периметр

1
Ответить

да, мало кто ещё заметил, что в пользовательском соглашении яндекс требует переписать на него бизнес, для которого разрабатывается модель

Ответить

Ну наконец-то!

Будет интересно сравнить тарифы (когда появятся) с Amazon SageMaker и Google Cloud ML.

3
Ответить

Дешёвым это не будет, оборудование стоит везде одинаково

1
Ответить

«Давай досвидания» Microsoft azure?)

Ответить