CloudMTS

Мощные сервисы для быстрого машинного обучения: от GPU SuperCloud до суперкомпьютера

В последние три года мы видим рост спроса на технологии искусственного интеллекта (ИИ) и машинного обучения. Они проникли практически во все сферы нашей жизни, начиная от различных колл-центров и городских систем видеонаблюдения, заканчивая системами медицинского скрининга и диагностики заболеваний. Даже для оплаты проезда в столичной подземке уже используется технология распознавания лиц пассажиров на базе ИИ.

Для реализации подобных инструментов в условиях взрывного роста спроса необходимо развитое аппаратное обеспечение. И наша платформа GPU SuperCloud поможет решить эту проблему.

Построение систем ИИ — пока что удел крупных компаний

Прежде чем рассказывать о том, как росло и развивалось наше решение, хотим заметить, что такой инструмент создать частному лицу практически нереально. Нужны большие аппаратные ресурсы, коммуникационные каналы с высокой пропускной способностью, мощное силовое оборудование для бесперебойного электропитания, а это всё предполагает высокие капитальные затраты. Например, всего одна видеокарта NVIDIA V100, которая используется в системах ИИ, стоит около миллиона рублей.

История развития GPU SuperCloud

Создавать сервис GPU SuperCloud мы начали с 2018 года. Именно в это время начался стремительный рост востребованности систем ИИ и машинного обучения, а на рынке стали появляться необходимые программные и аппаратные решения.

В качестве первой «ласточки» для построения тестового IaaS-сервиса мы выбрали узел DGX-1 от NVIDIA, его мы и приобрели зимой 2018 года. Конечно, в нём нет поддержки виртуализации, но нам это и не требовалось: мы хотели «обкатать» саму технологию. И в 2019 году мы запустили свой первый сервис IaaS! Его тесты прошли успешно, и решено было развернуть полноценный сервис ИИ для внутренних нужд, а именно для компании «Центр Искусственного Интеллекта МТС».

В основу системы легли стандартные серверы Huawei с видеокартами NVIDIA V100. Для виртуализации инфраструктуры мы использовали гипервизор VMware. Совместное применение VMware и NVIDIA GPU Manager позволило разделить ресурсы одного физического сервера для запуска и развёртывания нескольких виртуальных машин. Если, к примеру сервер оснащён восемью картами NVIDIA, то каждому пользователю можно выделить до 12 % вычислительной мощности одного адаптера!

Вскоре GPU SuperCloud стал очень востребован, и начиная с 2020 года спрос на его использование вырос практически вдвое. Сегодня наши заказчики чаще всего выбирают 100 % или 50 % вычислительной мощности видеоадаптеров, а также схему 1+1. Уже в начале 2021 года мы вдвое увеличили наш парк серверов. И невзирая на это, оборудование уже загружено на 85 %, поэтому в самое ближайшее время планируется очередная закупка оборудования.

GPU SuperCloud — кратчайший путь для решения ресурсоемких задач машинного обучения и внедрения ИИ. К услугам наших заказчиков облачная высокопроизводительная масштабируемая платформа с GPU, которая в 100 раз быстрее любого компьютера на современном процессоре.

Для подключения к нашему сервису используется высокоскоростной канал с пропускной способностью 100 Гбит/сек. Благодаря этому наши клиенты могут обмениваться с облачной средой практически безграничным объемом данных, трафик мы не учитываем.

Наш суперкомпьютер GROM

Опыт, который мы получили при создании GPU SuperCloud, помог нам построить один из мощнейших суперкомпьютеров в России — GROM. Он предназначен для решения ресурсоёмких задач в сфере машинного обучения и ИИ. Специальный программный стек High Performance Computing (HPC) помогает использовать весь потенциал вычислительного кластера. Для максимальной скорости обмена данными все узлы суперкомпьютера связаны высокоскоростной сетью Infiniband. Основу вычислительной мощности GROM составляют карты NVIDIA DGX A100, общий объём видеопамяти на каждом узле — 320 Гб. Пиковая производительность достигает 2,26 петафлопс.

Вычислительный кластер GROM оснащен системой хранения данных NetApp на основе технологии NVMe. Она обеспечивает сверхскоростной доступ узлов к различным данным и за счёт этого максимально ускоряет процесс машинного обучения. Можно запускать задачи как на отдельных узлах, так и на всех 20.

Сегодня GROM используется для решения наших внутренних задач: разработки проектов с использованием распознавания, синтезом речи и изображений, строятся различные предиктивные модели и т.п.

Как предоставляются услуги GPU SuperCloud

Сейчас мы предоставляем услуги сервиса в формате «чистого» IaaS или MLOps Platform.

У каждого подхода есть свои достоинства и недостатки.

«Чистая» IaaS

Даёт разработчикам максимальную гибкость. Они могут самостоятельно развернуть любое ПО, настроить функциональность и режим работы.

Но для установки и настройки ПО потребуется время. Обычно на это уходит 2-3 недели. Но при интенсивном использовании системы вынужденный простой окупается за 1-3 месяца эксплуатации сервиса!

MLOps Platform

Заказчикам, которые хотят немного сэкономить и сразу начать работать с сервисом, стоит выбрать MLOps Platform. Чтобы облегчить задачу автоматизации процессов разработки, к вашим услугам полностью установленная и настроенная программно-аппаратная инфраструктура для быстрого запуска и отладки пользовательских систем. На выбор доступны различные операционные системы, средства виртуализации приложений на базе Kubernetes, а также различные фреймворки: Tensorflow, PyTorch, интегрированный Jupyter Notebook & JupyterLab и т.п. Вам достаточно лишь загрузить на платформу своё ПО, настроить его и начать работу.

Модель оплаты

У нас используется помесячная абонентская плата. Но несмотря на это нам удалось предложить одну из самых низких на рынке цен на месячную аренду оборудования. На сегодняшний день стоимость использования GPU SuperCloud начинается от 8 990 рублей в месяц. Это окончательная цена без дополнительных платежей. Она сравнима с платой за месячное использование мощного VPS у большинства интернет-провайдеров.

В каких сферах можно использовать GPU SuperCloud

Наш сервис можно использовать в сферах, где требуется решать сложные математические задачи с большими объёмами обработки данных — начиная от аэрокосмического производства, заканчивая фармацевтикой и умным городом. С помощью сервиса можно решать различные задачи в сотни раз быстрее, одновременно сократив затраты на их решение. Используя возможности GPU SuperCloud по распознаванию речи и видеоаналитики можно создать различные интеллектуальные сервисы предиктивного анализа. Вот лишь несколько примеров.

3D-моделирование

GPU SuperCloud может повысить эффективность работы с технологиями 3D-моделирования. Например, использовать метод ускоренной трассировки лучей для фотореалистичного рендеринга. Да и в целом за счёт большой вычислительной мощности сервис существенно ускоряет процесс рендеринга и визуализации созданных 3D-моделей. А самое главное — в GPU SuperCloud есть поддержка популярных сторонних средств рендеринга на базе GPU, таких как V-Ray, OctaneRender и RedShift.

Редактирование видео

Поможет GPU SuperCloud и компаниям, занимающимся видеопродакшеном. С его помощью можно редактировать видеоряд в реальном времени и выполнять цветокоррекцию, а также аппаратно кодировать и декодировать видео в различные форматы. С помощью ИИ можно автоматически находить в видеоряде лица персонажей и разбивать его на клипы с отслеживанием объектов в кадре.

САПР

GPU SuperCloud позволяет с высокой эффективностью и скоростью решать задачи промышленного 3D-моделирования и рендеринга различных насыщенных деталями объектов. Сервис поддерживает работу с такими системами проектирования и конструирования, как Autodesk, Autocad, Revit, Autodesk Inventor, SolidWorks, SiemensNX, компас-3D и TFlexCad. Благодаря высокой вычислительной мощности и использованию ANSYS-модулей для разных отраслей и задач на создание сложных визуальных сцен и рендеринг видео требуется обычно несколько часов, а не дней!

Примеры реальных сценариев использования GPU SuperCloud

Нейросеть для оценки ущерба в ДТП

Создатель этой услуги — компания, специализирующаяся на автоматизации бизнес-процессов с использованием систем ИИ и машинного обучения. С помощью нашей системы она создала инструмент для автоматической оценки повреждений автомобиля по фотографиям. GPU SuperCloud помогает за несколько минут рассчитать стоимость ремонта машины и размер страховых выплат. Заказчик стал на 30 % быстрее обрабатывать изображения и обучать модели машинного обучения, а расходы на ИТ-инфраструктуру уменьшил на 25%!

Сеть медицинских клиник

Правильный диагноз крайне важен для лечения, а иногда и спасения жизни пациента. И главную роль играют инструментальные анализы. Например, врач-рентгенолог до 80 % своего рабочего времени тратит на анализ снимков здоровых пациентов. Естественно, что к середине рабочего дня человек устаёт, повышается риск риск ошибочного диагноза.

Развёрнутая заказчиком в нашем облаке система на основе машинного обучения повысила информативность КТ-исследований грудной клетки, зубов и полости рта. А за счёт использования технологии автоматического распознавания медицинских изображений (МРТ, КТ) с помощью моделей и ИИ удалось на 40 % сократить время обработки анализов!

При этом точность автоматических алгоритмов не зависит от времени суток и других факторов и составляет более 90 %, что гораздо выше возможностей любого квалифицированного врача-рентгенолога.

Системы умный город

В основе различных проектов умного города всегда лежит взаимодействие информационных и коммуникационных технологий, интернет вещей, городская система видеонаблюдения и анализ получаемых из неё данных. С её помощью в режиме реального времени отслеживается ситуация в городе, и в случае угрозы принимаются оперативные меры. Помогает городская система видеонаблюдения и в поиске преступников, находящихся в розыске.

Благодаря GPU SuperCloud можно в несколько раз повысить скорость обработки видеоряда с городских камер, обеспечивая при этом высокое качество видеоаналитики. Город с миллионным населением может сэкономить на ИТ-инфраструктуре примерно в 8 раз.

Как защищены данные наших пользователей?

И в заключение остановимся на вопросе защиты данных пользователей. Физическая защита обеспечивается использованием флагманского оборудования, размещенного в современном и высоконадежным дата-центре уровня Tier III.

Также пользователи могут подключить антивирус, систему защиты веб-сервисов (WAF) и другие решения. Наши специалисты SOC (Security Operations Center) круглосуточно мониторят все события и инциденты в сфере информационной безопасности и оперативно реагируют на них, обеспечивая максимальную защиту сервиса от киберугроз в режиме реального времени.

0
0 комментариев
Популярные
По порядку
Читать все 0 комментариев
Добрый вечер. Нужна помощь с Озон Глобал. Не хотят помочь решить проблему, одни отписки
Идеальный тимлид: миф или реальность?

Кто такой идеальный тимлид? Что ожидает руководство от такого сотрудника? Колонка Алексея Кирсанова, руководителя разработки «Битрикс24».

Геозоны: разделяй и властвуй

Ильдар Бикташев, руководитель отдела картографии и алгоритмов, уже рассказывал, какие задачи стоят перед картографическими сервисами Master Delivery. Сегодня продолжаем разговор о том, как геоаналитические разработки решают маркетинговые и логистические задачи бизнеса.

«Не мошенник, а фантазёр»: история афериста Коровко, ставшего прототипом для героя Ильфа и Петрова Статьи редакции

У миллионера Корейко из романа «Золотой телёнок» есть реальный прообраз — Константин Коровко, торговавший в дореволюционном Петербурге паями несуществующих предприятий. На своих аферах он заработал около 1 млн рублей, но перед судом предстал с 220 рублями на счету и обвинил во всём самих пайщиков.

Евгений Евстигнеев в роли Александра Корейко, кадр из фильма Михаила Швейцера «Золотой телёнок» Год Литературы
Акции роста российских эмитентов на ближайшие 5 лет

Пандемия меняет мир и формируется новая тенденция на ближайшие годы. Ниже будут представлены компании, акции которых способны в новых мировых реалиях опередить динамику фондовых индексов.

Украли деньги с карты Тинькофф

30.12.2021 года я с семьей дочери поехала в магазин "Спортмастер" в г. Москва покупать коньки. Уведомлений от Тинькофф не было. 31.12.2021 года я увидела что есть какие то пуш уведомление при нажатии на него оно исчезло. Когда я зашла в онлайн приложение, то увидела что у меня с кредитной карты сняли 106 000 рублей , было снятие 7 суммами. Кроме…

Для абонентов Мегафон и Yota. Вы не знали, а вам открыли счет в банке!

Для тех кому интересна развязка, она внизу (выделено жирным).

Анализ тональности текста с использованием фреймворка LightAutoML

Сентиментный анализ (анализ тональности) – это область компьютерной лингвистики, занимающаяся изучением эмоций в текстовых документах, в основе которой лежит машинное обучение.

Один небанальный совет в борьбе с бессонницей

Бессонница в наши дни не всегда является патологией - зачастую у людей просто отсутствует культура сна и режима. Тело и мозг просто перестают различать стимулы, которые в здоровой ситуации сигнализируют организму об отходе ко сну. В этой статье я раскрою только один, но очень действенный совет, который поможет выработать механизм быстрого…

Uber извинился перед собаками

Генеральный директор Uber Дара Хосровшахи принес извинения и даже дал скидку в 10 долларов…собакам.

Самые сильные идеи в жизни

Предприниматель Сахил Блум публикует в своем Твиттере интересные жизненные идеи и парадоксы. Представляю перевод твиттер треда «22 самых сильных идеи в жизни».

null