CloudMTS

Мощные сервисы для быстрого машинного обучения: от GPU SuperCloud до суперкомпьютера

В последние три года мы видим рост спроса на технологии искусственного интеллекта (ИИ) и машинного обучения. Они проникли практически во все сферы нашей жизни, начиная от различных колл-центров и городских систем видеонаблюдения, заканчивая системами медицинского скрининга и диагностики заболеваний. Даже для оплаты проезда в столичной подземке уже используется технология распознавания лиц пассажиров на базе ИИ.

Для реализации подобных инструментов в условиях взрывного роста спроса необходимо развитое аппаратное обеспечение. И наша платформа GPU SuperCloud поможет решить эту проблему.

Построение систем ИИ — пока что удел крупных компаний

Прежде чем рассказывать о том, как росло и развивалось наше решение, хотим заметить, что такой инструмент создать частному лицу практически нереально. Нужны большие аппаратные ресурсы, коммуникационные каналы с высокой пропускной способностью, мощное силовое оборудование для бесперебойного электропитания, а это всё предполагает высокие капитальные затраты. Например, всего одна видеокарта NVIDIA V100, которая используется в системах ИИ, стоит около миллиона рублей.

История развития GPU SuperCloud

Создавать сервис GPU SuperCloud мы начали с 2018 года. Именно в это время начался стремительный рост востребованности систем ИИ и машинного обучения, а на рынке стали появляться необходимые программные и аппаратные решения.

В качестве первой «ласточки» для построения тестового IaaS-сервиса мы выбрали узел DGX-1 от NVIDIA, его мы и приобрели зимой 2018 года. Конечно, в нём нет поддержки виртуализации, но нам это и не требовалось: мы хотели «обкатать» саму технологию. И в 2019 году мы запустили свой первый сервис IaaS! Его тесты прошли успешно, и решено было развернуть полноценный сервис ИИ для внутренних нужд, а именно для компании «Центр Искусственного Интеллекта МТС».

В основу системы легли стандартные серверы Huawei с видеокартами NVIDIA V100. Для виртуализации инфраструктуры мы использовали гипервизор VMware. Совместное применение VMware и NVIDIA GPU Manager позволило разделить ресурсы одного физического сервера для запуска и развёртывания нескольких виртуальных машин. Если, к примеру сервер оснащён восемью картами NVIDIA, то каждому пользователю можно выделить до 12 % вычислительной мощности одного адаптера!

Вскоре GPU SuperCloud стал очень востребован, и начиная с 2020 года спрос на его использование вырос практически вдвое. Сегодня наши заказчики чаще всего выбирают 100 % или 50 % вычислительной мощности видеоадаптеров, а также схему 1+1. Уже в начале 2021 года мы вдвое увеличили наш парк серверов. И невзирая на это, оборудование уже загружено на 85 %, поэтому в самое ближайшее время планируется очередная закупка оборудования.

GPU SuperCloud — кратчайший путь для решения ресурсоемких задач машинного обучения и внедрения ИИ. К услугам наших заказчиков облачная высокопроизводительная масштабируемая платформа с GPU, которая в 100 раз быстрее любого компьютера на современном процессоре.

Для подключения к нашему сервису используется высокоскоростной канал с пропускной способностью 100 Гбит/сек. Благодаря этому наши клиенты могут обмениваться с облачной средой практически безграничным объемом данных, трафик мы не учитываем.

Наш суперкомпьютер GROM

Опыт, который мы получили при создании GPU SuperCloud, помог нам построить один из мощнейших суперкомпьютеров в России — GROM. Он предназначен для решения ресурсоёмких задач в сфере машинного обучения и ИИ. Специальный программный стек High Performance Computing (HPC) помогает использовать весь потенциал вычислительного кластера. Для максимальной скорости обмена данными все узлы суперкомпьютера связаны высокоскоростной сетью Infiniband. Основу вычислительной мощности GROM составляют карты NVIDIA DGX A100, общий объём видеопамяти на каждом узле — 320 Гб. Пиковая производительность достигает 2,26 петафлопс.

Вычислительный кластер GROM оснащен системой хранения данных NetApp на основе технологии NVMe. Она обеспечивает сверхскоростной доступ узлов к различным данным и за счёт этого максимально ускоряет процесс машинного обучения. Можно запускать задачи как на отдельных узлах, так и на всех 20.

Сегодня GROM используется для решения наших внутренних задач: разработки проектов с использованием распознавания, синтезом речи и изображений, строятся различные предиктивные модели и т.п.

Как предоставляются услуги GPU SuperCloud

Сейчас мы предоставляем услуги сервиса в формате «чистого» IaaS или MLOps Platform.

У каждого подхода есть свои достоинства и недостатки.

«Чистая» IaaS

Даёт разработчикам максимальную гибкость. Они могут самостоятельно развернуть любое ПО, настроить функциональность и режим работы.

Но для установки и настройки ПО потребуется время. Обычно на это уходит 2-3 недели. Но при интенсивном использовании системы вынужденный простой окупается за 1-3 месяца эксплуатации сервиса!

MLOps Platform

Заказчикам, которые хотят немного сэкономить и сразу начать работать с сервисом, стоит выбрать MLOps Platform. Чтобы облегчить задачу автоматизации процессов разработки, к вашим услугам полностью установленная и настроенная программно-аппаратная инфраструктура для быстрого запуска и отладки пользовательских систем. На выбор доступны различные операционные системы, средства виртуализации приложений на базе Kubernetes, а также различные фреймворки: Tensorflow, PyTorch, интегрированный Jupyter Notebook & JupyterLab и т.п. Вам достаточно лишь загрузить на платформу своё ПО, настроить его и начать работу.

Модель оплаты

У нас используется помесячная абонентская плата. Но несмотря на это нам удалось предложить одну из самых низких на рынке цен на месячную аренду оборудования. На сегодняшний день стоимость использования GPU SuperCloud начинается от 8 990 рублей в месяц. Это окончательная цена без дополнительных платежей. Она сравнима с платой за месячное использование мощного VPS у большинства интернет-провайдеров.

В каких сферах можно использовать GPU SuperCloud

Наш сервис можно использовать в сферах, где требуется решать сложные математические задачи с большими объёмами обработки данных — начиная от аэрокосмического производства, заканчивая фармацевтикой и умным городом. С помощью сервиса можно решать различные задачи в сотни раз быстрее, одновременно сократив затраты на их решение. Используя возможности GPU SuperCloud по распознаванию речи и видеоаналитики можно создать различные интеллектуальные сервисы предиктивного анализа. Вот лишь несколько примеров.

3D-моделирование

GPU SuperCloud может повысить эффективность работы с технологиями 3D-моделирования. Например, использовать метод ускоренной трассировки лучей для фотореалистичного рендеринга. Да и в целом за счёт большой вычислительной мощности сервис существенно ускоряет процесс рендеринга и визуализации созданных 3D-моделей. А самое главное — в GPU SuperCloud есть поддержка популярных сторонних средств рендеринга на базе GPU, таких как V-Ray, OctaneRender и RedShift.

Редактирование видео

Поможет GPU SuperCloud и компаниям, занимающимся видеопродакшеном. С его помощью можно редактировать видеоряд в реальном времени и выполнять цветокоррекцию, а также аппаратно кодировать и декодировать видео в различные форматы. С помощью ИИ можно автоматически находить в видеоряде лица персонажей и разбивать его на клипы с отслеживанием объектов в кадре.

САПР

GPU SuperCloud позволяет с высокой эффективностью и скоростью решать задачи промышленного 3D-моделирования и рендеринга различных насыщенных деталями объектов. Сервис поддерживает работу с такими системами проектирования и конструирования, как Autodesk, Autocad, Revit, Autodesk Inventor, SolidWorks, SiemensNX, компас-3D и TFlexCad. Благодаря высокой вычислительной мощности и использованию ANSYS-модулей для разных отраслей и задач на создание сложных визуальных сцен и рендеринг видео требуется обычно несколько часов, а не дней!

Примеры реальных сценариев использования GPU SuperCloud

Нейросеть для оценки ущерба в ДТП

Создатель этой услуги — компания, специализирующаяся на автоматизации бизнес-процессов с использованием систем ИИ и машинного обучения. С помощью нашей системы она создала инструмент для автоматической оценки повреждений автомобиля по фотографиям. GPU SuperCloud помогает за несколько минут рассчитать стоимость ремонта машины и размер страховых выплат. Заказчик стал на 30 % быстрее обрабатывать изображения и обучать модели машинного обучения, а расходы на ИТ-инфраструктуру уменьшил на 25%!

Сеть медицинских клиник

Правильный диагноз крайне важен для лечения, а иногда и спасения жизни пациента. И главную роль играют инструментальные анализы. Например, врач-рентгенолог до 80 % своего рабочего времени тратит на анализ снимков здоровых пациентов. Естественно, что к середине рабочего дня человек устаёт, повышается риск риск ошибочного диагноза.

Развёрнутая заказчиком в нашем облаке система на основе машинного обучения повысила информативность КТ-исследований грудной клетки, зубов и полости рта. А за счёт использования технологии автоматического распознавания медицинских изображений (МРТ, КТ) с помощью моделей и ИИ удалось на 40 % сократить время обработки анализов!

При этом точность автоматических алгоритмов не зависит от времени суток и других факторов и составляет более 90 %, что гораздо выше возможностей любого квалифицированного врача-рентгенолога.

Системы умный город

В основе различных проектов умного города всегда лежит взаимодействие информационных и коммуникационных технологий, интернет вещей, городская система видеонаблюдения и анализ получаемых из неё данных. С её помощью в режиме реального времени отслеживается ситуация в городе, и в случае угрозы принимаются оперативные меры. Помогает городская система видеонаблюдения и в поиске преступников, находящихся в розыске.

Благодаря GPU SuperCloud можно в несколько раз повысить скорость обработки видеоряда с городских камер, обеспечивая при этом высокое качество видеоаналитики. Город с миллионным населением может сэкономить на ИТ-инфраструктуре примерно в 8 раз.

Как защищены данные наших пользователей?

И в заключение остановимся на вопросе защиты данных пользователей. Физическая защита обеспечивается использованием флагманского оборудования, размещенного в современном и высоконадежным дата-центре уровня Tier III.

Также пользователи могут подключить антивирус, систему защиты веб-сервисов (WAF) и другие решения. Наши специалисты SOC (Security Operations Center) круглосуточно мониторят все события и инциденты в сфере информационной безопасности и оперативно реагируют на них, обеспечивая максимальную защиту сервиса от киберугроз в режиме реального времени.

0
0 комментариев
Популярные
По порядку
Читать все 0 комментариев
Как мы запустили сервис цифрового тайного покупателя, забили на него на 3 года и вернулись к нему в локдаун

Всем привет! Меня зовут Михаил Кузьмин. Мне 35 лет, из которых 10 лет я занимался разными бизнесами: от франшиз Мосигры и Додо Пиццы до интегратора amoCRM и цифрового тайного покупателя Scont. По образованию я закончил МИФИ по специальности медицинская физика. По похожему направлению проработал 2.5 года в ФМБА и Росатоме. В итоге я разочаровался…

Digital Horizon вложился в поставщика инфраструктуры для инвестиционных решений WealthKernel в раунде A+ на $ 7 млн

Привлеченные средства компания использует для выхода на европейские рынки, запуск внутридневной торговли и дальнейшее развитие API-инфраструктуры.

Команда WealthKernel
15 трендов в иллюстрациях, которые дизайнеры могут использовать в 2022 году

Когда-то давно Магвай завоевал сердца заказчиков авторскими иллюстрациями. Время шло, наши приоритеты постепенно сместились в сторону UI/UX. Но сегодня нам захотелось вновь впечатлять пользователей и создавать эмоции с помощью графики. Мы изучили актуальные тренды и делимся переводом статьи про тенденции развития этой области дизайна в 2022 году.

Российские акции на Мосбирже упали на 6,5%: такого падения за день не было с начала пандемии, больше всех задело банки Статьи редакции

Индекс ещё упадёт, но затем будет «бурный отскок», считают эксперты.

Как Counter Strike сделал меня веб-разработчиком и как я открыл свою веб-студию

Я, как и многие подростки, начинал свой путь с компьютерных игр, вернее с видеоигр, тогда еще компьютеры не были настолько популярными. Да, я про те времена, когда мы зависали, играя в приставку SEGA и у нас горели блоки питания от перегрева, кто в теме, тот поймет =)

Альфабанк. Звонки от "службы безопасности"

Приветствую, человек, случайно попавший на данный пост.
Речь в данной статье пойдет, скорей всего, ни о чем, на заезженную тему заезженного виновника подобных тем, и тут не будет решения вопроса. Данный пост создаю для того, чтобы пополнить копилку таких постов.

Образование, путешествия и благотворительность: на что тратились россияне в новогодние каникулы

Новогодние праздники — один из самых расточительных периодов года. Аналитики CloudPayments выяснили, какие категории товаров были самыми популярными в онлайне с 31 декабря по 9 января.

Компания SpaceX осуществила запуск еще примерно 50 мини-спутников Starlink

Вечером 18 января со стартового комплекса 39А на космодроме на мысе Канаверал во Флориде стартовала ракета-носитель Falcon 9, которая вывела на околоземную орбиту очередную группу из 49 коммуникационных мини-спутников Starlink, сообщает пресс-служба компании SpaceX.

Креативные индустрии будут расти по плану

В РСПП обсудили проект Плана по реализации Концепции развития креативных индустрий, подготовленного Министерством культуры РФ с участием Комитета по интеллектуальной собственности и креативным индустриям и Федерации креативных индустрий.

Работа только для взрослых: чем занимается кавист и как им стать

Кавист — это специалист по вину и другим видам алкоголя, который работает в торговом зале. Он управляет поставками и размещением товара на полках, а еще консультирует покупателей: помогает выбрать лучшее. Мы решили рассказать о том, как устроена профессия и где учатся на кависта. А в конце — парочка полезных советов по выбору вина для всех…

Банки Wall Street ожидают более агрессивных действий от ФРС

В США за последние 40 лет потребительская инфляция достигла угрожающих значений

null