Как мы использовали открытый стандарт для создания российского сервера

Больше половины решений из реестра отечественного ПО написаны с применением Open Source. Точно также можно использовать разработки мирового ИТ-сообщества для создания «железа». Мы в GAGAR>N выпустили сервер по стандартам Open Compute Project. Расскажем, что это за подход и как нам удалось за полтора года превратить стартап из семи человек в высокотехнологичную производственную компанию.

Меня зовут Алиса Гатауллина, я - архитектор программного обеспечения в компании GAGAR>N. Мы — довольно молодая российская команда, которая разрабатывает и производит серверное оборудование — серверы, серверные стойки, полки питания, дисковые массивы JBOD и JBOF. Компания появилась в 2019 году, а в 2021-ом первые промышленные образцы встали в ЦОДы заказчиков. За полтора года мы прошли путь от идеи до серийного производства — в том числе благодаря тому, что не разрабатывали все технологии «с нуля», а использовали решения открытого стандарта OCP.

OCP — это Open Source для «железа»

Концепция Open Compute Project (OCP) появилась в 2011 году, когда крупнейшие мировые ИТ-компании поняли, что их расходы на ИТ-инфраструктуру растут невероятными темпами. И дело не только в необходимости бесконечного расширения мощностей. Обслуживание гигантских ЦОДов с разномастным оборудованием требовало все больше людей и ресурсов. Инженерам приходилось помнить, с какой стороны подойти к каждой стойке, где располагаются разъемы и элементы управления, какие манипуляции необходимо совершить в каждом конкретном случае.

Идея OCP одновременно проста и гениальна: чтобы упростить обслуживание оборудования в ЦОДах, нужно его унифицировать. А заодно и оптимизировать все конструкции таким образом, чтобы максимально удешевить эксплуатацию. В итоге крупнейшие технологические компании стали делиться своими разработками в области оборудования для дата-центров, совместными усилиями формируя стандарт OCP. За более чем 10 лет к проекту присоединились IBM, Google, Apple, Microsoft, Dell, Huawei, Schneider Electric, Cisco, Alibaba Group, Samsung и многие другие.

Open Compute Project — это стандарт, объединяющий открытые технологии для строительства и оборудования центров обработки данных (ЦОДов). Он регламентирует, как проектируется дата-центр и его инженерные коммуникации, а также унифицирует физические и технические параметры всей «начинки» ЦОДа — от стоек и шкафов до серверов и сетевого оборудования. Аппаратное и программное обеспечение разрабатывается на основе открытых спецификаций.

Какое оно — «железо» OCP?

В итоге благодаря постоянному обмену опытом мировые «монстры» ИТ-рынка сформировали стандарт OCP. С одной стороны, он позволяет использовать унифицированное (взаимозаменяемое и совместимое) оборудование от разных производителей в ЦОДах. С другой стороны — помогает снизить расходы на масштабирование и обслуживание ИТ-инфраструктуры.

Чего удалось достичь в рамках стандарта OCP:

  • Увеличенная плотность размещения: благодаря особой конструкции шкафов, на том же пространстве можно разместить больше серверов.
  • Высокая энергоэффективность: сервер запитывается от источника питания стойки посредством общей шины.
  • Упрощенное обслуживание: доступ к оборудованию производится только с фронтальной стороны (холодного коридора) и без использования инструментов.
  • Понятная стоимость: за счет стандартизации, упрощенной конструкции и отсутствия избыточного аппаратного функционала стоимость решений прозрачна для покупателей.
  • Отсутствие зависимости от вендора (vendor lock-in). Оборудование и комплектующие производятся по открытым спецификациям, все компоненты могут быть интегрированы между собой и изначально взаимозаменяемы.

Как GAGAR>N использует технологии OCP

OCP уникален тем, что предлагает комплекс открытых аппаратных и программных решений для ЦОДов. С инженерной точки зрения получилась очень стройная система. За проектом стоит огромная коллективная работа. По сути, это первый в мире открытый комплексный «железячный» проект.

Технологии опробованы на сотнях и тысячах инсталляциях по всему миру — не нужно изобретать велосипед, когда можно взять инструкцию к его созданию.

Алиса Гатауллина, архитектор программного обеспечения в GAGAR>N

Когда в 2019 году стал очевиден спрос на серверы российского производства, основатели GAGAR>N решили действовать. Тогда же они познакомились с концепцией OCP. Помимо прогрессивного подхода привлекало то, что использование международного стандарта снижало первоначальные риски бизнеса — провала на стадии разработки быть не должно. Кроме этого, подход OCP ускорял и упрощал вход в такую сложную технологическую сферу как серверное оборудование. Казалось, что нужно просто выбрать платформу, скачать открытую документацию и наладить производство комплектующих и сборку на территории России. Однако на практике все оказалось не так просто.

Так выглядит сервер GAGAR>N
Так выглядит сервер GAGAR>N

Выбрали платформу Tioga Pass — это известная на рынке серверная платформа, на основе которой разные вендоры выпускают свои серверы. Исходная документация, размещенная на сайте OCP, включает схемотехнику, чертежи механики, список компонент. Однако конструкторскую и технологическую документацию для производства и запуска линий монтажа и пайки нужно разрабатывать самостоятельно. Мы взяли за основу выложенные в открытом доступе материалы, разработали на их основе всю необходимую конструкторскую документацию, проработали логистику всей компонентной и элементной базы (более 500 номенклатурных единиц), заменили недоступные в России микроэлементы на эквиваленты и подготовили технологическую документацию согласно требованиям и возможностям имеющихся в России производственных линий.

Кроме этого, не все так просто оказалось с программным обеспечением. В открытом доступе лежал код UEFI (BIOS) и код контроллинга мониторинга сервера, но очень минимального базового функционала. Они позволяли запустить операционную систему сервера, но этого было недостаточно для встраивания в инфраструктуру.

Пришлось довольно много кодить самим.

Алиса Гатауллина, архитектор программного обеспечения в GAGAR>N

Кроме того ПО сервера — это не только два упомянутых выше кода, но и много прошивок конфигураций для специализированных чипов, отвечающих за аппаратную работу интерфейсов. Их тоже пришлось дорабатывать. В дальнейшем мы стали наращивать собственные компетенции в программировании.

Сначала команда разработки состояла из схемотехника, программиста, тополога и конструктора. Но выбранные решения пришлось глубоко и всесторонне прорабатывать, поэтому команда быстро росла — на каждой позиции стали работать по несколько человек. Кроме этого, появлялись новые специалисты — тестировщики, технологи для производства и другие. Сегодня разработкой решений занимается порядка 40 человек.

Несмотря на необходимость глубокой проработки производственной документации и заминку с софтом, использование опыта сообщества OCP сильно ускорило процесс запуска производства.

Первые сервера GAGAR>N установлены на площадках заказчиков в августе 2021 года. За прошедший с тех пор год с небольшим мы произвели больше 10 тыс. серверов.

Участие в комьюнити

Сегодня GAGAR>N — полноценный участник сообщества Open Compute Project. Мы получили сертификат соответствия стандарту OCP, статус поставщика OCP решений и являемся официальным центром экспертизы OCP в России.

27 октября мы открыли модернизированную лабораторию OCP, где есть возможность протестировать все наше оборудование. Это единственная подобная лаборатория в России и один из семи центров компетенций OCP в Европе.

В OCP Experience Center можно познакомиться с особенностями открытого стандарта и готовыми архитектурными решениями.
В OCP Experience Center можно познакомиться с особенностями открытого стандарта и готовыми архитектурными решениями.

Мы не только используем технологии OCP, но и вносим вклад в сообщество — разместили исходные коды разработанного нами софта в открытый доступ. Сейчас работаем над новым «железным» проектом, документацией которого тоже поделимся с миром.

В заключение хочется отметить, что OCP для нас и наших заказчиков — это способ поддерживать связь с мировым инженерным сообществом и возможность использовать прогрессивные разработки для создания собственных продуктов и построения инфраструктур. Сегодня подходы Open Source Software и Open Source Hardware, включая OCP, открывают окно в мир передовых технологий.

4040
63 комментария

Статья вроде и интересная, но крайне поверхностная, к тому же пестрит неоднозначными фразами начиная с заголовка: "Как мы использовали открытый стандарт для создания российского сервера"
Т.е. звучит так, как будто вы создали свой сервер, ну MB, CPU, DRAM ECC там...
Или всё же речь идёт о серверных стойках, проводке питания и внедрения схем размещения готовых серверов в ЦОД? Или корпуса для серверов?
Что вы в итоге создали то?

3
Ответить

Я думаю там даже эти зелёные защёлки не в России сделаны. Хотелось бы реально услышать что именно было сделано в России.

3
Ответить

Т.е. звучит так, как будто вы создали свой сервер, ну MB, CPU, DRAM ECC тамКакая-то странная претензия. Много ли своих процессоров разработала Dell?

6
Ответить

Со стороны как-то неоправданно агрессивно звучит ваш вопрос. Зайдите к ним на сайт, посмотрите, что сделано. Я так понимаю, есть производство в России, попроситесь на экскурсию.
Почему россияне всегда собой недовольны :) Никогда сделанного недостаточно. Как будто в мире полным-полно фирм, кто делает процессоры.

4
Ответить

Выглядит как: взяли готовый стандарт и наладили по нему производства в России. Тоже неплохо. Раньше то не было.

Ответить

Основной продукт - сервер GAGAR>N V1, созданный на основе спецификаций консорциума Tioga Pass. Однако если попытаться повторить эту спецификацию один к одному - это практически невозможно. Нами была произведена полная переработка схемотехники, топологии, сами написали BMC и UEFI.

1
Ответить

Очень любопытно, не знал, что в этой отрасли существуют открытые стандарты. Казалось, что это только в разработке софта и отдельных компонентов железа, а тут прямо можно цоды строить по стандарту.

3
Ответить