Клуб (не)анонимных любителей мониторинга
Почему мы захотели сделать «Школу мониторинга»
С 17 по 19 января Слёрм с друзьями проводит «Школу мониторинга» — бесплатную онлайн-конференцию для всех, кто душой, сердцем и деньгами вовлечен в процесс мониторинга. В водовороте новогодней суеты нам удалось поговорить с идейными вдохновителями стрима и несколькими спикерами
«Школа мониторинга» будет состоять из 3 секций:
- 17 января — философия мониторинга. Обсуждаем observability, архитектуру мониторинга и соответствующие процессы в компании.
- 18 января — техническая секция. Разбираем кейсы, инструменты и другие практические вопросы мониторинга.
- 19 января — бизнес-секция. Обсуждаем, как извлечь из мониторинга максимум ценности для бизнеса.
Узнать подробности и зарегистрироваться можно здесь.
Антон Скобин
Я люблю делать большие бесплатные проекты и просто соскучился по ним со времен «Вечерней Школы по Kubernetes для разработчиков», к которой приложил обе руки и еще немного мозгов.
Я много слышал, что мониторинг — история индивидуальная, нельзя собрать общие рекомендации и правила. Я подумал, что просто не нашлось подходящего фреймворка для обсуждения, и мне захотелось его поискать. Придумать формат, в котором из этой темы исчезнет мистический налет сложности.
Кроме Слёрма я работаю в компании Southbridge, мы занимаемся системным администрированием. Мы регулярно получаем от клиентов запросы: «Настройте мне мониторинг». Приходится объяснять, что мониторинг — это совместная работа, нельзя просто кинуть его во внешних девопсов и сказать «Сделайте мне всё красиво». Мы, конечно, замониторим свою часть, а потом на стороне клиента что-то сломается, и он придёт с претензией к нам. Чем больше людей понимает суть мониторинга, тем меньше таких ситуаций происходит в моей жизни.
В Слёрме есть курс по мониторингу, который не пользуется особой популярностью. Я бы хотел развить эту тему и доработать курс.
И меня дико прёт идея поговорить про то, как бизнес (продакт оунеры, директора) используют мониторинг для достижения своих целей. И вообще все диалоги исполнителя и бизнеса, на какой бы стороне в них я ни находился.
Илья Сабуров
Когда Слёрм решил сделать«Школу мониторинга», я с удовольствием отклинулся на приглашение продюсировать проект. Всю жизнь занимаюсь управлением разработкой интернет-проектов и поэтому не понаслышке знаю про важность мониторинга, причем мониторинга не только «железа», но и мониторинга на уровне логики приложения и уровне бизнес-процессов, использующих это приложение.
В моем предыдущем проекте — очень популярной онлайн-школе в Бразилии — у нас был двойной рабочий день: начинали мы в 9 по Москве, а заканчивали в 18, но по Сан-Пауло, а это полночь в Москве.
Однажды звезды сошлись таким образом, что один из наших микросервисов — веб-чат в вебинарах — перестал справляться с резко возросшей нагрузкой и подарил нам пару недель ночных бдений, пока команда искала причины аварий, спешно мигрировала сервис в Kubernetes и по пути рефакторила логику приложения. А пока происходила вся эта инженерная магия, по ночам приходилось оказывать психологическую поддержку пользователям, ведь вебинары шли с 19 до 21 по Сан-Пауло, то есть с 1 до 3 часов ночи по Москве.
Виктор Попов
Коротко я могу сказать так: чтобы спать ночью спокойно.
В своей работе набил немало шишек о плохой мониторинг: и пропускал важные события и просыпался из-за ерундовых алертов. Теперь хочу, поделиться опытом, чтобы мы все спали спокойнее.
Мониторинг — это недорого, его можно делать за вменяемые ресурсы. А ещё мониторинг — это про честность и открытость, про прозрачность инцидентов. Мой моральный ориентир — ребята из GitLab, которые выкладывают все метрики в публичный доступ. Я не верю сервисам, которые пишут, что у них «ничего никогда не падает» — явно же падает.
Виктор выступит в первый и второй день конференции. Темы его докладов:
- «Горшочек, не вари! Сколько алертов вам нужно?» В докладе увидим жизненный цикл алерта, важность алертов и обсудим, как сделать так, чтобы алерты стали не раздражающим фактором, а рабочим инструментом.
- «Как подготовить команду к инцидентам» Обсудим, как выстроить коммуникацию так, чтобы инциденты проходили максимально спокойно и ничто не отвлекало инженеров от спасения прода в кратчайшие сроки.
Андрей Менде
Мне хочется рассказать, как моей команде круто удалось срастить мониторинг и продуктовые метрики. Вместо того, чтобы воспринимать мониторинг как средство от аварий, мы воспринимаем его как инструмент для управления продуктом. Мы поняли, что самый лучший инструмент от аварий — это смириться с тем, что они будут происходить: в этом случае процесс становится куда более управляемым. Лучше заранее понимать сценарии развития проблем, предусмотреть их и протестировать пути решения, чем паниковать каждый раз по-новой.
Андрей выступит в третий день, тема его доклада — «Мониторинг и скорость развития продукта». Спикер расскажет, как за счет мониторинга и грамотных механизмов устойчивости можно значительно ускорить продуктовую разработку и выйти на новые финансовые показатели.
Алексей Леонтьев
Я захотел поучаствовать в «Школе мониторинга» Слёрма, чтобы рассказать коллегам о комфортном мониторинге и о том, как его реализовать. Важно понимать, что метрики, алерты, хелсчеки — всё это делается для людей, а не для машин. Для грамотной настройки мониторинга нужно представлять сценарии использования собранных данных. Эргономичный мониторинг позволяет не страдать при расследовании проблем пользователей, так как сокращает время на поиск причин проблемы и позволяет проще её локализовать. Но ещё важнее это становится при расследовании инцидентов.
Алексей выступит во второй день «Школы». Тема его доклада — «Эргономичный мониторинг на практике». В этом докладе пойдет речь о том, как подойти к реализации мониторинга со стороны разработки так, чтобы он был полезен и удобен в использовании.
Будем рады видеть вас на нашем стриме.