{"id":14289,"url":"\/distributions\/14289\/click?bit=1&hash=892464fe46102746d8d05914a41d0a54b0756f476a912469a2c12e8168d8a933","title":"\u041e\u0434\u0438\u043d \u0438\u043d\u0441\u0442\u0440\u0443\u043c\u0435\u043d\u0442 \u0443\u0432\u0435\u043b\u0438\u0447\u0438\u043b \u043f\u0440\u043e\u0434\u0430\u0436\u0438 \u043d\u0430 5%, \u0430 \u0441\u0440\u0435\u0434\u043d\u0438\u0439 \u0447\u0435\u043a \u2014 \u043d\u0430 20%","buttonText":"","imageUuid":""}

Инцидентное управление в IT

Рассказываем, что такое инцидентное управление, из каких этапов состоит и как выбрать инструмент, который поможет организовать слаженную работу IT-службы.

Управление инцидентами (Incident Management) – один из основных процессов в работе IT-компаний или организаций, в которых есть IT-отдел. Когда этот процесс автоматизирован, команда оперативно выявляет и устраняет сбои в работе сервиса или информационной системы. И тем самым снижает размер ущерба для бизнеса.

О том, что понимается под инцидентами и как организовать работу с ними в компании – расскажем далее.

Понятие инцидента

В методологии ITIL (Information Technology Infrastructure Library), о которой мы подробно рассказывали в одной из наших статей, инцидент – это внезапное событие, которое приводит к снижению качества работы информационной системы или сервиса. Например, инцидентами являются отсутствие доступа к приложению, «зависание» корпоративной почты, сбой подключения к сети или снижение скорости интернет-соединения.

Такие сбои могут приводить к недовольству пользователей, потере клиентов и значительным финансовым убыткам, потому нейтрализовывать их нужно максимально быстро.

А чтобы команда действовала оперативно и слажено, в компании должен быть выстроен процесс управления инцидентами – деятельность по восстановлению нормальной работы сервиса. В ходе этого процесса сотрудники компании обнаруживают инциденты, расследуют их, устраняют и документируют шаги, которые были предприняты для нормализации работы системы.

Этапы процесса управления инцидентами

В целом в управлении инцидентами можно выделить 8 основных этапов.

1. Выявление

Инцидент может обнаружить кто угодно. Но чаще всего в этом помогают пользователи, которые взаимодействуют с сервисом: если возникает сбой, они обращаются в техническую поддержку с жалобой. В этом случае важно, чтобы менеджер первой линии поддержки быстро отреагировал на заявку и направил ее ответственному специалисту, который предпримет меры для устранения сбоя.

Также в выявлении инцидентов помогают специальные системы мониторинга – SIEM (Security Information and Event Management). Они сфокусированы на ситуациях, связанных с информационной безопасностью: фильтруют сигналы, мониторят угрозы, фиксируют каждый шаг злоумышленников в случае кибератаки и выявляют взаимосвязи между инцидентами.

2. Регистрация

После выявления инцидента его необходимо зафиксировать: указать дату и время обнаружения, контактную информацию того, кто о нем сообщил, детально описать событие. Также на этом этапе инциденту присваивается идентификатор для дальнейшего отслеживания.

От того, насколько точны будут сведения о ситуации, зависит, как быстро удастся ее разрешить и закрыть.

3. Определение категории

Все инциденты сортируются по разным категориям, например, по IT-услугам, на которые влияет возникший сбой. Нередко именно от категории зависит, какие IT-специалисты будут нейтрализовывать инцидент и как быстро нужно это сделать.

Также категоризация позволяет анализировать тренды по схожим инцидентам, выявлять их первопричины и определять, какие действия необходимы, чтобы подобного не случалось в будущем.

4. Расстановка приоритетов

На этом этапе каждому инциденту присваивают приоритет в зависимости от важности его устранения.

Чтобы определить срочность ситуации, нужно оценить ее влияние на безопасность компании и клиентов, число пользователей, которых она затронет, возможные финансовые потери, репутационные риски. Также важно учитывать параметры, указанные в соглашении об уровне обслуживания – SLA. А если в работе есть другие инциденты, то новое событие необходимо сравнить с ними и уже после этого расставлять приоритеты.

5. Первоначальная диагностика

На этом этапе к процессу подключаются специалисты, которые должны устранить инцидент. Они проводят диагностику, чтобы определить, каковы причины сбоя и насколько он масштабен.

6. Эскалация

Если возникает сложность с устранением инцидента, то его перенаправляют более квалифицированных сотрудникам или руководству.

7. Решение

После того, как были выявлены причины инцидента, начинается процесс по восстановлению работы сервиса.

Когда инцидент решен, информация об этом передается в службу поддержки. Далее менеджеры связываются с пользователем, который сообщил и проблеме. И если он подтверждает, что сбой устранен, то задачу закрывают. Пользователь, в свою очередь, может оценить качество обслуживания.

Роль сервис-деска в инцидентном управлении

Как мы видим, в рамках цикла управления инцидентами сотрудникам компании приходится совершать большое количество действий. Когда этот процесс не автоматизирован, работа по устранению сбоев обычно бывает хаотичной, ресурсы распределяться неравномерно, также возникают сложности с определением приоритета задач.

Как следствие, может возникнуть ряд проблем:

  • Конечному пользователю будет непонятно, каков статус его обращения и когда ситуация будет исправлена.
  • Неверное протоколирование произошедших инцидентов.
  • Отсутствие информации о решениях для повторяющихся ситуаций.
  • Простои в случае масштабных инцидентов.
  • Нарушение сроков решения проблем.
  • Снижение удовлетворенности и лояльности клиентов.

Упростить и ускорить процесс управления инцидентами можно с помощью таких систем, как сервис-деск. Они позволяют:

  • Собирать обращения пользователей из разных источников: соцсетей, мессенджеров, почты, и быстро узнавать о сбоях в работе сервиса.
  • Автоматически классифицировать инциденты.
  • Автоматически направлять заявку ответственному сотруднику.
  • Фиксировать всю информацию о событии и пользователе, который о нем сообщил.
  • Присваивать инциденту приоритет.
  • Контролировать сроки, прописанные в соглашении об уровне сервиса (SLA).
  • Документировать всю информацию об инциденте во встроенной базе знаний.
  • Автоматически оповещать клиента о статусе работы с заявкой.
  • Контролировать, точно ли ситуация была разрешена.
  • Анализировать эффективность работы IT-службы.

О том, как выбрать наиболее подходящий сервис-деск для управления инцидентами, читайте здесь.

0
Комментарии
-3 комментариев
Раскрывать всегда