Application Uptime для повышения стабильности вашего бизнеса

Что такое Uptime и почему это важно для бизнеса?

Под Uptime информационной системы: интернет-магазина, web-сайта, CRM или ERP-системы подразумевается бесперебойная работа системы за определенный период времени. Данный параметр измеряется в процентах и является одним из существенных при оценке надежности хостинга, сервера или бизнес-приложения.

В условиях, когда даже кратковременная внеплановая остановка бизнес-приложения приводит к существенным потерям, крайне важно обеспечивать высокое значение показателя Uptime.

Реалии бизнеса зачастую требуют почти 100% доступности бизнес-приложения. Сегодня перед требовательными клиентами и заказчиками открыт огромный выбор всевозможных сервисов, товаров и услуг со схожими характеристиками и ценой. Поэтому любая задержка в обработке заказа из-за технических проблем в информационной системе может отправить ваших клиентов и заказчиков к конкурентам. Как следствие – упущенная выгода и возможная потеря клиентов.

Важность Uptime непрерывно повышается вместе с ростом масштабов информационных систем – десятки и сотни компонентов серверной инфраструктуры и баз данных, сложнейшие интеграции между web компонентами клиентского интерфейса и back компонентами e-commerce, ERP, CRM, WMS и других информационных систем. Современные системы автоматизации бизнеса становятся все более сложными, при этом сбой в работе одного компонента может привести к задержке в обработке нескольких тысяч заказов клиентов.

Современные требования к значению Uptime находятся в диапазоне 99-99,999%. Например, если Uptime сервера составляет 99%, то в течение года он будет недоступен более 80 часов. А если обеспечить Uptime 99,99%, то время простоя вашего сервера уменьшится примерно до 50 минут в течение того же периода.

Очевидно, что цель достичь 100% Uptime не выполнима и не обоснована с экономической точки зрения: очень высокий показатель бесперебойной работы может говорить о том, что оборудование и программное обеспечение редко обновляются, а это в свою очередь ограничивает развитие клиентского сервиса. При этом затраты на увеличение % Uptime растут не линейно и в какой-то момент достигают стоимости потерь от кратковременного простоя.

Поэтому наиболее эффективен комплексный подход к обеспечению требуемого уровня Uptime, рассматривающий все компоненты информационной системы, альтернативные варианты достижения целевого значения Uptime, а также учитывающий затраты на обеспечение высокой доступности и возможные потери от простоя.

Какие вопросы требуют решения для обеспечения высокого уровня доступности информационной системы ?

Сегодня любое предприятие невозможно представить без систем автоматизации бизнес-процессов. При этом для надежной работы ключевых бизнес-процессов, необходимо поддерживать требуемые значения Uptime для всех компонентов ИТ- инфраструктуры, обеспечивающих выполнение бизнес-процесса:

  • в первую очередь, для сложных комплексных систем важно выявить наиболее критичные для бизнеса процессы и связанные с ними информационные системы, на которых необходимо сфокусироваться для обеспечения требуемого уровня Uptime;
  • далее нужно сформировать полный список объектов (компонентов систем) для мониторинга и обслуживания: - серверы баз данных, серверы бизнес-приложений (ERP, CRM, WMS системы и т.п.), терминальные серверы, клиентские интерфейсы и т.д.;
  • надежность сохранности данных требует организации автоматического резервного копирования и проверки доступности данных для восстановления;
  • необходимо в автоматическом режиме контролировать своевременность обновления операционных систем, серверов баз данных и бизнес-приложений;
  • также необходимо обеспечить высокий уровень производительности информационных систем.

Как обеспечить показатель Uptime на требуемом уровне ?

Оптимальный выбор необходимых сервисов, инструментов мониторинга и обслуживания, способов оповещения о произошедших инцидентах и т.п. производится для каждой информационной системы индивидуально.

Но наиболее важным является оптимальный подбор контролируемых параметров здоровья информационной системы и их пороговых значений, позволяющих без ущерба для производительности системы осуществлять непрерывный автоматический мониторинг работы системы.

Например:

  • автоматические оповещения в случае приближения к пороговому значению количества блокировок в базе данных и времени длительности обработки в системе критичного процесса, скажем более, чем на 1 минуту;
  • оповещения о занятости дискового пространства систем хранения данных более чем на 80%;
  • оповещения об остановке автоматических процессов резервного копирования, тестового восстановления данных из архивов, передачи данных между информационными системами и т.п.;
  • оповещения о достижении критических значений зарезервированного/ не зарезервированного кол-ва запасов на складах
  • и т. д.

В зависимости от сложности информационной системы и количества объектов мониторинга, количество контролируемых метрик и их значений может варьироваться от нескольких десятков до нескольких сотен.

Для повышения эффективности процессов автоматического мониторинга и обслуживания, мы рекомендуем использовать специализированное программное обеспечение.

0
Комментарии
-3 комментариев
Раскрывать всегда