Разработка и внедрение системы комплексного контроля состояния ИТ-ландшафта для ИТ компании (мониторинг)

Разработка и внедрение системы комплексного контроля состояния ИТ-ландшафта для ИТ компании (мониторинг)

Отрасль:
Коммерческие организации;
строительные компании.

Год: 2018

Числовые показатели:
94 информационные системы; 405 серверов; 5 филиалов;

Цель:

Получать сведения, о состояние информационных систем, без участия технического специалиста.

Результат:

  • Выявленные показатели работоспособности ИТ приложений компаний;
  • Исследованы зависимости ИТ-приложений и инфраструктуры;
  • Разработана система информирования, о выходе из строя конкретных узлов и приложений;
  • Разработаны микро-сервисы системы мониторинга на базе свободно распространяемого программного обеспечения Zabbix;
  • Разработана система предиктивного анализа неисправности;
  • Внедрена система информирования, основанная на мандатной модели выбора цели оповещения;
  • Разработаны методологические рекомендации по оптимизации работы ИТ-ландшафта компании по показателям отказоустойчивости.

Сложность:

  • В компании использовалось 94 ИТ приложения, разработанных или доработанных для своих нужд, что в свою очередь требовало индивидуального подхода к выявлению показатели работоспособности;
  • Требовался индивидуальный подхода к каждой единицы техники ввиду того, что сервера и коммуникационное оборудование были различных производителей;
  • Для доступа к информационным системам необходимо было провести ряд согласований со службами эксплуатации и информационной безопасности.

Выполненные работы:

  • Произведен аудит ИТ-инфраструктуры компании, с созданием визуализированный карты;
  • Развернута группа серверов системы мониторинга, под управлениями свободно распространяемого программного обеспечения с открытым исходным кодом;
  • Развернуты сервера баз данных для работы с «большими данными» для хранения и дальнейшей аналитики событий мониторинга;
  • Настроен сервис подготовки аналитических отчетов;
  • Разработана и внедрена система оповещения, о выходе из строя конкретного оборудования и сервиса, с автоматизированной подготовкой прогноза, о том, какие приложения будут недоступны для использования в результате сбоя.