Заменит ли автоматическое оповещение NOC?

  1. Увеличение отношения сигнал / шум
  2. Управление контактной информацией
  3. Меньше телефонных звонков, больше разрешения инцидентов
  4. Отчетность и метрики
  5. Эскалируйте к своим клиентам или руководству

от Сэм Льюис
26 марта 2015 г.

Источник изображения Источник изображения

Если у вас есть Центр управления сетью (или NOC , как называют это дети), у вас есть опытный наблюдатель, который наблюдает за вашей системой и предупреждает ваших инженеров, когда что-то идет не так. (Если у вас есть что-то вроде NOC, например, команда первого уровня, которая обрабатывает билеты, мы тоже смотрим на вас). У вас также, вероятно, есть строгие соглашения об уровне обслуживания и постоянная потребность в высокой доступности. Вы не можете тратить ни секунды, когда дела идут плохо. Решения как PagerDuty которые помогут вам быстрее выявлять и устранять инциденты и повышать производительность вашего Центра сетевых операций. Эти решения могут сэкономить минуты на обнаружении инцидентов (один из наших клиентов взял на себя 8 минут), а персонал NOC может при необходимости обратиться к экспертам.

Мы нашли пять способов, которыми наши клиенты используют PagerDuty для улучшения своих NOC.

Увеличение отношения сигнал / шум

НОК обрабатывают большое количество билетов и могут легко стать жертвами настороженная усталость , что делает их менее эффективными при выполнении своей работы. Если они сжигают свою энергию, разбирая неважные билеты, у них меньше внимания на критические вещи.

PagerDuty может быть настроен для оповещения вашего NOC о серьезных сбоях, помогая отделить важные от неважных и сосредоточиться на быстрой сортировке проблем. Некоторые НОК получают более 10000 электронная почта неделю от их инструментов мониторинга. Даже с установленными пороговыми значениями и фильтрами электронной почты этот объем информации неизбежно будет означать, что на настенных графиках и очередях заявок вашего NOC будет больше шума, чем в случае действительных предупреждений.

Управление контактной информацией

В разгар перебоев NOC не может терять драгоценные минуты, удовлетворяя особые предпочтения в контактах со снежинками. До PagerDuty некоторые НОКы искали членов команды на Confluence и молились, чтобы работал один из нескольких телефонных номеров. PagerDuty предоставляет предметным экспертам право владения своей контактной информацией и помогает им понять, насколько важно постоянно обновлять ее. Фактически, одно из ключевых предложений PagerDuty для NOC - иметь контактную информацию каждого в одном месте. Таким образом, ваши сотрудники NOC не играют оператора; они ценные помощники в каждом инциденте.

Меньше телефонных звонков, больше разрешения инцидентов

С PagerDuty наши клиенты NOC более эффективно работают с нужными людьми. Они могут просто создать инцидент в PagerDuty, чтобы вызвать персонал по вызову. PagerDuty хранит предпочтительные методы контакта каждого пользователя и персональные правила оповещения, чтобы при возникновении инцидента телефонные звонки происходили автоматически. Кроме того, PagerDuty сохраняет расписание вызовов и автоматически обостряется инциденты для следующего человека в очереди, если нет ответа, так что правильный эксперт всегда найден. После этого НОК могут перейти от телефонных звонков к отслеживанию и облегчению разрешения. Например, они могут установить конференц-мосты для всей команды, а затем оставаться на линии, чтобы активно работать с ними, без необходимости отвлекаться, чтобы найти другого человека. Это позволяет НОК больше участвовать в процессе разрешения, а не просто делать телефонные звонки. Имея единую точку для мониторинга разрешения инцидента, каждый может видеть, как происходит инцидент. Своевременное общение с нужными людьми означает, что вы можете решать проблемы до того, как они выйдут из-под контроля.

Отчетность и метрики

Лучшие команды используют метрики для постоянной оценки и улучшения своих процессов. Наши клиенты с NOC используют PagerDuty расширенная аналитика рассчитать время безотказной работы и доступность, а также определить, сколько времени потребуется вашему NOC, чтобы ответить и решить. У вас есть команды, которые нуждаются в дополнительном обучении? Ваша книга запуска обновлена? Метрики могут помочь вам получить ответы на эти и другие вопросы. Вы также можете использовать наш потрясающий API чтобы получить именно ту информацию, которая вам нужна, а затем вы можете распространять ее для большей наглядности в масштабах всей компании. Некоторые из наших клиентов NOC используют PagerDuty для получения ежедневного отчета, который каждое утро отправляется руководству.

Эскалируйте к своим клиентам или руководству

Если вы предоставляете инжиниринговые услуги своим клиентам, вам, возможно, придется сообщить своим клиентам о ваших происшествиях. Кроме того, при серьезных перебоях вам, возможно, придется сообщить руководителям вашего предприятия, что что-то не так. PagerDuty может помочь в обеих этих ситуациях. Например, один из наших клиентов, Cascadeo, использует PagerDuty именно так , Cascadeo обеспечивает долгосрочную инфраструктуру DevOps и поддержку операций для широкого круга клиентов, и их клиенты должны знать, когда происходит инцидент, чтобы их инженерные группы могли реагировать. Его NOC создает очереди по вызову в PagerDuty, которые связаны с каждым клиентом. Это позволяет NOC, ведущему инженеру или руководителю проекта, связанному с клиентом, автоматически отправлять оповещения контактам эскалации клиента. Аналогичный рабочий процесс можно настроить для уведомления других заинтересованных сторон о критических инцидентах.

Как вы используете PagerDuty с вашим NOC? Дайте нам знать в комментариях ниже.

У вас есть команды, которые нуждаются в дополнительном обучении?
Ваша книга запуска обновлена?
Как вы используете PagerDuty с вашим NOC?