Заменит ли автоматическое оповещение NOC?
- Увеличение отношения сигнал / шум
- Управление контактной информацией
- Меньше телефонных звонков, больше разрешения инцидентов
- Отчетность и метрики
- Эскалируйте к своим клиентам или руководству
от Сэм Льюис
26 марта 2015 г.
Источник изображения
Если у вас есть Центр управления сетью (или NOC , как называют это дети), у вас есть опытный наблюдатель, который наблюдает за вашей системой и предупреждает ваших инженеров, когда что-то идет не так. (Если у вас есть что-то вроде NOC, например, команда первого уровня, которая обрабатывает билеты, мы тоже смотрим на вас). У вас также, вероятно, есть строгие соглашения об уровне обслуживания и постоянная потребность в высокой доступности. Вы не можете тратить ни секунды, когда дела идут плохо. Решения как PagerDuty которые помогут вам быстрее выявлять и устранять инциденты и повышать производительность вашего Центра сетевых операций. Эти решения могут сэкономить минуты на обнаружении инцидентов (один из наших клиентов взял на себя 8 минут), а персонал NOC может при необходимости обратиться к экспертам.
Мы нашли пять способов, которыми наши клиенты используют PagerDuty для улучшения своих NOC.
Увеличение отношения сигнал / шум
НОК обрабатывают большое количество билетов и могут легко стать жертвами настороженная усталость , что делает их менее эффективными при выполнении своей работы. Если они сжигают свою энергию, разбирая неважные билеты, у них меньше внимания на критические вещи.
PagerDuty может быть настроен для оповещения вашего NOC о серьезных сбоях, помогая отделить важные от неважных и сосредоточиться на быстрой сортировке проблем. Некоторые НОК получают более 10000 электронная почта неделю от их инструментов мониторинга. Даже с установленными пороговыми значениями и фильтрами электронной почты этот объем информации неизбежно будет означать, что на настенных графиках и очередях заявок вашего NOC будет больше шума, чем в случае действительных предупреждений.
Управление контактной информацией
В разгар перебоев NOC не может терять драгоценные минуты, удовлетворяя особые предпочтения в контактах со снежинками. До PagerDuty некоторые НОКы искали членов команды на Confluence и молились, чтобы работал один из нескольких телефонных номеров. PagerDuty предоставляет предметным экспертам право владения своей контактной информацией и помогает им понять, насколько важно постоянно обновлять ее. Фактически, одно из ключевых предложений PagerDuty для NOC - иметь контактную информацию каждого в одном месте. Таким образом, ваши сотрудники NOC не играют оператора; они ценные помощники в каждом инциденте.
Меньше телефонных звонков, больше разрешения инцидентов
С PagerDuty наши клиенты NOC более эффективно работают с нужными людьми. Они могут просто создать инцидент в PagerDuty, чтобы вызвать персонал по вызову. PagerDuty хранит предпочтительные методы контакта каждого пользователя и персональные правила оповещения, чтобы при возникновении инцидента телефонные звонки происходили автоматически. Кроме того, PagerDuty сохраняет расписание вызовов и автоматически обостряется инциденты для следующего человека в очереди, если нет ответа, так что правильный эксперт всегда найден. После этого НОК могут перейти от телефонных звонков к отслеживанию и облегчению разрешения. Например, они могут установить конференц-мосты для всей команды, а затем оставаться на линии, чтобы активно работать с ними, без необходимости отвлекаться, чтобы найти другого человека. Это позволяет НОК больше участвовать в процессе разрешения, а не просто делать телефонные звонки. Имея единую точку для мониторинга разрешения инцидента, каждый может видеть, как происходит инцидент. Своевременное общение с нужными людьми означает, что вы можете решать проблемы до того, как они выйдут из-под контроля.
Отчетность и метрики
Лучшие команды используют метрики для постоянной оценки и улучшения своих процессов. Наши клиенты с NOC используют PagerDuty расширенная аналитика рассчитать время безотказной работы и доступность, а также определить, сколько времени потребуется вашему NOC, чтобы ответить и решить. У вас есть команды, которые нуждаются в дополнительном обучении? Ваша книга запуска обновлена? Метрики могут помочь вам получить ответы на эти и другие вопросы. Вы также можете использовать наш потрясающий API чтобы получить именно ту информацию, которая вам нужна, а затем вы можете распространять ее для большей наглядности в масштабах всей компании. Некоторые из наших клиентов NOC используют PagerDuty для получения ежедневного отчета, который каждое утро отправляется руководству.
Эскалируйте к своим клиентам или руководству
Если вы предоставляете инжиниринговые услуги своим клиентам, вам, возможно, придется сообщить своим клиентам о ваших происшествиях. Кроме того, при серьезных перебоях вам, возможно, придется сообщить руководителям вашего предприятия, что что-то не так. PagerDuty может помочь в обеих этих ситуациях. Например, один из наших клиентов, Cascadeo, использует PagerDuty именно так , Cascadeo обеспечивает долгосрочную инфраструктуру DevOps и поддержку операций для широкого круга клиентов, и их клиенты должны знать, когда происходит инцидент, чтобы их инженерные группы могли реагировать. Его NOC создает очереди по вызову в PagerDuty, которые связаны с каждым клиентом. Это позволяет NOC, ведущему инженеру или руководителю проекта, связанному с клиентом, автоматически отправлять оповещения контактам эскалации клиента. Аналогичный рабочий процесс можно настроить для уведомления других заинтересованных сторон о критических инцидентах.
Как вы используете PagerDuty с вашим NOC? Дайте нам знать в комментариях ниже.
У вас есть команды, которые нуждаются в дополнительном обучении?Ваша книга запуска обновлена?
Как вы используете PagerDuty с вашим NOC?