严重性级别
任何事件响应过程的第一步是确定实际构成事件的内容。然后,事件可以按严重性分类,通常使用“SEV”定义进行,编号越低的严重性越紧急。操作问题可以归类为这些严重性级别之一,通常您可以采取更具风险的措施来解决更高严重性的问题。任何高于SEV-3的事件都会自动被视为“重大事件”,并得到比正常事件更密集的响应。
始终假设最坏情况
如果您不确定事件的级别(例如不确定是SEV-2还是SEV-1),将其视为更高的级别。在事件期间不是讨论或争论严重性的时间,只需假设最高级别并在事后审查。
SEV-3可以是重大事件吗?
所有SEV-2都是重大事件,但并非所有重大事件都需要是SEV-2。如果您需要协调响应,即使是较低严重性的问题,也要触发我们的应急响应流程。事件指挥官可以决定是否需要全面的事件响应。
严重性 | 描述 | 典型响应 |
---|---|---|
SEV-1 |
需要公开通知并与执行团队联络的严重问题。
|
重大事件响应。
|
SEV-2 |
正在积极影响许多客户使用产品的关键系统问题。
|
重大事件响应。
|
此行以上的任何事件都被视为“重大事件”。对于任何重大事件,都应触发我们的应急响应流程。 | ||
SEV-3 |
需要服务所有者立即关注的稳定性或轻微客户影响问题。
|
高紧急度呼叫服务团队。
|
SEV-4 |
需要采取行动的轻微问题,但不影响客户使用产品。
|
低紧急度呼叫服务团队。
|
SEV-5 |
不影响客户使用产品的外观问题或错误。
|
JIRA工单。
|
具体明确
这些严重性描述已从PagerDuty内部定义修改为更通用。对于您自己的文档,建议您使定义非常具体,通常指受影响的用户/账户的百分比。您通常希望您的严重性定义是基于指标的。