复杂事件

总有一天,你将参与到一个(或多个同时发生的)事件中,这些事件最终会涉及大量资源。在这些情况下,每个人都保持有效的控制范围至关重要。本页描述了我们如何管理此类事件。

识别复杂事件#

可能同时发生多个问题,或者现有事件升级并对其他服务产生了连锁反应。尽早识别这些类型的事件以防止混乱和疲劳至关重要。以下是事件指挥官将关注的一些关键事项,以帮助识别复杂事件。

  1. 是否有多个团队参与?

    • 他们中的大多数是否正在积极调查多个问题?
  2. 存在多个症状,并且似乎没有任何明显的关联。

  3. 一组专家都在进行相同的分析。

  4. 事件通话“感觉拥挤”。这是一个相当模糊的指标,但大多数人通常能感觉到通话中有太多响应者。

子团队#

当我们确定有一个复杂事件时,事件指挥官将组建子团队来处理每个单独的问题。我们有三个预定义的子团队,事件指挥官可能会将你分配到其中之一:Alpha、Bravo 和 Charlie。每个团队都有自己的 Slack 房间和会议电话桥,已经设置好并准备使用。

团队名称

我们选择了语音字母表作为我们的团队名称。我们没有使用颜色,因为“红队”和“蓝队”在安全事件响应中有其他定义,我们希望防止混淆。

Alpha 团队 #team-alpha +1.555.123.4567
Bravo 团队 #team-bravo +1.555.123.4568
Charlie 团队 #team-charlie +1.555.123.4569

并非所有三个团队都需要同时活跃。一个事件可能只需要一个团队,甚至必要时超过三个。团队领导者将被选出,然后由事件指挥官分配到特定的团队名称。

角色结构#

子团队如何适应我们的应急响应角色结构?团队领导者基本上取代了正常角色结构中的专家,然后专家将向他们的团队领导者报告。这确保了事件指挥官和团队领导者可以保持有效的控制范围。

复杂事件的应急响应结构

组建子团队#

  1. 事件指挥官将为每个团队分配一名直接向他们报告的领导者。所有其他团队成员将向他们的团队领导者报告。

    • 在分配团队领导者时,事件指挥官还将指定他们所属的团队名称(Alpha、Bravo 或 Charlie)。
    • 团队领导者不必接受过事件指挥官的培训;然而,一些领导经验是明智的。
  2. 每个团队将被分配一个特定的任务来完成,并将像单个响应者一样设定时间限制。

团队的划分由事件指挥官自行决定。潜在的结构包括:

切换子团队#

如果你觉得自己更适合另一个子团队,你应该向你的当前团队领导者提出。不要向事件指挥官或你希望加入的团队的领导者提出。事件正在进行中,应遵循定义的升级路径。