PagerDuty

关于

本站点记录了PagerDuty事件响应流程的部分内容。这是我们内部文档的简化版本,用于PagerDuty处理任何重大事件,并为新员工准备待命职责。它不仅提供了关于准备事件的信息,还包括事件期间和之后的应对措施。

很少有公司谈论他们处理重大事件的内部流程。我们希望通过向社区开放我们的文档来改变这一点,希望这对那些可能希望规范自己流程的人有用。此外,它还为其他人提供了提出改进建议的机会,最终帮助所有人。

这是什么?#

一系列页面详细介绍了如何有效处理可能出现的任何重大事件,以及如何有效地进行待命。它提供了通过艰难方式学到的教训,以及帮助您快速上手的培训材料。

这是为谁准备的?#

它旨在为待命从业者和参与运营事件响应流程的人员,或希望实施正式事件响应流程的人员准备。

为什么我需要它?#

事件响应是您希望永远不需要的东西,但当您需要时,您希望它能够顺利无缝地进行。通常,您公司内部处理事件的知识会随着时间的推移而积累,每次事件都会变得更好。虽然像PagerDuty的现代事件响应这样的工具可以帮助您快速恢复,但您遵循的流程同样重要。这份文档将使您从一开始就学习到我们多年来积累的东西。为您在处理重大事件方面提供了一个良好的开端,从而实现最快的恢复时间。

涵盖了哪些内容?#

从准备待命严重性的定义、事件通话礼仪,一直到如何进行事后回顾,并提供我们的事后回顾模板。我们甚至包括了我们的安全事件响应流程

缺少什么?#

这不是我们内部文档的精确克隆,而是删除了一些信息。例如我们的电话桥接号码、内部工具和系统的名称(尚未开源)、我们仪表板的图像等。基本上任何特定于PagerDuty或过于敏感而无法分享的内容。

许可证#

本文档根据Apache License 2.0提供。简单来说,这意味着您可以修改和使用本文档,并将其用于商业和私人用途。但是,您必须包含任何原始版权声明和原始LICENSE文件。

无论您是否是PagerDuty的客户,我们都希望您能够在自己公司内部使用这份文档。您可以在我们的GitHub账户上查看所有这些文档的源代码,欢迎您fork仓库并将其作为您自己内部文档的基础。