你准备好应对像NOTAM事件那样的中断了吗?

你准备好应对像NOTAM事件那样的中断了吗?

事件响应和灾难恢复计划和准备极有可能避免或减少系统中断的影响.

2023年1月11日,美国联邦航空局系统中断,导致全美乘客滞留. 几天后,停机的原因被确定为数据库文件损坏,这是由于人员在日常维护期间没有遵循程序而发生的. 由于没有遵循程序,工程师在没有意识到错误的情况下用一个文件替换了另一个文件. NOTAM系统于1月10日下午3:28停止处理更新, 美国联邦航空局关于该事件的第一个通知是在美国东部时间1月10日晚上7点47分发布的. 直到美国东部时间1月11日上午7:30,美国联邦航空局才下令暂停所有出境的国内航班. 出境航班在一个半小时内无法起飞. At around 8:30 AM EST, 当美国联邦航空局终止了NOTAM停运通知后,航班又开始起飞. 这一事件是由一个人在没有遵循文件程序的情况下进行定期维护造成的. 据估计,这一事件造成了“数百万美元的损失”."

How could prepared, planned, 经过测试的事件响应和灾难恢复计划帮助减轻了导致FAA中断的“一连串IT故障”的影响和范围? It is simple, 事件响应和灾难恢复计划的一部分包括识别关键系统和应用程序. 一旦确定了关键项目, 创建计划以记录如何响应系统或应用程序的故障或破坏. 损失可能是由自然灾害造成的, 内部和/或外部恶意参与者, 或者员工无意中犯了错误, 比如FAA事件. 

一旦创建了计划,下一步就是测试计划. 测试可以通过多种方式进行, 从非侵入式演练到全面的故障转移测试. 测试计划可以导致发现计划中的漏洞. 如果在测试期间出现重要数据库的灾难性故障,并且没有可用的故障转移或备份, that is identified, 工作可以弥补这一差距. 如果数据库位于虚拟系统中, 它可以像在维护之前创建快照一样简单. 然后,您可以开发有关如何管理快照的过程. 要保留多少快照? 快照保存多长时间? 如果数据库位于本地服务器或物理服务器上的数据中心,那么服务器的备份过程是什么样的? 你有镜像备用的吗? 你把服务器备份到磁带上了吗? 磁带保存在哪里,保存多长时间? 多久做一次备份? 一旦所有这些都进行了分类和记录,就可以重新运行灾难恢复测试,以测试新过程并验证差距已经缩小.

另一方面是事件响应计划和测试. 该计划使组织能够以标准化和及时的方式响应事件. 测试该计划以确保文档化计划既实际又能识别关键的差距是至关重要的. 这些差距可以是任何东西,从控制的错误配置到组或团队成员之间的错误沟通,并且可以识别工具之间无效的结合.

当看到异常情况时, 报告流程被记录并存储在一个位置,所有员工都可以访问它来报告他们所看到的. 事件响应计划包括需要报告某些内容时的适当联系人的文档. 事件响应团队还记录了升级流程, procedures, 以及人员mg官方游戏中心. 一旦初步调查完成并确定已识别威胁,事件响应团队就可以快速轻松地确定正确的升级路径.  

事件响应计划包括记录团队如何识别的部分, communicates, contains, eradicates, 并从事故中恢复过来. 事件响应计划的最后一部分是经验教训会议. Lessons Learned允许团队回顾发生了什么, how it happened, what went right, 以及哪里出了问题,以记录任何需要的改进.

Moser’s 经过认证的安全专业人员团队随时准备审查和测试您现有的文档或帮助创建 事件响应或灾难恢复 plans. Contact us via our web form.

Previous
Previous

数据分析是一个好职业吗?

Next
Next

数据管理的目的是什么?