企业信息系统灾难应急预案
信息系统在企业的运作中发挥着越来越重要的作用,各行业对信息系统的依赖性程度也逐步提高,因黑客攻击,病毒,自然及人为灾难影响对企业运营的影响正越来越受到重视,911之后,美国企业普遍增加了对数据备份和业务恢复等领域的投入。据权威机构对于灾害所造成的冲击分析数据显示,各行业可忍受的信息系统最长停机时间分别为:金融行业—2天;销售行业—3.3天;制造行业—4.9 天;保险行业—5.6天。平均来看,一般行业可忍受的信息系统停机时间为4.8天。
业务连续性计划
业务连续性规划就是在非计划的业务中断情况下,使业务继续或恢复其关键功能的一系列预定义的过程。
业务连续的关键是“减小风险”,即对所有可能危害到企业正常运作的事件进行精心准备。如果灾难来临,企业将面临失去关键的业务数据、信息等至关重要的资产,一份切实可行的业务连续性计划将保证企业的业务能向通常一样进行。
当调研和完成业务连续性计划时,通常会发现大量的单点故
障(SPOF,single points of failure,单点故障是指对某一业务过程的唯一的输入,当输入不存在时,将导致过程或多个过程不能运作)。一旦单点故障被定位,通常可以很容易被消除,或者至少可以减少潜在的损失。并且在业务连续性计划执行的过程中,一些业务过程也会有直接的可被证实的改善。
开发和执行业务连续性计划的基本步骤包括:
项目启动和管理
风险分析/减小
业务影响分析
业务恢复策略
开发业务连续性规划
测试和维护业务连续性规划
培训和意识提高
BCP(业务连续性计划)实施步骤
开始阶段
可行的业务连续性计划不可能在短时间内完成,为在最少时间内提供对于企业的最大保护,采用阶段性的方法来制订计划是比较好的方法。建立紧急通知单,关键记录备份与恢复可以立刻进行,业务影响分析,策略开发由于涉及的方面更多分别在前三个月和前六个月内进行,备份站点选择,业务连续性计划开发在一年内完成,测试、计划维护、定期审计则需要每年定期进行。
在项目正式开始前,必须得到全部高级管理人员的支持,必须与高级管理人员一起定义和确定项目的范围。一旦范围确定,可以估计项目所需的资源并且可以定义项目分发文件和时间点。
由于业务连续性计划涉及众多的业务单位,必须成立专门的项目组来进行恢复过程的开发,各业务单位的高级管理人员必须承诺提供相关的资源支持业务连续性开发过程。
需要注意的是,一定要确保所有的员工都知道业务连续性计划及其内容。确认每一个员工知道并且懂得他们的业务功能的级别,当紧急事件发生时,他们都能适当地恢复,合适而有效的做
法是在新员工培训中加入业务连续性计划的意识培训内容。让员工与不同的组参加测试,所有人员的意识提高是关键,分担责任有利于项目的推进。
业务连续性计划由于涉及到所有业务的运营,在项目正式开始前,必须得到全部高级管理人员的支持,必须与高级管理人员一起定义和确定项目的范围。必须成立专门的项目组来进行恢复过程的开发,不但各业务单位的高级管理人员必须承诺提供相关的资源支持业务连续性开发过程,还要确保所有的员工都知道业务连续性计划及其内容。
风险分析
识别业务连续性计划中最为核心的是面对风险,风险确定的三个基本因素是:威胁、资产和转移因素。
威胁是可能形成对组织的经济或操作影响的事件,通常用可能性衡量。资产由企业所拥有的有形资产和无形资产组成。转移因素是保护装置、保安等其他为减少威胁影响而采取的措施。
在风险评估过程中需要考虑的是基础设施,计算机和通信恢复,业务功能过程和组件来帮助识别风险的种类和控制手段。在
此阶段,可以推荐采用额外的控制措施来转移识别出的特定风险。
业务影响分析
BCP的另一个核心内容是业务影响分析,它从操作影响、经济影响、法律影响和符合度影响等方面来描述风险发生是对企业的影响。
业务可能会因为业务中断而经受一些重要的经济损失,其中的部分损失是不被保险公司所受理的。如果企业的计费、收费的业务功能因为信息系统的不能访问而受到影响,毫无疑问,现金流就会出现问题。
本阶段中,计划制订者需要识别业务中关键的功能。我们可以通过以下步骤来进行识别:列出业务完成所需要执行的所有功能,判断一个事件的发生即将会在那个功能上的影响,估计事件发生时可能会造成的业务损失。这个过程通常可以通过与业务单位的管理者和员工的访谈或调查问卷的方式完成。按照不同的标准进行分类,分别制定计划。
计划恢复策略
一旦关键的和必须的业务功能被确认并且已经了解它们恢复所需要的资源,下一步就是要建立继续执行这些功能所需的资源。在此阶段,需要利用进行业务影响分析时收集到的信息来识别潜在的恢复选项和相关费用,向管理层提出这些选项,并且就需要采取的恢复方式和费用达成一致。
记录计划
一旦确定了恢复策略,我们就可以定义完整的业务连续性计划并形成文档。每一个业务单位的计划必须足够灵活以响应任何类型的事件。必须要计划的两种主要的场景如下:
日常工作的办公场所不能使用,必须在替代的地点恢复办公。
业务单位执行功能的系统服务不再可用,必须在其不发挥作用的情况下继续关键功能。
计划必须包括以下几点:
介绍部分,解释为什么计划是必须的,详细描述计划的范围,谁被包括在内,包括的事件范围。
危机管理组织的定义,给出组织中每个人的详细作用和责任。
当灾难发生时的过程。这包括当事件首次被发现的警告过程,事件或损失评估,宣告过程,通知过程和组队过程。
启动指挥中心的地址和过程。
计划制订者必须明确提供恢复服务的团队。
根据业务单位和关键功能的数量的不同,通常会有一个或多个如下的团队发挥作用。
演练,维护,培训
最后业务连续性计划应该按一定的计划进行演练和测试。演练也为训练员工对于计划文档中记录的过程的执行情况提供机会。计划的回顾应该周期性的进行,至少每年一次。这些回顾能够保证重大的业务变化的细节正确地与计划集成,及时修正因业务变化导致的计划不适用的状况。回顾的结构应该正式记录并且适当的时候更新业务连续性计划。