?

企業IT系統連續性管理中的風險事件應急實踐分析

2018-11-28 11:24武劍鋒
人力資源管理 2018年10期
關鍵詞:風險事件應急管理

本文由北京市社會科學基金項目(16YJC039)支持。

摘要:隨著信息技術的發展,企業對其IT系統依賴度越來越高。當企業的核心業務都運行在IT系統之上時,企業的業務連續性管理成為其IT治理中的重要課題。目前,針對高實時性IT系統的業務連續性在企業中的實踐方法研究并不多,各類型企業都結合自身業務模式和IT系統架構制定各自的風險事件應急管理策略和措施。本文旨在針對高實時性IT系統的業務連續性管理的內容進行探索,尤其在風險事件的應急管理方面,給出在企業在實際操作中的一些經驗。

關鍵詞:業務連續性;風險事件;應急管理

IT系統業務連續性管理近年來受到越來越多企業的關注。2012 年5月15日ISO 正式頒布了 ISO 22301:2012,ISO 22301:2012 致力于提高組織彈性,其管理體系框架能夠幫助組織制定一套一體化的管理流程計劃,使企業對潛在的災難加以辨識,幫助其確定可能發生的沖擊及對企業運作造成的威脅,并提供一個有效的管理機制來阻止或抵消這些威脅,減少災難事件帶來的損失。

隨后,我國頒布了GB/T30146-2013《公共安全業務連續性管理體系要求》。這份國家標準等同采用國際標準ISO22301:2012。該標準的出臺旨在推動我國組織業務連續性管理體系的建立及與國際接軌,這為我國組織業務連續性管理體系獲得國際廣泛認可提供了保障。

因此,企業開始根據自身IT系統技術架構,結合業務運作模式,著手思考和落實業務連續性標準在企業實際的IT系統管理工作中進行落地實施的問題。

一、業務連續性管理和風險事件應急管理

在我國,企業引入IT系統業務連續性管理是近幾年的事情。對IT系統業務連續性管理的探索和實踐工作,也隨著企業的IT系統運行的規模不斷擴大,對IT系統運行依賴程度越來越高而不斷深入。

IT系統業務連續性管理是一項綜合管理策略和措施,它使企業識別出潛在的風險和可能造成的影響。在此基礎上,制訂業務連續性的應對策略和恢復計劃,其總體目標是為了提高企業的風險防范能力,以有效地應對非計劃的風險事件,并降低受到不良影響。

IT系統業務連續性管理的理念即是為了應對各類風險事件對企業的業務運行造成影響以至中斷的問題。業務連續性管理是識別對組織的潛在威脅以及威脅一旦發生可能對業務運行帶來的影響一整套管理過程,該過程為組織建立有效應對威脅和自我恢復能力提供了框架,以保護關鍵相關方的利益、聲譽、品牌和創造價值的活動。

IT系統業務連續性管理的內容其實比較豐富。根據ISO22301-2012的標準,企業的業務連續性管理按照PDCA的思路,構建相對完整的業務連續性管理系統,業務連續性管理系統是經常進行的活動的集合,業務連續性管理支持企業業務連續性管理活動,也支持技術災難恢復活動。這些可以包括項目規劃和管理、人員配備、計劃、預測、預算編制、研究和開發、資源管理、通信、會議、教育活動、宣傳等。

根據CMI組織近年對英國國內全行業的BCM開展情況的調查,發現:已有85%的銀行業、保險業機構采用了業務連續性管理(BCM)理念管理企業運營中斷風險。其中69%的企業采用了業務影響分析(BIA)作為BCM的基礎,81%的受訪經理表示業務連續性管理以及BCP的建立對其企業的穩定運營有極大的幫助運營,且BCM在中斷事件時發揮的減損效益大于其實施成本。

早在2001年“9.11”事件時,摩根斯坦利銀行和德意志銀行就創造了世界金融界的兩個奇跡,摩根斯坦利銀行第二天宣布重新全線營業。德意志銀行更是在2001年9月11日當天就完成了3000億美元以上的巨額交易,這兩家銀行當時能迅速化解災難,正是源于完善的業務連續性管理中的災難備份系統。他們迅速恢復營業的能力,既增強了投資者的信心,又為企業樹立了優良的形象。而同樣位于世貿大廈的某銀行由于數據中心位于現場附近,進而造成了連續性的業務中斷,據其聲明,恐怖襲擊破壞了其部分計算機系統,一些分支機構被迫關閉,其第三季度的利潤因此下降了33%。

二、風險事件管理的幾個方面

之所以提出“風險事件”這個概念,是為了與日常IT管理中經常會出現的“事件“做區別。事件出現的概率相對較高,而并不是所有的事件都會對業務系統運行產生影響(因為一般企業中IT系統架構中都做了相對充分的冗余設計,某單一節點的失效不會引起整體業務系統運行)。而風險事件專指已經或如延誤處置將對企業IT系統業務運行產生影響,對企業客戶產生影響的事件。

在企業中,針對風險事件管理,都會制定應急管理管理制度規范,主要應包括以下內容:

1.應急組織體系

應急組織體系是指企業內部,根據其IT系統架構,設定專門負責風險事件應急管理組織人員團隊,需要明確到具體的人員,而不僅僅是崗位角色。

一般地,企業風險事件應急管理組織由企業的高級管理人員掛帥,擔任組織的業務連續性管理的第一責任人。然后,由企業核心業務部門、IT技術部門、辦公室及后勤部門等組成應急組織體系。其中,核心業務部門的職責為在風險事件出現時,采取必要的業務應急措施,組織業務應急處置;IT技術部門的職責為采取必要的IT技術措施,組織IT技術應急處置;辦公室和后勤部門的職責為負責風險事件的報告,組織包括人員、場地、交通、通訊、應急資金和應急物資準備。此外,如有必要,還需組織信息披露和媒體溝通等事宜。

2.應急管理流程

應急管理流程是指企業內部以及所可能涉及到的外部組織,在風險事件出現時,應急體系中各人有按照既定的角色和職責,開展應急處置工作的預定流程。一般的風險事件的應急管理流程應包括從風險事件的發現、報告、判斷、報告、技術診斷與處置、業務處置和風險事件關閉等關鍵環節。此外,還可以包括媒體輿情監控、與外部組織互動等輔助性環節。

在應急處置中,業務處置和技術處置是同時開展的。業務處置主要面對公司的客戶,利用有效的備份手段,確保企業業務能夠順利進行。如果對客戶產生影響,需要組織對客戶的安撫工作,避免或減少影響范圍的進一步擴大。業務處置主要是IT技術部門的職責,此時應以快速恢復業務為原則,采取必要的技術手段(如主備切換等)。

在應急管理流程中,特別要注意風險事件的上報工作。一般的企業往往注重風險事件的處置,而忽略上報的環節。而實際工作中,風險事件的上報和處置一樣重要。其原因在于,一方面,風險事件出現時,往往存在客戶、技術、指揮和后勤等多現場。如果各現場的處置人員不能有效的將各個現場的情況進行上報,則經常會出現信息不對稱的情況。應急管理總指揮應該在充分了解各現場的情況后,綜合的判斷,給出應急處置指揮方法。

3.應急預案和應急演練

風險事件出現時,都是計劃外的事情,往往是在企業按部就班的進行日常業務時,突然出現。一旦出現后,對處置時間的要求非常緊迫。因此,如果業務系統運行實時要求高的企業,需要事先制定好各類應急預案。在風險事件出現時,能夠按照既定的應急預案開展處置工作。

風險事件的處置包括業務處置和IT系統技術處置,應急預案也需要分成業務處置應急預案和IT系統技術處置應急預案。應急預案的內容,應該以出現的風險事件可能性場景為導向,針對不同場景采取必要的和既定的措施。必要時,企業可以結合實際情況制定輿情監控應急預案和后勤保障應急預案。

有了應急預案后,如果不組織必要的應急演練,則真正出現風險事件時,預案的指導性依然不足。企業應組織整個應急組織體系中的各個部門,進行聯動式的應急演練工作。通過應急演練,一方面使各個角色對應急處置的各部分內容更加熟悉,另一方面也驗證應急預案的有效性。因此,應急演練工作重要性很高。在證券行業中,我國證監會已經明確要求各證券公司每年至少組織兩次IT系統應急演練工作。其目的就是確保各證券公司的核心業務系統在出現風險事件時,能夠有效的按照既定的應急管理辦法和預案,有效的開展處置工作,并將風險事件情況上報到監管部門。

4.風險事件總結

在完成了風險事件處置后,企業應該組織專門性的風險事件總結工作。工作總結的內容包括對風險事件的定級、評估風險事件造成的損失,確定風險事件的根本原因,分析產生風險事件和處置風險事件過程中的各方面責任,必要時采取一定的管理處罰手段。最后,形成專門的風險事件報告。

三、高實時性信息系統應對風險事件時的管理方法實踐

上述給出了企業在IT系統業務連續性管理中,組織風險事件管理時所作的一些典型的、具體的和普遍的內容。在不同業務類型的企業中,都需要結合其業務運作模式和企業組織架構進行有效落地實施。然而,很多企業或組織的業務運行對信息系統依賴程度很高,IT系統運行的實時性也很高。在我國,銀行核心系統、證券交易系統、海關的報關系統等,都是業務高度依賴信息系統,運行實時性很高的業務場景的典型代表。這種信息系統的運行一般是集中式部署,客戶分布廣泛,并發交易量非常大。其核心后臺系統一旦出現故障,就很有可能發生風險事件,在很短時間內,企業的客戶就會面臨非常大的業務影響。以證券行業為例,證監會對事件應急處置的時長已經給出明確的要求:證券公司的核心交易業務系統,中斷2小時以上,則定義為特別重大事件;中斷30分鐘到2小時之間,則定義為重大事件;中斷5分鐘到30分鐘之間,則定義為較大事件;中斷5分鐘以下,則定義為一般事件。當出現較大及以上事件時,證券公司將面臨著監管處罰。按照上述規定,證券公司的核心交易系統的業務連續性指標RTO(業務恢復時間目標)均按照5分鐘來進行設計。除了核心交易業務系統架構要支持5分鐘的故障切換外,其應急處置能力也需要在5分鐘內保障業務的恢復。因此,高實時性信息系統如果在較短時間內,有效的應對風險事件,成為了企業業務連續性管理的重要課題。

在這種類型的企業組織架構中,一般按照職能型設置。業務部門、IT技術部門、辦公室及后勤部門等隸屬于不同的管理條線。一般性管理事宜,需要先按照其現有的組織架構內部層級進行匯報,到了部門負責人層級后,再進行部門之間的橫向通報。這種匯報途徑,在出現風險事件時,將很難滿足短時間內的恢復業務的要求。建立有效的風險事件應急管理組織體系、管理流程、準備應急預案并演練等工作是基礎,還需要在短時間內的聯動開展應急處置工作。對業務運行實時性要求高的企業風險事件應急管理的組織架構,可以風險事件應急處置總指揮為核心,構建“星”型應急組織結構和應急處置聯動機制,突破職能型組織結構的溝通壁壘。

很多業務系統運行模式是7×24小時,因此在應急處置總指揮的人員配備上,需要考慮實際人員的輪班值守的事情。應急處置往往是高強度、高壓力、多人員的團隊協作,企業實際工作中的多人輪班值守的方法非常有效。輪班值守要做好排班工作和各班之間的交接工作。

四、總結

企業的IT系統業務連續性管理越來越受到重視,國際和國內的標準也都先后頒布。而在實際企業組織中,需要結合標準和行業監管要求等,將業務連續性管理具體落地,在風險事件出現時,能夠有效組織應急處置工作,避免或減少風險事件對企業業務和客戶的影響。這些具體的工作需要結合企業具體組織和管理工作開展。有效的應急處置組織體系是基礎,流程和應急預案需要進行演練而增強其實用性。針對高實時性業務系統,為了短時間內恢復業務,就要打破職能部門之間溝通的壁壘,按照“星”型架構快速開展應急處置工作,將人員、流程和技術等核心要素爛熟于胸。

參考文獻

[1]宋勁松.英國應急管理中的業務連續性管理及啟示,學術交流[J], 2011,(4):90-93.

[2]呂丹. 金融機構的業務連續性管理,首席財富官[J],2015,(4):66-69

[3]喬海曙.賀凌華. 中國銀行業應急管理問題與對策,金融論壇[J],2008,(11):33-38

作者簡介:武劍鋒(1981-),女,山西省壽陽縣人,博士,北京第二外國語學院國際商學院講師,主要研究方向是公司治理。

猜你喜歡
風險事件應急管理
微信時代風險信息的傳播與感知
神經外科住院患者的護理安全管理
持牌消費金融公司如何有效開展內部審計工作
風險管理在門診中的應用
護理風險管理在頭頸腫瘤外科護理中的應用觀察
網絡風險事件中的集體行動研究
營配信息集成的客戶停電應急管理研究
基于知識元和有色Petri網的應急實施流程優化方法
民族地區旅游突發公共事件應急管理研究
民族地區旅游突發公共事件應急管理研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合