?

船舶制造行業信息化基礎設施災備體系建設

2023-12-26 04:46柳德睿萬松
智能制造 2023年6期
關鍵詞:預案災難備份

柳德睿,徐 娜,萬松

(武漢船用機械有限責任公司,湖北 武漢 430084)

1 引言

中小型制造企業涉及設計、工藝、采購、生產和運營等多個環節,信息系統繁多,系統使用范圍、重要性各不相同,部署方式上多為單機部署,少數核心業務系統為雙機或者集群部署;其次,信息化基礎設施作為業務信息系統運行支撐環境,涉及面廣、技術復雜度高,業務信息系統層面,不同業務系統管理人員對計算機相關知識掌握程度也有較大差別;最后,考慮到公司對信息化基礎設施經費投入有限和信息化基礎設施技術不斷發展等因素,企業基礎設施也難以從機房、動力環境、服務器、網絡、存儲、數據庫和操作系統等內容全部實現容災[1]設計。在這樣的背景下,探究基于信息化基礎設施的架構優化、技術保障措施和設備宕機、數據誤刪除等災難場景下的有序、及時、有效恢復業務系統正常運行顯得尤為重要。

2 建設理念

2.1 構建具備一定容錯性、抗風險能力的信息化基礎設施架構

在企業業務信息系統新建和技術改造時,信息化基礎設施應先行或者同步考慮,結合企業架構現狀進行設計?;A設施架構各模塊應盡可能地實現容災,減少單點故障,提高架構各模塊可靠性,保證基礎設施出故障時業務信息系統運行不中斷、業務數據不丟失。

2.2 形成文件化的災難恢復預案,保證災難恢復的及時性和有效性

本文針對信息化基礎設施運行過程中出現的問題,進行整理分析總結,在此基礎上窮舉信息化基礎設施核心模塊故障場景。其次根據每個模塊編制災難恢復預案。在實踐中對人員職責、故障恢復流程、操作步驟和技術支撐等方面出現的問題進行總結,完善災難恢復預案,進一步提升預案的可操作性。

3 災備方式

災備方式圍繞信息化基礎設施架構展開討論。

3.1 信息化基礎設施架構

信息化基礎設施包括數據中心、網絡、安全和保障系統四部分,其系統架構圖如圖1 所示。應用層主要為運行的業務信息系統;網絡層為終端用戶資源訪問提供網絡支撐;基礎軟硬件層包含服務器、存儲、磁帶庫、操作系統、數據庫、雙機軟件或者集群等,為業務信息系統提供運行環境;物理環境包括動力環境、消防系統、防塵及新風系統和安全保密系統,為IT 基礎設施安全穩定運行提供電力、溫濕度等物理環境及物理安全保障;網絡安全主要使企業網絡設備不受病毒攻擊;保障系統主要包含備份系統,用來保障企業數據安全。

圖1 信息化基礎設施架構圖

3.2 基礎設施架構核心模塊常見容災方式

在實際運行過程中,信息化基礎設施對業務信息系統穩定運行影響大的模塊主要是應用、網絡、基礎軟硬件、動力環境和備份系統,其中前四個模塊影響運行安全,后一個模塊影響數據安全,其影響模型圖如圖2 所示。運行安全方面,應用的運行依賴于基礎軟硬件環境,用戶對應用的訪問除了和應用相關外,還取決于網絡是否互通;另外,動力環境是否正常運行直接影響到數據中心內的基礎軟硬件和核心網絡是否正常運轉,影響設備多、范圍大。

圖2 信息系統穩定運行影響因素模型圖

應用模塊采用集群、雙機軟件、冷備等方式[2]進行容災。網絡模塊的核心交換機采用熱備,消除單點故障,當核心交換機發生故障時,網絡不受影響,業務不中斷;接入交換機和匯聚交換機采用冷備方式進行備份,對交換機配置信息進行備份,當一臺交換機出現問題時,使用備機中的一臺進行替換;對于其他網絡設備,備份配置信息。

基礎軟硬件模塊采用虛擬化[3]或者超融合[4]技術統一服務器架構,屏蔽服務器層級技術差異,當物理服務器發生故障時,虛擬機能自動遷移到其他節點上,業務連續性不受影響;虛擬化或者超融合管理節點無單點故障;存儲采用雙活技術架構,數據同時寫入主存儲和容災備份存儲,存儲雙活架構圖如圖3 所示;核心服務器有備機,服務器硬盤設置raid1、raid5 等,電源、網卡有冗余,對于硬盤等易損壞零部件提前采購備用。

圖3 存儲雙活架構圖

動力環境模塊的數據中心電力系統結構圖如圖4 所示,數據中心采用工業用電和UPS 設備的雙線路供電,保證與系統基本業務運行相關的服務器、存儲、交換機的電源冗余;工業用電采取兩路用電,將企業電力系統改造期間斷電對數據中心造成的影響降到最??;UPS 控制器冗余或者UPS 控制器為模塊化設計,減少單點故障;機房精密空調冗余,做并機,一臺空調出現故障時能自動關停并啟動另外一臺空調。

圖4 數據中心電力系統結構圖

備份系統的備份服務器無單點故障;備份數據存放介質不少于兩份,可放在雙活存儲上、磁帶庫、虛擬帶庫和光盤庫中的任意兩種;備份數據包括虛擬機、操作系統、應用程序、配置信息和業務數據(文件或者數據庫);備份方式包括手工備份和第三方備份軟件備份。手工備份方式下,數據庫可通過數據庫自身備份工具或者命令加定時任務方式來進行自動備份;文件系統可通過手工或者批處理程序進行備份,操作系統可通過PE 盤對其進行備份。手工備份的數據傳輸到其他服務器保留一份,避免單臺服務器系統或者硬盤故障時,備份數據難以使用,發揮作用。

4 建設內容和措施

4.1 梳理企業信息化基礎設施架構現狀、識別風險

根據上述信息化基礎設施架構圖從動力環境、硬件、軟件和數據備份四個層面梳理企業基礎設施核心模塊現狀、各模塊所采取的災備方式,評估基礎設施架構的合理性,識別架構漏洞[5]。從企業信息化人員技術能力、經費投入、信息化基礎設施常發生故障及核心模塊對業務影響重要程度四方面綜合考慮,通過信息化項目或者年底技術改造計劃等方式對基礎設施核心模塊進行改造,優化完善基礎設施架構,提高其容災能力,降低風險。詳細改造內容見表1。

表1 基礎設施改造建設表

4.2 評估系統各模塊故障影響范圍、明確系統各模塊恢復優先級

企業信息化系統管理員和業務信息系統管理員應根據信息化基礎設施實際情況對系統中其資產價值和系統故障對業務工作帶來的影響進行評估,確定系統恢復的目標。

評估內容包括關鍵業務功能、影響范圍、重要性、依賴程度、恢復的優先順序、恢復所需要的時間及系統恢復允許丟失數據的時間點。

分析和評估對象包括業務信息系統、業務數據、IT設備(如服務器、交換機、存儲等)、電力供應系統和其他評估對象。

評估后,信息化管理部門應對信息化基礎設施中的各模塊設備和應用系統形成文件化的清單,讓系統管理員和業務系統管理人員做到心中有數。當多個系統出現問題時,按照清單中明確的優先順序解決,減少系統管理員和業務人員之間的溝通成本,做到有序恢復。

4.3 制定信息化基礎設施核心模塊災難恢復預案

企業系統管理員和信息系統管理員應梳理總結各模塊出現的故障、分析常見故障場景,制定災難恢復預案,讓企業信息化機構成員理解和執行災備預案,更從容的面對各類突發事件。

災難恢復預案內容:災難場景、災難恢復上報和解決流程、災難類型及對應的解決辦法。災難恢復預案對象:數據中心斷電場景下的設備和應用關開機預案、意外斷電場景下的設備和應用分批關開機預案、服務器硬盤或操作系統崩潰場景下業務系統恢復正常運行預案、基礎軟硬件故障恢復預案、不同類別數據恢復預案。

災難恢復預案中的流程和解決辦法應基于企業特定信息化組織架構、采用的設備和技術進行編制,并根據實際遇到的問題進行調整、豐富、細化。流程和解決辦法應在預案中進行明確,保證預案的可操作性,切實地為操作人員提供指導,減少災難恢復期間因流程不清楚、技術不了解、操作不熟練花費的時間。

4.4 定期進行災難恢復演練

企業每年應定期選擇信息化基礎設施中某一模塊進行災難恢復演練,演練前編制災難恢復演練預案、正式進行演練、對演練過程進行記錄,以及評估演練效果并修訂演練預案。通過災難恢復演練,提升災難初始狀態下應急處置和響應升級的應對能力、檢驗災難恢復過程中存在的問題,同時檢驗設備和軟件使用時的有效性,進而提升應急處置人員的處置能力,保障業務信息系統持續運行。

5 建設效果

通過建設信息化基礎設施災備體系,企業進一步提升信息化保障能力和信息化人員技術水平。主要表現在:全面梳理業務信息系統的重要性、災難點、可能的業務中斷時間和數據丟失情況,做到心中有數;明確業務信息系統災難恢復流程、人員職責、解決過程及操作方法,形成初步固化、不斷優化的文件化的應對方案,為信息化基礎設施運維指明方向;了解信息化基礎設施技術、人員薄弱情況,找差距、補短板,為信息化基礎設施團隊建設和信息化投資提供依據。

信息化基礎設施災備體系建設完成后,公司月度應用系統故障次數從建設前的5~10 次降為1~2 次,大部分故障恢復時間從2~4 h 降為1 h 以內,應用系統數據丟失恢復時間從建設前的2~7 天降為2 天以內。

6 結束語

建設信息化災備體系應聚焦業務安全可靠穩定運行和數據安全,以業務不中斷、數據不丟失為目標,以技術應用和管理提升為抓手,結合企業信息化投入、技術、人員、管理等因素,基于企業自身現狀優化基礎設施架構,防范業務中斷、數據丟失風險;針對可能出現的各類風險編制預案,進行災備演練,優化流程,提高技術人員能力,降低業務業務中斷和數據丟失時間,保障信息化業務的安全、穩定、高效運行,助力企業發展。

猜你喜歡
預案災難備份
“備份”25年:鄧清明圓夢
雷擊災難
核電網絡安全應急預案考慮
黑龍江省人民政府辦公廳關于印發黑龍江省防汛應急預案等3部應急預案的通知(下)
創建vSphere 備份任務
災難報道常見問題及反思
舊瓶裝新酒天宮二號從備份變實驗室
2016年版《國家自然災害救助應急預案》解讀
緊急預案
災難不是“假想敵”
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合