?

高校數據中心運維管理的探索和研究

2024-04-28 17:20王芳芳
電腦知識與技術 2024年4期
關鍵詞:數據安全數據中心運維

王芳芳

摘要:數據中心運維管理是高校信息化建設工作中極為重要的一環。文章從分析高校數據中心的運維管理體系和管理流程入手,剖析運維管理工作中存在的困境和問題,從政策和管理、人員、技術、日常運維管理4個方面探討數據中心正常穩定運行的具體措施。

關鍵詞:數據中心;管理;運維;網絡安全;數據安全

中圖分類號:TP311 文獻標識碼:A文章編號:1009-3044(2024)04-0084-03

0 引言

隨著信息技術的發展和應用,高校的信息化程度也日益提高,信息化建設成為了現代教育事業的核心。數據中心作為高校信息化建設的核心和重要基礎設施[1],有著不可忽視的重要性,其運維管理變得越來越重要。李鑫等[1]從高校數據中心的組成、運維管理現狀和安全運維管理的必要性三個方面入手,分析了高校數據中心面臨的運行風險,從安全角度探討了數據中心在運維管理過程中采取的措施;艾飛等[2]從管理制度角度探索數據中心的運維管理的措施;魏冠華[3]選定管理模式、建立管理制度、做好日常運行維護等多個層面討論了高校數據中心機房的規范管理,同時還分析了機房管理方面的重點內容;鄭富煌[4]從中心機房運維管理流程優化展開研究,提升各類用戶滿意度的目標;劉小云[5]利用運維審計設備即堡壘機這個統一的運維中樞,幫助運維人員高效完成運維工作。

本文將從分析高校數據中心的運維管理體系和管理流程入手,接著剖析運維管理工作中存在的困境和問題,最后從政策和管理、人員、技術、日常運維管理4個方面探討數據中心正常穩定運行的具體措施。

1 高校數據中心的運維管理體系

高校的數據中心承擔著諸多重要的功能和任務,如教學管理、人事管理、財務管理、科研管理、學工管理、資產管理等。它作為高校信息化建設的核心,要保障整個高校的信息流動和安全。一個高效、穩定的數據中心是高校信息化建設的基礎保障,也是高校走向信息時代的必備條件。因此,高校數據中心的運維管理是保證信息化建設穩步發展的關鍵環節。高校數據中心運維管理體系,如圖1所示。

2 高校數據中心的管理流程

高校的數據中心管理流程包含了多個方面,而且需要不斷地去優化和完善,以保證數據中心的正常、穩定、高效地運行。

2.1 預防性維護

預防性維護是保證數據中心正常運行的關鍵環節,其中包括以下幾個方面。

1) 設備安全:首先,進行設備安全管理,防止設備受到物理損壞。其次,通過數據備份等手段,預防因為設備損壞引起的數據丟失問題。

2) 設備性能監控:定期檢查設備運行情況,及時發現問題并進行修復。此外,通過適當的監控軟件,可以查看設備的性能情況,及時預測設備過載的情況,并進行調整。

3) 設備維護:定期進行專業的設備維護,收集設備運行的日志,記錄設備的使用情況,為后續分析、調整做好準備。

2.2 運行調查

對于數據中心中的每一項工作,都需要開展運行調查,了解工作的具體情況,以便及時發現問題并進行解決。包括以下幾個方面。

1) 合理分配資源:根據工作負載、硬件資源等因素,合理安排各項工作,避免資源的浪費。

2) 工作流程優化:對數據中心的各項工作,建立良好的流程,及時發現并及時解決問題。

3) 一次定位:對數據中心運行過程中出現的問題,應該及時進行定位,降低故障修復時間和成本。

2.3 綜合監管

綜合監管旨在提升數據中心的管理水平和效率,及時發現潛在的安全隱患和性能問題,調整服務策略,提高用戶的滿意度。綜合監管包括以下幾個方面。

1) 合規性監管:制定合理的安全措施和管理流程,防止數據泄露、損失、受損等風險。

2) 性能監管:定期檢查各系統、組件的性能,對性能問題及時做出反應和調整,保障用戶的滿意度。

3) 資產管理:對無用、老化的設備進行及時替換和淘汰,充分利用資源,避免資源浪費。

2.4 故障應對

數據中心可能會遇到多種故障,例如電力故障、硬件故障、網絡故障和溫度過高。電力故障可能會導致整個數據中心關機,原因可能是停電、電源故障或電纜故障等;硬件故障可能會影響服務器和存儲設備,導致數據丟失或應用停機;網絡故障可能導致數據中心無法連接到互聯網或運行應用程序,甚至可能造成數據丟失;溫度過高可能會損壞數據中心的服務器和存儲設備,因此需要確保數據中心保持良好的散熱系統。這些故障對數據中心的影響很大,所以需要進行預防和及時處理,以保證數據中心的穩定性和可靠性。

1) 要提前建立各種故障的應急預案,這樣在故障發生時,不至于手足無措,而是有條不紊地進行故障恢復操作或者切換到臨時方案,以保證業務的正常運行。

2) 建立一個管理團隊,由經驗豐富的管理員和技術人員共同組成。有時數據中心的故障排查難度較大,需要多個崗位以及多個供應商的人員共同合作才能解決。

3 高校數據中心運維管理的困境和問題

在高校數據中心運維管理工作過程中,困境和問題也較為突出:

1) 設備和軟件開支。高校雖然已經知曉數據中心的重要性,但是由于學校的經費有限,無法買到或買全心儀的產品和方案,此種類型的財務負擔成為需要重點解決的問題。

2) 招投標體系和管理。數據中心從建設到正常運行,會有很多招投標過程。在這過程中,往往會出現低價沖標的情況,最終提供的產品、方案、服務也差強人意。

3) 供電系統管理。一些數據中心沒有采取足夠的措施保證供電的穩定性和可靠性。例如,供電設備可能出現故障,或高校附近施工導致的區域大面積斷電,導致數據中心供電中斷或不穩定,影響到數據中心的正常運行。

4) 系統平臺不穩定。教學壓力大,系統上不穩定,會給教學質量帶來不利影響,并且如果系統故障,無法及時采取措施保護教育教學的正常開展。

5) 師生信息安全問題。由于信息化建設的應用情況不同,信息和數據管理、分析、升級等過程中數據隱私和信息泄露問題凸顯,使師生的信息安全受到威脅。

6) 網絡安全問題。缺乏對網絡病毒和黑客攻擊的防范措施,就很難保證數據的安全性和完整性,這可能導致數據泄露或系統崩潰等安全問題。

7) 缺乏專業的運維管理人員。如果沒有專業的運維管理人員,就很難保證數據中心的穩定性和可靠性。

8) 缺乏專門的數據備份和恢復措施。這可能導致數據丟失或系統崩潰等嚴重后果。

4 數據中心運維管理的措施

為了更好地實現高效穩定的數據中心運維管理,下面提出了一些具體措施。

4.1 政策和管理方面

1) 加強資金保障。數據中心的建設和運營需要大量且長期的資金投入,主要用于數據中心的升級和維護、設備的折舊和管理、數據存儲和管理、網絡安全和升級、保持高可用性、進行冗余設計、設備和產品的定期升級和改造等。如果資金無法到位,數據中心將無法提供穩定、高效的服務,進而影響教學和科研等各方面的質量。

2) 強化數據中心的監管與管理。高校數據中心的監管與管理至關重要。在數據中心運維管理過程中,需要明確崗位職責和工作要求,并對數據中心的運營情況進行動態監管。采取有效的管理流程,清晰劃定管理角色,及時了解數據中心的運營狀況,識別潛在的問題、瓶頸和風險,并采取針對性的管理措施,及時糾正并加強內部監督,提高整個管理體系的效率和精準性,減少管理過程中的瑕疵和錯誤,保證數據中心的高效穩定運行。

4.2 人員方面

1) 建立數據中心管理團隊。高校數據中心的規模較大、復雜且重要,其中涉及的領域有很多,如基礎設施管理、系統管理、數據庫管理、網絡管理、安全管理等。因此,建立一個管理團隊,由經驗豐富的、擁有一定專業知識和技能的管理員和技術人員共同組成,協同工作、協同保障數據中心的正常運行。團隊需要嚴格遵守管理規范、安全規范、數據規范等方面的標準,確保數據中心的管理流程和管理質量。

2) 高效的溝通協作機制。高效運維管理不是簡單的流程和規則的制定,更關鍵的是管理人員在整個過程中的積極配合和有效溝通。數據中心涉及業務較多,不同團隊的工作之間有許多交叉點,在數據中心運維管理中,管理人員和技術人員之間需要建立超越崗位和職責的優秀協作關系,共同制定高質量和可行的運維管理方案,協同解決數據中心管理中的問題和矛盾,共同推動業務的優化和提高。

此外,還需加強與其他部門的溝通和協調,爭取更多的支持和資源,以便更好地進行數據中心的管理和維護。

3) 學習與培訓。隨著信息技術和管理技術不斷發展和完善,數據中心的運維管理需要不斷學習新知識和新技能,以應對日益增長的需求。管理人員和技術人員需要定期參加培訓和學習,通過自學、培訓、交流、實踐等方式,不斷提升自己的技能和知識水平,保障數據中心的高效穩定運行。

4.3 技術方面

1) 推廣新技術。隨著數據中心業務的不斷擴展、技術水平的提升,需要持續推進新技術與新思路的應用,以適應日益復雜的數據中心環境,為數據中心管理及優化帶來新的機會與挑戰。

2) 不斷優化數據中心架構。隨著新技術的不斷涌現和業務設計的不斷完善,高校數據中心的架構也需要不斷優化和調整。

3) 實施自動化運維管理。隨著自動化技術的不斷發展,數據中心運維管理的自動化成為了一種趨勢。通過引入自動化技術,可以大大減少數據中心運維管理的工作量和出錯率,并能夠提高數據中心管理的效率和便捷性。目前,很多自動化技術,如自動化部署、自動化監控等技術,在數據中心管理中得到了廣泛應用。

4.4 日常運維管理方面

1) 持續的監控。原則上,對于整個數據中心里的所有設備和系統,都應設置監控程序,保證其能夠及時對現場狀態進行監測。設備狀態、溫度、風扇轉速、網絡傳輸能力等方面,直到細節都應進行監控??膳鋫湎嚓P的警告機制,一旦某項參數發生問題,管理員立即收到警報,及時處理問題。

2) 加強數據安全管理。數據安全對于高校數據中心來說尤其關鍵。高校數據中心,經常有大量的重要數據。這些數據可能是研究人員的科研成果,也可能是學校的招生數據,或者是學生課程表、成績等個人信息。因此,應加強數據安全管控與管理,完善數據備份的手段和機制,保證備份操作的可靠性和有效性,以應對數據丟失和其他數據安全問題。同時,也應該加強網絡安全防御措施,避免黑客攻擊、病毒入侵和其他網絡風險,保證學校信息資產不受損失。

3) 強化故障應對與恢復。在數據中心運維管理過程中,難免會遇到各種故障和意外情況,如電力故障、服務器故障、網絡中斷等。為了保證數據中心的高效穩定運行,需要建立相應的故障應對和恢復機制,及時對故障進行處置和恢復,保證業務不受影響。同時,也需要對每一次故障進行分析和總結,不斷完善故障應對和恢復機制,提升數據中心運維管理的水平和效率。

4) 提高設備的利用率。在設備管理方面,采取各種方法與策略,優化和提高設備的使用效率。有效利用硬件資源,提前發現問題,盡可能延長設備的壽命。對于某些舊設備,可以通過固化其專屬的業務或將其變為容器服務器,轉化為新的應用場景,提高設備的利用率。

5 結束語

數據中心運維管理是高校信息化建設工作中極為重要的一環。高效穩定地運行數據中心,要依靠各方力量,只有通過不斷地優化、改進工作流程、加強管理、資金保障、提高運維管理人員素質等方面,才能真正保持數據中心的順暢工作。在高校數據中心的運維管理過程中,需要高度重視問題和挑戰,并及時采取有力措施,持續不斷地提升數據中心的管理水平和運行效率。只有在實際工作中不斷探索和實踐,不斷提高管理水平和技術能力,才能更好地應對數據中心運維管理的各種挑戰,為高校的教學和科研事業提供更好的技術支持和保障,促進學校信息化建設的整體發展。

參考文獻:

[1] 李鑫,張琴.高校數據中心安全運維實踐研究[J].山西大同大學學報(自然科學版),2022,38(4):33-37.

[2] 艾飛,黃建波,蘇宣瑞,等.華南理工大學數據中心管理之道[J].中國教育網絡,2022(8):63-65.

[3] 魏冠華.高校圖書館數據中心機房管理研究[J].科技資訊,2020,18(18):199-200.

[4] 鄭富煌.數據中心機房硬件設備運維管理研究[J].網絡安全和信息化,2023(8):59-61.

[5] 劉小云.淺談高校關于數據中心安全運維的方法[J].電腦知識與技術,2021,17(22):44-45,52.

【通聯編輯:聞翔軍】

猜你喜歡
數據安全數據中心運維
酒泉云計算大數據中心
運維技術研發決策中ITSS運維成熟度模型應用初探
云計算中基于用戶隱私的數據安全保護方法
風電運維困局
建立激勵相容機制保護數據安全
民航綠色云數據中心PUE控制
雜亂無章的光伏運維 百億市場如何成長
大數據云計算環境下的數據安全
基于ITIL的運維管理創新實踐淺析
基于云計算的交通運輸數據中心實現與應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合