?

醫院數據中心運維的影響因素及應對方法

2023-06-25 10:36郭慧
無線互聯科技 2023年7期
關鍵詞:醫院信息系統

郭慧

摘要:隨著醫療信息化的推進,數據中心成為醫院信息系統中的主要組成部分,起著至關重要的作用。但是數據中心系統龐大、專業性強及技術要求高,在運維過程中一直存在耗時長、效率低的問題。文章首先分析了數據中心須維護的內容及影響數據中心運維效率的因素,其次詳細闡述了數據中心監控管理平臺實現主動告警、詳細定位及協助運維的策略。該監控管理平臺的部署提升了運維人員的工作效率,對保障醫院業務系統連續運行起到了重要作用。

關鍵詞:醫院信息系統;監控管理平臺;醫院數據中心運維

中圖分類號:TP393文獻標志碼:A0引言在醫院信息化管理中,醫院各種信息數據管理都依靠信息系統進行收集、管理與保存。醫院數據中心作為信息系統的核心架構,其穩定性是保障信息系統業務不間斷的關鍵因素,也是全面優化醫院的信息服務水平的關鍵點。因此,提升工作人員運維的效率,保障數據中心的穩定性至關重要。然而隨著醫療信息化的推進,數據中心的IT設備規模越來越大,子系統數量越來越多,導致數據中心運維工作量劇增,出現的設備故障不能得到及時修復?;诖?,如何運維才能更好地保障數據中心的穩定就成為首要問題。

1數據中心維護內容與存在的問題1.1維護內容1.1.1機房環境數據中心機房是醫院信息系統數據處理的中心,對工作環境有著嚴格的要求[1]:溫度要控制在24℃左右,相對濕度要控制在65%左右,并在機房放置溫濕度計。

1.1.2UPS電源機房維護人員需定期對UPS電池進行放電操作,激活電池性能,并做好記錄。保證在受控的情況下,盡早發現并替換有問題的電池。

1.1.3IT設備管理IT設備管理主要是對服務器、存儲設備、網絡設備和安全設備等進行的管理維護,以保證設備穩定、高效運行。維護過程中,重點檢查并記錄設備的運行狀態,包括:CPU使用率、內存使用率、磁盤使用率、網卡狀態、接口流量、電源狀態等。除此之外,管理人員還要查看數據庫讀寫性能是否完好、表空間是否存在死鎖等問題。

1.2存在的問題1.2.1運維經驗缺乏整理形成知識庫由于缺乏有效的運維管理策略,數據中心運維人員在運維工作過程中積累了眾多有價值的經驗,如問題的判定、分析和處理,只能通過經驗判斷;對于常見故障如網絡故障、數據庫故障、存儲設備故障等處理方法未形成書面工作文件,未被整理、分類形成知識庫。這些經驗只能在小范圍內得到傳播和繼承,而不能在更大的范圍內體現其價值。這樣就容易導致運維過程中出現的事件性質的識別、優先級的界定以及疑難問題的分析診斷等問題只能由少數核心人員進行處理[2],從而增加了少數核心人員的工作量,也容易產生工作流程的“瓶頸”,降低運維團隊整體的問題處理效率。

1.2.2缺乏有效的配置管理數據庫盡管數據中心在IT設備設施運維的過程中收集了一些配置項信息,但是僅僅局限于關鍵業務,如門診系統、住院系統、PACS等相關的信息系統。而配置管理數據庫(Configuration Management Database,CMDB)的建設需要一個長期的過程,完善的CMDB包含IT設備使用的信息系統組件所有相關信息及組件間關系,如不同系統間數據庫視圖和表關系、使用的存儲設備、網絡配置等,同時需要科學有效地配置管理模式。當前缺乏工具支撐的簡單CMDB,后續很難滿足大數據時代高處理能力和處理速度的需求[3]。

1.2.3缺少面向用戶的IT服務報告數據中心在運行維護過程中會生成多種報告,如系統運行方面的報告、機房環境方面的報告、備份報告、網絡設備運行報告等。此類報告內容專業性強,技術要求高,僅科室內部人員和科室外少數的領導可以查閱,其他科室人員受限于權限和專業性,對報告內容難以理解,因此無法充分發揮這些報告的使用價值[4]。

1.2.4存在運維管理漏洞數據中心在運行維護過程中缺少科學有效的運維管理制度、操作規范和明確的具有可執行性的運維流程,運維人員對問題的處理流程不一致,就有可能導致優先級高的問題被滯后處理,影響系統穩定性。

1.2.5缺少集中管理的運維措施隨著醫院數據中心各個子系統的信息化規模逐漸擴大,網絡架構和IT設備組成也越來越復雜。單憑幾個獨立的監控軟件,通過人工讀取、分析監控的IT設備運行數據的方式根本不能正確判斷數據中心IT設備的具體使用情況、性能瓶頸等。另外,管理人員也不能及時發現IT設備存在的隱患,網絡穩定、信息系統安全也無法得到有效的保證。

2基于監控管理平臺的運維針對以上數據中心運維過程中遇到的問題,醫院引入數據中心監控管理平臺,旨在通過該平臺全面規劃、集中統一的運維方式,對網絡系統、服務器等進行管理、監控,在系統出現問題的時候可以自動發出告警信息,從而提升工作人員的運維效率,保障系統穩定性。此外,利用監控管理平臺的自動化、智能化方式實現對數據中心IT設備的監控,還可以減少人力物力的投入。

2.1監控管理平臺功能數據中心監控管理平臺是依托人工智能,利用集成技術所構建的一個綜合性平臺。該平臺不僅可以全方位分析機房設備的運行狀況,還可以自動定位部分小型故障。

2.1.1網絡拓撲管理監控管理平臺可以自動發現網絡設備,采用3D可視化頁面,從全局視角提供業務及網絡拓撲結構圖。拓撲圖可以實現報警定位,工作人員通過告警顏色和定位確定問題級別,及時了解數據流向,以輕松掌握設備運行狀態。

2.1.2業務監控監控對象主要有兩類,一類是軟件業務,包括:業務系統、數據庫、虛擬化、軟件服務等;另一類是基礎設備,包括:服務器、交換機、存儲、防火墻、路由器等。平臺統一監控所有設備,集中分析信息,向管理人員實時提供性能分析數據,遇到故障及時發出告警。

2.1.3設備運維監控管理平臺支持全天候自動化巡檢,定期自動檢查設備運行狀態,可實時向移動端發送故障告警,同時可以快速定位設備故障,準確定位問題根源。

2.1.4資產管理監控管理平臺可以實時更新及查看主機資產明細,如設備IP、系統版本和設備型號等信息。

2.2監控管理平臺結構數據中心監控管理平臺主要由數據采集層、數據處理層和數據展示層組成,如圖1所示。數據采集層主要負責監控并定期采集被監控對象的數據,然后將采集到的數據向下發送給數據處理層。數據處理層采用CMDB技術,對采集到的監控數據進行分析與數據處理,并將結果發送到數據展示層。數據展示層支持多種展示方式,通過表格、大盤頁面等方式,按要求展示全局性信息或指定內容的具體信息。

2.3監控管理平臺運維2.3.1運維配置數據中心監控管理平臺支持對所有硬件資源的統一配置和監控,主要監控范圍包括服務器主機、網絡安全設備、存儲設備、數據庫和業務系統等,還可以預警數據庫死鎖、表空間占用情況及網絡安全攻擊等,如圖2—3所示。

2.3.2運維展示通過數據中心監控管理平臺,每個運維人員都可以隨時通過瀏覽器查看某個或所有硬件設備的運行狀態及性能監控信息。設備出現故障時,監控平臺根據平臺中設置的人員權限,第一時間將告警信息通過微信和郵箱推送給運維工程師,如圖4—8所示。

數據中心監控管理平臺主動告警功能可以彌補運維人員處理關鍵問題時的差錯,從而保證問題得到及時處理。此外,平臺從多個層面、多個維度展示監控項目信息,尤其是對影響信息系統穩定的數據庫死鎖、網絡故障和存儲問題,即使是運維經驗欠缺的工作人員也能在平臺指引下及時處理問題,極大地降低了核心運維人員的壓力,有效提升了運維人員整體工作能力和效率。

3結語數據中心監控管理平臺利用其主動運維、自動操作和及時告警的強大功能,有效地解決了數據中心運維難、效率低的問題,為保障醫院信息系統穩定運行起到了重要作用。但是運維人員在享受監控管理平臺帶來的便利同時,也要充分地利用好平臺,在實際的工作中不斷摸索,根據具體情況實時改進平臺中的監控和告警配置策略,爭取把平臺的有效性發揮到最大,避免因無效信息而淹沒重要的告警信息,錯過修復系統的最佳時間。

參考文獻

[1]高山,費曉璐.醫院信息化主動式運維研究[J].中國數字醫院,2016(11):98-101.

[2]孔琳.醫院信息系統的安全與維護[J].醫學信息,2016(7):9-11.

[3]謝之光.大數據時代下的數據中心運維管理研究[J].數字通信世界,2022(4):131-133.

[4]徐景日.大數據時代下的數據中心運維管理[J].信息與電腦,2020(2):113-115.

[5]胡劍.淺析醫院信息系統運維和管理[J].信息記錄材料,2021(6):27-29.

(編輯 王雪芬)

Influencing factors and countermeasures of hospital data center operation and maintenanceGuo? Hui

(Nanjing Jiangning Hospital, Nanjing 211100, China)Abstract: With the advancement of medical informatization, data centers have become the main components of hospital information systems and play a vital role. However, due to the large data center system, strong professionalism and high technical requirements, there have been problems of time-consuming and inefficient operation and maintenance process. This paper first analyzes the contents of data center maintenance and what factors affect data center O&M efficiency, and then elaborates on how the data center monitoring and management platform can achieve proactive alarms, detailed positioning, and assist O&M. Through the deployment of this monitoring and management platform, the work efficiency of operation and maintenance personnel is improved, which plays an important role in ensuring the continuous operation of hospital business systems.

Key words: 英文關鍵詞hospital information system; monitoring and management platform; hospital data center operation and maintenance

猜你喜歡
醫院信息系統
以醫院信息系統為例談計算機病毒的有效防范
反統方技術淺談
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合