?

基于IT 管控的科研數據治理框架研究

2023-08-09 23:21焦夢林李振龍
計算機應用文摘 2023年15期
關鍵詞:數據治理

焦夢林 李振龍

摘 要:數據治理是科研生產活動在數字化時代的重點議題,文章分析了數據治理的應用現狀,結合實際的科研生產場景歸納出科研數據治理過程中的問題,并基于現有問題提出針對科研數據治理能力的框架。旨在通過數據治理實現科研生產數據價值的優化。該樞架以教字化服務為核心。以生產應用目標為導向,完善了科研數據治理過程中的方法體系。關鍵詞:數據治理;科研數據:數據價值

中圖法分類號:G258

文獻標識碼:A

1 引言

在數字化服務發展的浪潮下,發揮數據這一核心資源的價值成為時下的熱點議題,該議題的核心要點就是通過治理發揮出數據的潛在價值?;诖?,學術界和產業界進行了大量的探索和實踐,并卓有成效。包冬梅等[1] 提出了一種針對高校圖書資源的數據治理框架?CALib 框架。肖潔瓊等[2] 對比分析了國內外幾種經典的數據治理模型特點,為相關工作提供了一定的理論基礎。馬廣惠等以云上貴州公司為切入點,拓展了大數據治理的研究方法。楊琳等提出了面向大數據的治理框架,并實際列舉了多個場景。在通用數據治理模型方面,已經出現了IBM 數據治理模型、DGI 數據治理框架、DAMA 數據治理模型、《數據治理白皮書》模型等優秀框架,這些數據治理模型基本都闡明了數據治理過程中的目標、職能、核心、規范等,其中數據治理目標一般為提高數據資產的質量,形成完整、可用的數據,指導數據管理過程,實現對所有人的數據公平訪問,并實現數據價值的最大化;數據治理職能即是指對需要的數據進行的一系列評估、指導和監督的行為;數據治理的核心為控制數據質量、提供創新性的數據服務以及實現對數據資產的各項決策和相關權利控制;數據治理規范是指數據治理必須遵從嚴格的規范和流程,以保障數據治理的嚴謹性。從上述工作中看到,學術界和產業界都對數據治理工作進行了實踐。然而根據肖潔瓊等研究報告,學術界和產業界的工作并沒有呈現出緊密的聯系,包括數據治理的定義也仍未達成共識,學術研究成果在指導產業界方面仍然影響力不足,這說明目前的數據治理工作仍然依賴于具體的實踐工作,缺乏通用性、普適性強的模型。

科研生產數據是一種典型的高信息密度流資產,是科研設計活動的核心及產物。然而從多個渠道產生的數據缺乏處理,導致數據利用率低,無法發揮數據潛在價值,難以打通數據產生環節和數據流通環節的壁壘,導致無法形成有效的數據效能反饋機制。因此需要高效完成科研生產數據的治理工作,實現服務價值及科研價值的創效提升?;诖?,本文在標準化組織及咨詢公司的治理模型基礎上,分析實際科研場景下的數據產生及使用特點,提出一種用于科研生產的數據治理框架,也為其他數據治理應用項目提供參考。

2 數據治理介紹及科研數據治理框架

2.1 數據治理的基本定義

數據治理目前尚無一個公認的統一定義,各類定義工作主要由權威機構引領,這些基本定義從不同切入點指明了數據治理工作的內涵。

DAMA(國際數據管理協會):將數據治理作為數據管理的核心,將數據治理劃分成對數據資產行使權力和控制的計劃、監督、執行等過程。

Gartner(高德納咨詢公司):將數據治理作為IT治理的一部分,也屬于公司治理的定義范圍之內。

HESA(高等教育統計局):強調數據治理和實際的組織設計及管理結構是強關聯的,因此數據治理工作應該在通用模型基礎上結合實際進行自我適應。

通過對當前治理模型的綜合分析,可以得到一些共同點:治理模型一般都對治理目標及治理原則作出明確界定,這兩者在數據治理過程中起著指導性作用,治理原則同時也起著行動綱領的作用;在構建治理模型之前,需要從全局出發,首先清晰、準確地提煉出本次數據治理的整體期望,以數據治理政策支撐治理過程中的具體要求,即監督相關角色履行相關責任,并對數據治理的主體和客體涉及的方方面面作出解讀;同時模型需要指出治理各要素作所涵蓋的內容,使模型具有現實指導意義。

正由前文提到,現有的數據治理模型應用背景不是一成不變的,因而不同的數據治理模型都會表現出獨特性與應變性。由于數據治理工作是一個動態過程,為了保證配置的靈活性,需要配合適當的評估機制,讓數據治理過程中的不同角色可以根據需要完成任務。

經過上述分析可以看到,目前的數據治理工作有其共通點,但是因為數據治理工作不能脫離具體組織,所以數據治理模型必須與當前組織的管理與文化背景相融合,為數據共享服務,使數據治理模型與組織功能相互協調。

2.2 科研數據治理框架

本文提出的科研數據治理框架的核心目的是促成數據規范化,提高數據在ERP 系統使用過程中的效率,提升科研數據在科研活動中的利用率?;诖?,本文提出的數據治理框架從數據促成、數據流通、數據安全、數據價值提升等方面出發,結合IT 技術與管理制度,形成完整的閉環管理,如圖1 所示。

在圖1 中,整個治理框架分成3 部分:建立主數據的管理模型、基于IT 模型的業務數據管理以及進行業務提升的決策模型。本框架充分考慮了業務反饋機制,靈活配置業務,讓業務模型與數據及時響應企業的決策變化。主要模塊介紹如下。

(1) 數據規范層:數據規范層包含了主數據及與其產生的業務模型和數據模型。數據規范層規定了數據治理過程中的基本范式,是數據治理的基礎,后續工作都圍繞主數據的規范進行。

(2) 數據流通層:數據流通層包含IT 技術架構和規章制度監管。數據流通層是數據的主要產生和流通場景,是日常業務的核心部分。

(3) 業務價值提升層:業務價值提升層主要根據產生的數據進行業務戰略判斷,對當前數據價值進行進一步挖掘評估,并根據戰略變化調整業務數據模型。

3 主數據模型構建

數據治理的重要目的是提升數據公信力,為數據應用提供堅實的基礎。為此,本文首先進行主數據模型構建,將各類零散數據進行統一管理,如圖2 所示。

3.1 基礎數據獲取

基礎數據獲取是主數據模型構建過程中必不可少的一步。本文采用了自頂向下的演繹方式歸納資產數據,即通過梳理業務價值鏈明確能夠驅動企業前進,并挖掘具有極高業務價值的應用場景,結合該場景下的業務現狀和未來工作需求,識別出能夠支撐企業發展的數據。對獲取到的數據資產從八個能力域進行評估:數據戰略、數據架構、數據標準、數據質量、數據安全、數據應用、數據治理以及數據生命周期。同時制定數據標準,清洗出業務中的缺失、廢棄、錯誤等不符合規范的數據,保證數據質量并呈現出高標準態勢,進而進行統一管理。

3.2 主數據管理

主數據模型應用時需進行一系列業務活動,這些活動的核心目的是保障主數據的完整性、一致性以及及時性。因此需要設立符合應用場景的管理制度,并監督制度的執行情況,及時響應各類質量問題。結合業務形成體系的手冊,并及時更新手冊內容,與技術手段一起共同保障管理流程的順利執行。同時為了充分發揮人員在主數據管理中的作用,實現一人一責,明確各類角色在整個任務流程中的責任,并根據履責情況實行動態獎懲制度,建立定量的責任管理體系,實現全員參與主數據管理的目標。

4 基于IT 架構的業務數據管理

由于科研數據包含多個領域,導致信息來源復雜,采用人工進行數據治理的手段效率低下,難以滿足大規模數據應用場景下的需求。為此,需要結合IT手段管理業務數據,充分發揮計算機在處理、存儲方面的優勢,減少人工參與,打通業務數據在各環節的壁壘。

科研日?;顒又幸援a品數據管理(Product DataManagement,PDM)為代表的科研設計系統和以企業資源計劃(Enterprise Resource Planning,ERP)為代表的數據流通系統聯系緊密,然而卻常難保證數據在不同系統間的一致性,為此本方案依托IT 管理模型在全局層面實現數據的完整性和一致性,完成業務架構的規劃、建設、維護及動態調整,實現對業務數據的全生命周期管理,如圖3 所示。

該框架將業務部門需求對接到信息系統中,經過業務架構整合、技術方案設計、立項審批及投產上線等環節后,實現科研數據在業務?IT 技術矩陣的嵌入。在設計信息系統時,以周期管理需要為領,以規范化管理為向導,使科研數據統一業務入口、集成多個方面的信息,進而使數據生產和流通以規范的形式進行。

在建設完以業務為核心的IT 管理系統后還需要對其進行高效的運維。一方面在日常運行過程中檢查數據是否滿足業務要求,以及實際科研環境下實施技術目標和技術手段是否滿足需要;另一方面收集數據完善基礎信息,統一管理和維護IT 架構的軟件和硬件環境,為標準化、結構化、精細化的IT 架構服務提供保障。同時形成完善的監控報告、提供準確詳實的日志、實現運行狀態可視化、展現各類關鍵指標的運行狀態。

為充分發揮信息系統的效能,還需要支持IT 架構的動態追蹤功能。通過對產生的臺賬進行分析,梳理內含的業務模式,建立對業務需求演變及狀態追蹤的管理模式,從統計分析等角度切入業務需求,也可從業務組件、邏輯子系統等方面深入介入業務系統,判斷業務需求是否已經產生變化,并及時反饋到系統中,形成控制閉環。

5 基于數據治理的戰略決策

使用數據中的隱藏價值是數據治理的核心目的,在本文中即是指支撐高層次戰略決策,以支撐組織進一步發展。為實現此目的,對日?;顒又挟a生的臺賬進行分析挖掘,從更小的顆粒度、更小的基本單元、更深層次方面揭示其數據內涵。一般而言,從2 個層面對科研數據進行統計評估。一方面采用自底向上的數據挖掘算法獲取大數據下的統計關系來完善信息資源體系、提供知識發現服務、推動價值體系創新。另一方面,基于組織戰略發展目標建立可實際運行、可量化的評估與統計指標體系,采用自頂向下的方式編制各類統計手段,完成可持續的統計報告。通過這兩方面手段的結合,實現了關聯數據的數據改造,建立了數據要素間的關聯關系,形成知識鏈條,進而進行戰略決策。其具體如圖4 所示。

本文將戰略決策涉及的模塊分為業務規劃、科研生產及職能管理等業務,明確各板塊之間的規范性,與臺賬經評估再挖掘后的數據進行進一步耦合,以支撐戰略決策。

6 結束語

本文針對科研活動提出了一種治理框架,并介紹了主數據模型構建、科研業務管理基本框架以及戰略決策模塊。通過科研數據治理框架把控科研活動中的各環節,為創效提質、把控全局提供了可行的思路,從而獲取數字時代隱藏的數據價值,不斷提升科研活動各生產要素的參與價值,促進科研活動的高效發展。

參考文獻:

[1] 包冬梅,范潁捷,李鳴.高校圖書館數據治理及其框架[J].圖書情報工作,2015(18):8.

[2] 肖潔瓊,奉國和.國內外數據治理模型對比分析[J].文獻與數據學報,2020,2(2):12.

作者簡介:

焦夢林(1997—),碩士,助理工程師,研究方向:信息化支持。

李振龍(1985—),碩士,高級工程師,研究方向:信息化規劃及建設。

猜你喜歡
數據治理
云端數據治理定義解析
智慧服務型數字化校園建設參考實現框架
營配貫通臺區線損異常數據治理分析
高校信息化數據治理探討
智慧城市建設項目風險挑戰與解決經驗
高校數據融合路徑及其治理框架的探討
基于本體的企業運營數據治理
云端數據治理初探
大數據治理模型與治理成熟度評估研究
大數據時代城市治理:數據異化與數據治理
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合