?

測量與績效管理中的數據質量保證實踐

2023-06-18 07:14周山山
管理學家 2023年11期
關鍵詞:數據質量

周山山

[摘 要]在各企業推行數字化轉型的時代浪潮中,如何做好數據治理是各企業面臨的一大難題。數據治理中最關鍵、最重要的一環就是數據質量管理。文章詳細解讀和探討了GJB 5000B中測量與績效管理實踐域關于數據質量的管理實踐,通過分析數據質量的來由,旨在探討做好軟件質量管理中的數據質量管控和推廣,并為相關工作者提供借鑒和參考。

[關鍵詞]數據質量;軟件管理;數據質量管理;測量與績效管理

中圖分類號:TP311 文獻標識碼:A 文章編號:1674-1722(2023)11-0001-03

在探討數據質量之前,首先需要清楚什么是數據質量。從20世紀70年代開始,關于數據質量的研究工作逐漸興起,其主要經歷了萌芽、形成和繁榮三個階段,經過幾十年的研究發展,形成了許多理論、技術和方法[1]。在軟件開發管理領域,測量與績效管理是GJB 5000B版標準中的重要實踐域之一,該實踐域的目的是運用測量和分析的方法管理工作和業務績效,確保在實現業務目標的同時,組織能力和績效得到同步提高。

數據質量是測量與績效管理實踐域的一項重要實踐,做好測量與績效管理工作的基礎是做好數據質量的管控。沒有數據質量,任何數據分析工作便沒有了基礎,基于數據分析開展的決策就會產生偏差,進而影響組織的業務目標實現。高質量的數據已經成為企業增強市場競爭力、制定正確決策的戰略資源之一[2]。文章通過討論數據質量的定義、發展過程,分析各企業如何做好數據質量管控,以便為各企業的數據質量管控工作提供治理方向。

一、數據質量

在數據質量的發展過程中,數據質量包括絕對值質量和過程質量?!缎畔⒓夹g 數據質量評價指標》中對“數據質量”一詞作出了明確定義:數據質量是在指定條件下使用時,數據的特性滿足明確的與隱含的要求[3]。

數據質量關注如績效和測量信息的齊全性和準確性等方面的內容,數據質量需要保證數據測量要遵循的操作定義及數據存儲的完整性。

GJB 5000A-2008《軍用軟件研制能力成熟度模型》將數據質量作為一條子實踐提出了要求,即在測量分析過程域“SP 2.1采集測量數據”中的子實踐“盡可能靠近數據源進行數據完整性檢查”[4]。該子實踐僅要求檢查數據的完整性,既不全面,也不具備較強的可操作性,間接導致了各企業在落實GJB 5000系列標準的過程中,對于數據質量的管理不夠重視,缺乏有質量的數據,數據分析、數據治理工作無法有效開展。

因此,GJB 5000B-2021在換版過程中吸取了GJB 5000A推進過程中的經驗教訓,將對數據質量的要求提升至測量與績效管理實踐域中的一條獨立實踐,即“MPM3.2建立并維護保證數據質量的準則”[5]。大數據時代比任何時候都更加注重數據質量。該標準對實踐提出了具體操作要求,便于標準落地實施,為各企業發揮四級的軟件能力成熟度水平打牢數據基礎,體現了數據質量是后續開展量化管理的基礎,必須予以高度重視。

二、數據質量管理的意義

高質量的數據是分析、預測和開展軟件開發活動的基礎。隨著軟件開發相關數據越來越多,社會大眾逐步認識到了數據質量的重要性,并發現了一些潛在的數據質量問題[6]。

在企業推進GJB 5000系列標準的過程中,經常會出現兩類關于數據質量的典型問題。一類是測量數據缺失。例如,某軟件項目提交的測量分析報告,由于部分數據不完整,導致數據質量不高、存在大量空值,進而影響組織級測量項的偏差,導致組織過程改進項未得到準確識別,影響組織過程改進。另一類是測量數據不準確。例如,某項目采用軟件產品線的方式研制軟件,大量使用了軟件模塊,但是在采集部分測量數據時,仍舊采用常規計算方法,導致出現測量數據不準確的情況,即對軟件按照新開發的方式計算工作量,往往使軟件的生產率顯著提高或嚴重脫離實際。

因此,數據質量管理具有重要意義,其重要性主要體現在以下三個方面。

第一,數據質量管理是實施數據治理的必要環節。數據治理是數據資源及其在應用過程中相關活動的集合。數據治理主要包括數據戰略、數據架構、數據質量、數據交換和數據安全等諸多方面。數據質量是其中必不可少且關鍵的環節。同時,數據治理的目的是保證產生、提供和使用高質量的數據。

第二,數據質量管理是數據資產建立的重要保障。數據資產是指由組織擁有或者控制、為組織帶來利益的數據資源。數據是組織重要的、核心的、寶貴的資產。數據價值的高低由數據質量的好壞直接決定。

第三,數據質量管理是數據應用服務的基礎條件。數據應用服務是數據資產價值的重要表現形式,與組織的業務息息相關。高質量數據提取才能生成高價值的信息。數據質量直接影響數據應用服務的效果。

三、做好數據質量管理的策略

(一)數據質量標準定義

《信息技術 數據質量評價指標》關于數據質量的評判標準給出了明確的規定[3],如圖1所示。

1.規范性

規范性是指數據符合數據標準、數據模型、元數據、安全規范、業務規則或權威參考數據的程度。數據測量項應滿足本企業規范中的測量項定義。

2.完整性

完整性是指按照數據規則要求,數據元素被賦予數值的程度,一般以數據采集到的程度衡量數據的完整性,即應采集的數據和實際采集到數據的比例。測量項采集人應按測量分析計劃的要求采集數據,保證數據的完整性。

3.準確性

準確性是指數據準確表示其描述的實際對象真實值的程度。采集人在數據采集時,測量項的量綱、精度、值域、測量函數、采集存儲方法及采集時機應滿足本企業規范中的測量項定義。

4.一致性

一致性是指數據與其他特定上下文中使用的數據無矛盾的程度。單個測量項只能有一個采集源。當同一測量數據多處存在時,數據之間應保持一致。

5.時效性

時效性是指數據在時間變化中的正確程度。在不同階段,測量項應按測量分析計劃要求進行采集、分析和存儲,應定期(根據項目要求)或事件觸發時(出廠質量評審、內外部檢查等)更新測量數據。

6.可訪問性

可訪問性是指數據能被訪問的程度。數據經采集分析后應按企業規范中的測量項定義進行存儲,確保能被訪問。同時,數據在需要采集時,應保證能被授權人員訪問。

(二)數據質量監控與評估

數據質量監控的目的是滿足數據質量要求,消除或減少異常數據。主要方式是利用已定義的規則定時進行批處理,及時發現問題,提高輸出數據質量。數據質量監控一般采用信息化手段實施,保證監控效率和監控質量。數據質量評估則是利用數據質量標準和評估方法,評估數據質量,得到評估結果,為提升數據質量提供參考和依據。

通常情況下,可以按照數據質量各維度的標準制定符合要求的計分準則,最終評分則按照各個標準的滿足情況進行評分加權,加權后的結果作為數據質量的優劣評判依據。需要注意的是,數據的優劣與數據的特性、數據的應用場景及業務發展階段息息相關。

(三)數據質量原因分析

數據質量原因分析的主要工作是準確描述問題和具體分析問題。首先是呈現問題,準確描述問題是分析解決問題的首要條件,問題描述清楚的過程也是分析解決問題的一部分。其次是針對具體問題展開具體分析,通常采用可視化的方式,分類統計數據問題,分析數據質量的變化趨勢,找出其中常見的問題。

數據質量分析不能只停留在發現問題本身,而是需要追根溯源,找到數據的源頭系統。影響數據質量的因素一般涉及技術、業務和管理三個方面。

技術因素主要表現為由于數據處理各技術環節異常產生的數據質量問題,主要包括數據模型設計、數據采集過程、數據源和數據存儲等。

業務因素主要表現為由于業務系統作業流程和人工操作流程設置不當而產生的數據質量問題,主要包括業務需求不清晰、業務端數據輸入不規范、業務需求的變更和數據作假等。

管理因素主要表現為由于人員能力及管理機制等方面原因產生的數據質量問題,主要包括缺乏數據思維、缺乏明確的數據質量目標、缺乏有效的數據管控機制和質量問題處置機制等。

(四)數據質量改進與提升

數據質量改進與提升可以采用PDCA循環過程這一方法。PDCA循環又稱戴明環。該方法是由質量管理專家休哈特率先提出的,通過管理專家戴明的宣傳并普及,其成為全面質量管理的思想基礎和方法依據。

PDCA循環分為策劃(Plan)、實施(Do)、檢查(Check)和處置(Act)四個步驟。它可以使我們的思想方法和工作步驟更加條理化、系統化,反映了企業管理業務的一般規律。在質量管理過程中,各項工作通常按照制定計劃、實施計劃和檢查效果展開,然后將成功的實踐納入規章制度,未獲得成功的工作留到下一循環繼續解決[7]。

根據PDCA循環,數據質量改進與提升的通用步驟可以分為以下五個方面。

一是明確質量提升改進目標,圍繞企業業務,定義數據質量管理的需求和提升目標。

二是建立組織體系保障,構建數據質量管理的組織體系,包括制定相關業務規則、目標和指標等,確保數據質量管理得到組織體系的保障。

三是實施考核體系,建立數據質量KPI,確定數據質量水平和警戒值,通過常態化開展數據質量考核,評估數據質量管理情況。

四是制定問題解決方案,根據數據質量的提升改進目標,制定數據質量問題處理策略和計劃并付諸行動,落實問題整改和糾正,解決數據質量問題。

五是確認數據質量提升效果,通過不斷監控和評估數據質量,確認數據質量提升效果。

四、展望

文章從數據質量的含義、意義及工作內容等方面展開了實踐探討,結合GJB 5000B《軍用軟件能力成熟度模型》的換版思想及GB/T 36344《信息技術 數據質量評價指標》的規范性要求,為企業實施GJB 5000B四級或是數字化轉型提供了數據保證。

數據質量保證是一項基礎且繁復的工作,文章僅是筆者從實踐的演變角度對標準的簡單分析和研究,不能保證完全深入透徹地描述其背后的復雜情況,有待后續隨著標準的進一步實施,發掘更多的優秀實踐,指導各企業開展數據質量治理工作。

參考文獻:

[1]蔡莉,梁宇,朱揚勇,等.數據質量的歷史沿革和發展趨勢[J].計算機科學,2018(04):1-10.

[2]甘似禹,車品覺,楊天順,等.大數據治理體系[J].計算機應用與軟件,2018(06):1-8.

[3] GB/T 36344-2018,信息技術 數據質量評價指標[S].北京:中國標準出版社,2018.

[4] GJB 5000A-2018,軍用軟件研制能力成熟度模型[S].北京:總裝備部軍標出版發行部,2009.

[5] GJB 5000B-2021,軍用軟件能力成熟度模型[S].北京:國家軍用標準出版發行部,2022.

[6]涂菲菲,周明輝.軟件開發活動數據的數據質量問題[J].軟件學報,2019(05):1522-1531.

[7]周強.PDCA循環理論在外匯數據質量管理上的應用研究與實踐[J].微型電腦應用,2017(01):62-66.

猜你喜歡
數據質量
電子商務平臺數據質量控制系統及仿真模型分析
基于大數據背景下提高供電局數據質量對策分析
強化統計執法提高數據質量
淺析統計數據質量
金融統計數據質量管理的國際借鑒與中國實踐
淺談統計數據質量控制
企業統計工作之我見
統計信用與統計數據質量研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合