?

淺論大數據背景下檔案管理模式的發展及挑戰

2022-05-30 17:33袁月林
科技創新導報 2022年18期
關鍵詞:數據治理挑戰大數據

中圖分類號:G270.7DOI:10.16660/j.cnki.1674-098x.2205-5640-1709

作者簡介:袁月林(1963—),女,本科,研究館員,研究方向為檔案管理。

摘要:大數據背景下,數據治理成為了國家、企業不可忽視的重要課題,技術革命催生了開放共享乃至人機協同的發展場景,對于檔案管理而言也具有加大的影響。檔案作為傳統的記錄,實質上也可以轉化為數字化的電子數據,那么檔案管理與檔案數據管理的趨同性使得數據治理理念的融入成為了大勢所趨,但是檔案管理模式也具有其發展的背景、特點及挑戰,本文以數據治理為視角,闡述數據治理與檔案管理的內涵及發展,進一步探討在此層面上檔案管理事業所面臨的挑戰及應對策略,以期推動我國檔案管理事業的更好、更快發展。

關鍵詞:大數據 ?數據治理 ?檔案管理 ?挑戰 ?策略

On the Development and Challenges of Archive Management Mode in the Context of Big Data

—— A Perspective of Data Governance

YUAN ?Yuelin

(Jilin Province People's Hospital, Changchun, Jilin Province, 130021 ?China)

Abstract: In the context of big data, data governance has become an important issue that cannot be ignored by the state and enterprises. The technological revolution gave birth to the development scene of open sharing and even human-computer collaboration, which also has an increasing impact on archives management. Archives, as a traditional record, can also be transformed into digital electronic data in essence. The convergence of archives management and archives data management makes the integration of the concept of data governance a general trend, but the archives management model also has its development background, characteristics and challenges. This paper expounds the connotation and development of data governance and archives management from the perspective of data governance, further explore the challenges and countermeasures faced by the cause of archives management at this level, in order to promote the better and faster development of the cause of archives management in China.

Key Words: Big data; Data governance; Archival management; Challenge; Strategy

1 “大數據”背景下的數據治理與檔案管理

“大數據”的概念是在新興技術發展升級帶來的科技革命背景下誕生,在經歷概念的逐漸演化后,其更多指向了技術的演變和使用,這些技術可以在眾多冗雜、且呈指數增長的數據中,在正確的時間向正確的用戶提供正確的信息。大數據具有數量巨大(Volume);結構化、半結構化、非結構化的多樣性特征(Variety),以及傳輸速率快、實時性(Velocity)為代表的傳統的“3V”特征,也具有數據或數據源質量、準確性及不確定性水平差異的特點,其質量和準確性(Veracity)的保證是重要的,與此同時,數據所具有的潛在價值(Value)也是另一大關鍵特征,也即“5V”特征屬性。

由于數據產生、存儲、分析、計算力等技術的提升使得數據的存在不僅僅作為不斷累積的映射和記錄的體現,數據作為重要的“資源”之一,其本身的價值以及其可帶動其他產業轉型的附加價值均得以進一步挖掘,例如政務數據的公共管理價值、科學數據的研究價值、商業數據的商業價值等,這些數據驅動的價值對于公共治理、科學研究范疇及經濟領域等各領域具有不可小覷的重要意義,有學者發現數據要素已然成為實業、學界、管理界的重要研究對象,大數據范疇下的科技屬性為諸多領域的產業帶來資源重整、運行方式的變革[1],同時也推動了各領域向以數據依托的精細化管理發展[2],因此,數據在成為了其中新的價值元素,而圍繞數據價值下的數據治理成為新的挑戰。例如,我國學者從大數據價值發現的角度提出了4C(Collaboration)模型(數據協同、計算協同、分析協同、人機協同)進行數據價值發現,同時也指出治理層面所需要解決的倫理問題、智能系統行為等多重挑戰[3]。

2 數據治理視角下檔案管理的內涵發展與轉變

從傳統的紙質檔案資源通過光學字符識別(OCR),到數字化的電子檔案資源,檔案早已演化為“大數據”資源中的重要組成部分,“檔案”與“檔案數據”概念趨向統一?;诖髷祿尘跋碌臄祿卫硪暯?,檔案管理在數據治理的映射下,其內涵也可作為數據治理的一部分而得以豐富,同時,由于檔案也是國家公共治理、社會治理的重要組成部分,需要達到現代化、智能化的水平,檔案管理更是精細化管理的重要環節,而“檔案治理”也因此應運而生,在我國2016年《全國檔案事業發展“十三五”規劃綱要》中,檔案治理成為了檔案事業發展的重要關鍵詞之一[4]。在數據治理視角下的檔案管理實際上就是針對檔案數據治理,一方面脫胎于傳統的檔案管理,具有檔案管理的特征,另一方面也與數據治理本質屬性共通,具有明顯的數據特征。從這兩個角度出發,檔案管理的內涵可從主體客體層面、技術理論與應用層面及法律規制層面的發展進行理解。

2.1 主體及客體層面

傳統的檔案管理具有明顯的管理特征,是基于政府或企業本位,由相應管理者從事的具有壟斷特征的管理事務,而治理更傾向于具有基于現代化管理科學的涉及公共或私人的多元化管理的特征[5]。因此,傳統的檔案管理的主體是檔案部門,往往是單一主體,具有一定的壟斷性和獨立性,檔案管理負責的檔案信息往往以“孤島”的形式存在,處于隔絕、無法交互共享的狀態。而數據治理視角下的檔案管理的主體往往會因為檔案數據來源的分散性、檔案數據本身的復雜性和多元性而拓展為多元主體,在一定程度上應當與數據治理形成融合和共振,例如政府與公眾、不同的政府或企業部門之間等,對于單一的檔案管理部門而言,更應當從數據價值挖掘的角度出發,探索管理的過程模式,而非僅著眼于所負責管理的檔案本身,在某種程度而言,數據技術就是一種精細化的治理術,在這個意義上,檔案管理者無疑面臨更高的要求和挑戰。

傳統檔案管理的客體也即檔案信息,通常強調的是信息的穩定、安全性,但是數據治理視角下的檔案數據需要具有開放共享的特征,強調的是數據背后蘊含的價值挖掘,運用數據技術進行安全、高效、智能化地收集、存儲、分析、利用數據,可以發現,自2007年我國通過立法的形式公布《中華人民共和國政府信息公開條例》以來,政務信息的公開成為我國探索數據治理的重要里程碑,隨著2012年上海構建全國首個政府數據開放平臺的落地,我國的各級政府數據逐步開放,透明化的政府信息、讓陽光照進政務已成為現實,精細化管理逐步得以實踐。在這一趨勢之下,我國的檔案數據開放計劃也成為了“十三五”工作要點之一,電子檔案“單套制”管理的變革也是基于數據開放流動、數字化發展的需求而提出,逐步將實體運行方式轉化為數字化的虛擬運行模式[6],大數據所具有的虛擬替代屬性也在檔案管理范疇內得以體現,這種虛擬化的數字客體,可以充分利用互聯網的優勢,實現動態精準地調配與利用,同時易于實現有序的組織與開放共享,從主客體范圍的拓展,進一步提升治理能力,豐富檔案管理內涵屬性的邊界。

2.2 技術理論與應用層面

大數據時代的核心關鍵詞之一就是計算分析,大數據的分析主要包含4種類型[7]。第一為描述性的分析,也即描述已經發生的現象,是對過去現實狀態的一種收集和記錄,在一定程度上,描述性的分析手段可以紀念館一定的未來趨勢的推斷。第二為診斷性的分析,是針對某個問題的分析,找到某種問題的發生原因。第三為預測性的分析,它使用既往的數據預測未來可能發生的事件,其主要應用的技術包括數據挖掘、人工智能技術等。第四為整合性的分析,也即依托于現有數據的呈現、預測,以及對問題的識別與判斷,加以整合分析出最佳的解決方式或發展路徑。按照以上4種分析類型,不難構建出大數據背景下,從數據治理角度出發,對檔案管理的技術的應用。

在具體的應用技術層面,由于區塊鏈本身的特征屬性,對于檔案管理的真實性、留痕可追溯性、多方維護、公開透明等要求具有較高的匹配度,因此區塊鏈技術是應用于檔案管理的較為常見的技術。美國、英國等國家都逐步搭建了檔案管理引入區塊鏈技術研究的項目,同時國內也形成了鼓勵發展的政策環境,我國學者也積極展開了相關的科研工作,涉及了技術研發、理論構建等內容,無論是對區塊鏈技術本身的概念拓展、還是對具體適用場景的探索,均形成了一定的科技成果[8]。圍繞區塊鏈技術在檔案管理中的應用,調研發現,中國石化[9]作為國有企業先行探索,從2017年開始就區塊鏈技術與業務結合可行性進行探索研究,2018年主要基于Fabric的聯盟鏈技術,在企業內部選取了多家節點完成私有鏈的搭建,在電子檔案的真實性保障層面體現了較高的優勢,也由此衍生出了諸如具有身份認證及合同簽約、全流程上鏈、信息不可篡改、可公開驗證等特點的區塊鏈電子合同等應用,使得檔案管理不僅實現了傳統功能,更通過技術的引進,在應用的層面上形成了動態的治理優化。除此之外,可以發現,隨著人工智能技術的發展,智能化平臺的搭建,以及構建“智能+檔案”成為了數字科學領域發展的關鍵,我國在檔案管理智能化的發展實際上也取得了一定的進展,例如2019年研制成功的檔案智能運維機器人、智能芯片、檔案庫房智能化管理等[9],均為高效、智能管理提供了技術保障,也充實了檔案管理的內涵。

2.3 法律法規標準規制層面

正如前文提及數據治理概念面向的客體為數據資源,國際數據管理協會(DAMA)也指出這種行為屬于權力和控制的范疇[10]。但是對于檔案管理而言,在大數據背景下,其更在于權力的下放,而非形成“數據霸權”。首先,在數據治理視域下的檔案管理首先應達到數據的標準化級別,以及構建完善的體系。在我國的基層組織中,數據管理的“孤島”現象是較常見的[11],在一方面反映出了數據標準化級別尚需要提高,一方面也反映出基層工作者所面臨的巨大的挑戰。數據標準化的構建需要通過國家檔案部門進一步規范國家標準。例如,我國國家檔案局在2019年發布的《電子檔案管理系統基本功能規定》以及相關標準文件,同時地方、機構也可依據現有資源逐步完善體系的構建。其次,從法律法規的角度,應格外注意到檔案管理客體豐富的同時,其可能引入的敏感信息所帶來的隱私問題、數據安全問題及數據倫理問題??梢园l現在信息技術較為發達的現代社會,通過多種渠道提取個人信息已不再是難事,一張照片也可能包含海量的信息,這就提示了檔案管理者甄別重點數據對于保障數據安全和避免隱私風險是較為重要的,如除了傳統檔案數據可能涉及的個人身份信息、行程信息等個人隱私信息之外,尤其需要注意生物識別信息的處理,聲音、面容等信息也可以通過技術手段實現個人信息穿透,進而泄露隱私。最后,就數據治理視域下的檔案管理,往往會涉及一定程度的公開共享、挖掘分析,那么就涉及數據開放共享的相關方與個人的權益,那么某些檔案數據的開放共享的范圍、對象及背后的合理性就需要得到具有一個合法合理的依據,這種合理性分析在某種程度上也可保證數據開放的合倫理性,對于檔案管理而言是需要進行不斷完善的。

4 數據治理視角下的檔案管理模式挑戰及策略探索

4.1 檔案數據本身的特性

正如前文所述,檔案數據也是構成“大數據”的重要組成成分,實際上,檔案數據的增長速率也不容小覷,目前,盡管已經逐步形成了電子檔案數據的“單套制”,但是由于我國地區發展不均衡,仍存在大量依賴人工進行紙質檔案向電子檔案轉化的情形,這種背景使得數字化檔案的轉化效率較低,同時也較易產生錯誤、遺漏等準確性方面的失誤[12],對于大數據背景下的檔案管理而言,準確性程度的降低,容易造成較嚴重的判斷、預測等分析偏差。同時,隨著技術的發展與普及,半結構化、非結構化的數據量較大,且通常以多種組合方式與結構化的數據進行融合,數據的標準難以統一。

面對這種挑戰,構建統一的標準是解決方式之一,但是在短期內難以實現全國廣泛范圍內的普及,較為折中的方式是跨區域內、分段式達成標準規范協作共識,達成面向區域內受眾的功能實現。其次,也應當逐步推動借助智能化的手段,提升電子數據轉化的質量,引入自動機器人進行初步工作,人工后期介入檢驗復核是具有一定可及性的。與此同時,由于我國的檔案數字化發展并不成熟,許多基層地區仍存在顯著的“數據孤島”現狀,鼓勵基層對理論和實踐的不斷探索,提高工作者的數據素養也是較為重要的,如何從心態上轉變傳統的工作思路,再到實踐中積極學習先進技術知識并加以應用,是提升我國整體檔案管理水平的關鍵。

4.2 技術的成熟度及被接納度尚待提高

盡管區塊鏈等高精尖技術的引入,為檔案管理模式的優化帶來了新的契機,但是技術從誕生到完善往往需要較長時間的測試、融合階段,以區塊鏈技術[13]為例,其優勢之一即為不可篡改,但是并不是絕對意義上的不可篡改,技術始終是存在漏洞的,例如公鏈平臺的雙花攻擊,這種攻擊方式可能會通過狀態機不一致執行等方式完成,智能合約平臺也會因此在網絡中形成分叉,造成技術層面的損失和無法估計的不良后果。同時,隨著技術的不斷更迭,新技術的誕生可能會對舊技術帶來顛覆性的改變,人機交互與智能化的發展速度是較快的,未來技術的變革也需要在前期做好基礎準備,這無疑是對技術層面的必然要求。但是目前我國的檔案機構對于第三方技術的合作維度仍需提高,跨界合作是迎接未來新技術的關鍵環節,如何提高自身水平識別判斷第三方檔案科技企業的產品和促成合作,值得檔案管理者探索。

對于新興技術產業而言,從實踐中不斷積累,研發不同的策略應對技術上存在的漏洞,并針對不同的風險制定等級制度、備份計劃提供更完善的服務方式,有利于自身的成長和提高檔案管理部門或機構的信賴和接納程度。而對于檔案管理部門或機構而言,引入人才、重視交叉學科人才的培養及對檔案管理新模式的積極探索,才能夠滿足國家對于檔案事業發展的需求,實現內部機構與外部企業及智能化檔案管理受眾等的合作多贏。

4.3 檔案相關政策法規制度有待完善

實際上,我國對于數據安全、網絡安全個人信息保護等領域均已逐步完成了頂層設計的立法工作,基于相關法律和政策可以發現我國對于數據資源的重視程度是較高的,但是檔案相關的政策法規制度仍有待完善。盡管就檔案而言,從領域上仍可劃分為學生教育檔案、病人檔案(病案)、社會保障檔案等多種形式,且不同分類皆具有其特點,數據標準難以統一,制定政策具有一定難度,但是檔案數據的政策法規制度也應在實踐中逐步完善與宣講,無論是按照領域還是按照年齡,抑或是按照個人全生命周期的管理,促進制度的完善對于基層的檔案管理模式的轉型與科學深化發展是尤為重要的,也將有利于實現我國檔案管理事業的更好、更快發展。

參考文獻

[1] 王謙,付曉東.數據要素賦能經濟增長機制探究[J].上海經濟研究,2021(4):55-66.

[2] 鎖利銘,馮小東.數據驅動的城市精細化治理:特征、要素與系統耦合[J].公共管理學報,2018,15(4):17-26.

[3] 劉業政,孫見山,姜元春,等.大數據的價值發現:4C模型[J].管理世界,2020,36(2):129-138.

[4] 金波,楊鵬.大數據時代檔案數據治理研究[J].檔案學研究,2020(4):29-37.

[5] 俞可平.全球治理引論[J].馬克思主義與現實,2002(1):20-32.

[6] 陳艷.我國省級檔案數據治理體系框架構建研究--基于浙江省實踐的研究[D].濟南:山東大學,2020.

[7] RIAHI Y . Big Data and Big Data Analytics: Concepts, Types and Technologies[J].Marwah Infotech,2018(9):524-528.

[8] 劉越男,張一鋒,吳云鵬,等.區塊鏈技術與文件檔案管理:技術和管理的雙向思考[J].檔案學通訊,2020(1):4-12.

[9] 史江,羅紫菡.“智能+”時代檔案管理方法創新探討[J].檔案學研究,2021(2):54-59.

[10] 雷浩偉,廖秀健.數據治理視閾下數據權力與數據權利研究:存續邏輯、沖突悖論與完善進路[J].科技與法律,2021(5):22-33.

[11] 吳黎明.大連市民生檔案數據整合利用問題研究[D].大連:大連理工大學,2020.

[12] 周林興,林凱.大數據時代檔案數據質量控制:現狀、機制與優化路徑[J].檔案與建設,2022(2):4-8.

[13] 李春艷,喬超.區塊鏈技術在大型企業集團電子文件管理中的應用——以中國石化為例[J]. 檔案學通訊,2020(1):13-20.

猜你喜歡
數據治理挑戰大數據
大數據治理模型與治理成熟度評估研究
大數據時代城市治理:數據異化與數據治理
第52Q 邁向新挑戰
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合