?

數字人文視域下文書檔案的開發與利用研究

2024-04-26 01:35國家廣播電視總局五二三臺張倩
辦公室業務 2024年5期
關鍵詞:文書人文檔案管理

文/國家廣播電視總局五二三臺 張倩

數字人文是人文學科和計算機科學相結合的產物,能夠彌補傳統人文學科研究中存在的缺陷和不足,同時也為社會大眾提供了了解歷史文化、提高文化素養、增強文化自信的途徑。數字人文對傳統人文學科研究模式產生了深遠影響,數字人文研究的本質是“以數據為核心”,以數據為驅動,強調研究成果的可靠性和實用性。文書檔案是歷史、文化與社會記憶的載體,數字人文視域下文書檔案的開發與利用應以數據驅動為核心理念,強化數據安全,優化利用流程,整合開發資源,形成以大數據為基礎的文書檔案數字人文服務模式,更好地服務社會和人類發展。

一、數字人文研究的本質:“以數據為核心”

數字人文是以數字技術為工具,以數據為核心的一種人文學科研究方法,強調通過數字技術和數據分析的方式來獲取、處理和理解人文學科中的文本、圖像、聲音等形式。隨著數字技術與人文學科的深度融合,數字人文研究呈現出“以數據為核心”“以數據為驅動”等特點。數字人文以計算機技術和人工智能為基礎,主要使用自然語言處理技術、計算機視覺技術、知識圖譜技術以及機器學習算法等方法,對人類的認知過程進行模擬。數字人文研究強調以數據為核心,將一切可量化、可分析的信息進行數字化處理,通過對大量文本、圖像等信息的整合,從不同維度深入挖掘文本背后隱藏的歷史文化信息,進而探究社會和文化發展規律,促進社會的發展。數字人文研究認為傳統人文學科研究中存在大量的“黑箱”問題,導致研究者無法準確判斷研究成果是否符合實際需求,此研究可有效解決其中存在的問題。

二、數字人文視域下文書檔案的開發方向

(一)運用文本挖掘技術挖掘文書檔案的潛在價值。文本挖掘是對文本內容進行自動分析并發現其中蘊含的信息的過程。通過對文本內容的挖掘,可以對用戶需求、知識圖譜等相關信息進行挖掘,進而生成用戶需要的信息和知識,同時也能從文本挖掘中發現問題和規律,從而為文書檔案的開發與利用提供新的思路。在文書檔案開發與利用的過程中,首先要明確開發與利用目的。目前,文獻檔案的開發與利用方向主要是:滿足用戶閱讀需求,為專業人員提供研究支持。對于前者來說,要進一步挖掘現有文獻檔案的潛在價值,通過深度加工并整合現有的文獻資源,充分發揮其在歷史、文化和社會記憶方面的作用;對于后者來說,要進一步挖掘文書檔案的潛在價值,為人文研究提供新思路。在文書檔案的開發與利用過程中,要明確當前研究存在的問題并及時解決,將已有的數據資源進行整合,充分發揮其在歷史、文化和社會記憶方面的作用,為不同環境下歷史、地理、科學等學科的發展提供信息與數據支持。

要建立基于大數據和文本挖掘技術的文書檔案開發與利用系統,需根據研究目標制定科學的系統設計方案和框架;明確系統功能模塊和數據流程;運用大數據技術和文本挖掘技術進行數據分析;建立科學的指標體系、搭建文書檔案管理平臺等,對系統的運行效果進行評估。在文書檔案開發與利用過程中,充分運用大數據技術、人工智能等現代信息技術進行輔助。例如:利用自然語言處理技術實現對文書檔案的自動標引和自動生成摘要;運用機器學習技術對文書檔案進行分類;利用文本挖掘技術對文書檔案進行語義分析、構建知識圖譜;利用機器翻譯技術自動評估相關文獻的翻譯結果。

(二)運用數據管理技術充分發揮文書檔案數據的作用。在數字人文研究中,數據是開展研究的基礎和保障。隨著數據量的增長,傳統的基于人工整理、統計的檔案管理模式越來越難以適應目前檔案管理的需要,文書檔案數字化、信息化、網絡化管理模式在實現檔案數字化過程中得到越來越廣泛的使用,數據管理技術可將文書檔案從實體檔案轉化為電子文檔,也可將紙質檔案轉化為電子檔案,為檔案管理人員對文書檔案進行全流程管理提供便利。在保存方面,未來可結合數字技術與傳統技術形成不同類型文書檔案的長期保存模式。如建國初期的民間契約、公文、電報等較為久遠的檔案、文獻等資料,根據其性質與價值特征進行分類保存,以滿足需求;在數字化進程方面,可對各類文書檔案進行掃描、識別、去重、分類、標注等處理;在開發利用方面,可加強對文書檔案數據的開放共享和深度挖掘利用。但數字人文研究同樣面臨著數據共享與價值挖掘之間的矛盾,一方面,數字人文研究需要海量數據的支撐;另一方面,數字人文研究成果的價值在于對數據的應用和價值的挖掘。因此,在開發利用過程中應注重數據質量和數據安全問題。通過對各種類型文書檔案信息進行分類管理和整理加工,建立完善的文書檔案資源體系,搭建文書檔案管理平臺。

(三)結合GIS技術將人文歷史地理脈絡與現代科技相結合。利用地理信息系統技術可以滿足歷史檔案資料、人文歷史發展、地理環境保護等學科的發展,為文書檔案管理工作提供數據支撐,尤其是在不同區域下文書檔案的整理與匯總,以及各種與地理信息數據相關的文書檔案整理方面,人文歷史地理等學科與現代科技的結合可為信息使用者、閱讀者提供更加全面、有效的數據。因此,文書檔案開發可從地理空間數據管理、分析和制圖等方面展開,發揮自身優勢,將數字人文的研究成果與GIS技術結合,建立基于GIS的數字人文平臺。這一平臺可以從文書檔案中獲取海量信息,包括文書檔案信息、歷史地圖、地理空間數據等,并利用GIS技術進行數據分析,建立基于地理空間數據的數字人文模型,實現文書檔案中地理信息數據的有效整合。對于有不同使用需求的人員、部門、單位、企業以及其他使用者來說,有利于文書檔案在多部門之間實現共享和利用,提升對文書檔案資源的開發利用效率。與此同時,將數字人文與GIS技術結合的另一大優勢是可以進行空間分析與空間制圖。通過空間分析和空間制圖將相關文書檔案信息進行有效整合與管理,實現對地理空間數據的可視化呈現,為用戶提供多種空間分析功能和可視化展示手段。例如,可將電子地圖上的文字信息、圖像信息等進行直接顯示或轉換,對數據進行有效管理。

(四)結合VR技術提升文書檔案的展示效果。VR技術是指利用計算機仿真技術,通過創建虛擬環境,使用戶身臨其境地感受真實場景中的視覺、聽覺、觸覺等信息,并在此基礎上產生深度感知和思維活動。VR技術被廣泛應用于博物館、圖書館、檔案館等人文社會科學機構,展示形式多種多樣。目前,我國博物館在數字人文平臺展示的館內情況與展品通過計算機圖形圖像處理技術,以三維數據形式對博物館檔案進行數字化處理,以實體博物館檔案為基礎,制作一套完整的博物館檔案的數字化產品目錄,將紙質檔案、圖片檔案、視頻檔案轉化為數字產品。通過該目錄,用戶可以清晰地了解博物館文書檔案的數字化產品內容及其使用方式等信息。在展示效果上,用戶可以通過360度視角感受博物館檔案的真實面貌。當前我國各地方博物館、中國科技博物館、國家博物館均在發展此項技術,且得到了一定的應用。除了博物館文書檔案外,利用VR技術還可以將其他類型的檔案進行展示,如司法文書、訴訟檔案、司法卷宗等。

三、數字人文視野下文書檔案開發利用的策略

(一) 搭建文書檔案數字人文研究平臺,助推文書檔案的轉型升級。在數字人文視野下,文書檔案的開發利用工作應該圍繞數字人文理念,搭建具有特色的數字人文研究平臺。平臺可以在傳統的檔案管理基礎上,通過大數據技術分析整理各類歷史檔案數據資源,從而實現對歷史文化資源的開發和利用。此外,文書檔案開發單位還可以將數字人文理念應用于文書檔案開發利用工作,構建數字人文研究平臺。數字人文檔案在技術層面可利用互聯網、移動互聯網等技術,實現對歷史信息的有效采集、存儲和檢索,并進行數字化處理;對于數字人文檔案內容,可利用數字技術將大量分散于各領域的文獻資料進行整合,形成統一的研究框架。數字人文作為近幾年新興發展起來的研究領域,涉及人文學科多個領域的交叉學科,注重將傳統人文研究方式與現代科學技術相結合,實現對歷史文化的深度解讀。

(二)建立數字倉儲,實現文書檔案資源的整合與長期保存。文書檔案作為我國歷史文化的重要組成部分,是國家歷史文化的重要載體。隨著社會的發展,文書檔案數量也在不斷增加。為了避免文書檔案資源分散資源利用率低等問題,需要將文書檔案資源進行整合并長期保存,從而更好地滿足人們對文書檔案信息資源的需求。數字倉儲作為數字人文技術的重要組成部分,能夠對文書檔案進行統一管理和長期保存。利用數字倉儲技術能夠將分散在不同領域、不同單位、民間遺落的文書檔案資源進行整合并長期保存。在整合時,可以先對文書檔案資源的類別、時間等要素進行統計分析,然后根據需要制定統一的管理標準,最后統一存儲和長期保存。

(三)推動項目委托,進行文書檔案的數字人文開發。目前,我國高校和科研機構中都設有數字人文研究中心,且已將數字人文研究中心委托給國家圖書館、中國社會科學院圖書館等單位進行開發利用。以國家圖書館為例,該機構每年都會組織相關領域的專家學者申報數字人文項目,國家圖書館還會組織相關領域的專家學者進行評審。從這些申報項目可以看出,這些單位都在積極探索文書檔案的開發利用與數字人文技術結合工作,為高校教育、社會信息的獲取提供路徑。數字人文項目一般都是由特定機構發起并完成,數字人文研究中心、圖書館、檔案館等都是主要參與者,由于我國現有的數字人文研究大多是以項目委托形式展開的,也就是將相關研究項目委托給科研機構,由科研機構根據用戶需求和社會需求開展具體研究,從而推動數字人文研究的發展。對于我國文書檔案而言,由于其本身具有較強的穩定性和保密性,因此在數字人文視野下開展文書檔案的開發利用工作時,可以采用項目委托的方式促進人文檔案管理技術的升級。除此之外,對于一些大型文獻資源豐富的機構,可以直接將相關文獻資源以項目委托的形式委托給數字人文研究中心進行開發,豐富和優化人文檔案開發模式與管理技術。

(四)加強教育培訓,提升文書檔案工作人員的專業素養。數字人文視野下,文書檔案的開發利用工作需要工作人員具有專業的知識儲備和實踐經驗,數字人文在很大程度上依賴于工作人員對數字人文的理解和掌握程度,因此,加強對文書檔案工作人員的教育培訓十分必要。在數字人文視野下,文書檔案開發工作人員要具備扎實的理論知識,熟悉數字人文技術,了解文書檔案管理中涉及的相關知識和概念,掌握文書檔案管理中涉及的技術標準。具體而言,可以從以下幾方面入手:第一,加強對工作人員專業素養的培訓,提升工作人員的專業知識水平,可以通過組織系統學習數字人文的相關知識和理論,也可以邀請數字人文領域的專家為工作人員授課或組織開展專題培訓,幫助工作人員提升數字人文知識水平。第二,建立完善的教育培訓體系??梢酝ㄟ^設置數字人文課程、邀請專家授課等方式提高工作人員對數字人文理論和方法的掌握程度;也可以通過舉辦培訓班、研討會等形式對文書檔案管理人員進行有針對性的教育培訓。第三,注重對工作人員實踐能力的培養。文書檔案的開發利用工作涉及檔案管理、信息資源整合、數字人文技術等多方面,需要文書檔案工作人員具有一定的實踐經驗和創新能力。

四、結語

綜上所述,數字人文技術的發展為文書檔案資源的開發與利用帶來了新機遇,數字人文與檔案管理的融合為文書檔案資源的開發提供了新思路?;诖?,本文從數字人文視域下文書檔案的開發與利用出發,分析數字人文視域下文書檔案開發的方向,提出了相應的發展策略,以期為之后文書檔案的開發提供思路引導,滿足數字檔案管理工作的升級及優化、工作人員專業能力提升、數字檔案開發技術的升級與探索等工作需要,為我國科學技術和文化發展提供良好的技術與平臺支撐。

猜你喜歡
文書人文檔案管理
人文
太行山文書精品選(17)
監獄執法文書規范探討
黑水城出土《宋西北邊境軍政文書》中“砲”類文書再討論
檔案管理中的電子檔案管理
檔案管理與企業內部控制關系的思考
人文紹興
人文社科
讓人文光輝照耀未來
健康檔案管理的“云”前景
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合