?

公共圖書館參與公共數據開放的現狀調查與分析
——基于19 個省級政府數據開放平臺的研究

2023-09-10 14:39
山東圖書館學刊 2023年4期
關鍵詞:公共數據數據格式開放平臺

胥 迅 姚 敏

(重慶圖書館,重慶 400037)

近年來,隨著數字政府的建設和數據經濟的發展,我國從中央到地方政府都在積極推進公共數據資源開放共享建設。 2015 年,國務院印發了《促進大數據發展行動綱要》,提出要大力推動政府部門數據共享,促進公共數據資源開放提升治理能力,在2018 年底前建成國家政府數據統一開放平臺。2022 年8 月,中辦、國辦印發的《“十四五”文化發展規劃》,要求“加強規劃引導和政策指導,打通各層級公共文化數字平臺,打造公共文化數字資源庫群,建設國家文化大數據體系”“以國家文化大數據體系建設為抓手,堅持統一設計、長期規劃、分步實施,統籌文化資源存量和增量的數字化,以物理分布、邏輯關聯、快速鏈接、高效搜索、全面共享、重點集成為目標聚集文化數字資源”[1]。 作為公共文化體系的重要組成,公共圖書館的數據開放是貫徹落實我國數據開放共享戰略的重要環節[2]。

目前學術界對公共圖書館數據開放在發展途徑、經驗借鑒及角色定位等方面都進行了研究,如劉龍[3]、黃如花[4]等提出我國圖書館參與政府數據開放的發展途徑;李斯[5]等從法律、技術兩個方面對大英圖書館資源開發,數據開放和數據利用的實踐經驗進行研究,對我國圖書館數據開放實踐提供參考;陶成煦[6]在闡述圖書館參與政府數據開放的驅動力基礎上,通過調查分析,明確圖書館在政府數據開放中的角色定位。 目前,我國的數據開放工作已經開始實施,與美國、英國等國家從中央政府到地方政府的發展路徑不同,我國的公共數據開放主要實踐于地方政府。 本文針對公共圖書館參與公共數據開放的職責和義務,通過梳理各省級公共圖書館在政府數據開放系統中的參與程度,分析公共圖書館在政府數據開放共享建設中存在的問題及主要原因,并提出改善措施,為促進公共圖書館的數據開放及利用提供參考。

1 公共圖書館參與公共數據開放的內驅性

1.1 數據開放是現代公共文化服務體系建設的重要目標

為順應現代信息時代的發展,黨的十八屆三中全會提出了構建現代公共文化服務體系的戰略構想,2015 年中辦、國辦發布的《關于加快構建現代公共文化服務體系的意見》中指出要“加強公共文化大數據采集、存儲和分析處理”[7],突出了公共文化數據在現代公共文化服務體系建設的重要地位。 同年,國務院發布《促進大數據行動綱要》,正式將政府數據開放納入國家發展戰略中來,并在“未來遠景規劃目標”中提到要“面向公共數據資源建立科學合理的法規制度與政策體系”[8]。 2022 年10 月,黨的二十大報告中提出要“實施國家文化數字化戰略,健全現代公共文化服務體系,創新實施文化惠民工程”[9],充分說明了數據開放對于公共文化服務體系建設具有長遠發展性。

據筆者不完全統計,黨的十八大以來,黨中央多次對數據開放及國家文化大數據體系建設工作作出部署,多個部委參與推動落實。 截至2022 年底,國務院及各部委先后頒布多項支持數據開放的政策文件(表1),推進數據開放規劃。 公共文化數據作為數據開放體系建設的重要組成,其政策體系更加完備,發展路線更加清晰。

表1 公共服務機構參與政府數據開放的政策文件

1.2 參與數據開放是公共圖書館作為公共機構的重要職責

2015 年國務院發布的《促進大數據發展行動綱要》正式將政府數據開放納入國家發展戰略中來,該綱要指出要“穩步推動公共數據資源開放”“推動建立政府部門和事業單位等公共機構數據資源清單”“制定公共機構數據開放計劃,落實數據開放和維護責任,推進公共機構數據資源統一匯聚和集中向社會開放”[10]。 2021 年我國“十四五”規劃全文中提出要“擴大基礎公共信息數據安全有序開放,探索將公共數據服務納入公共服務體系”[11]。

公共圖書館作為“事業單位”“公共機構”、公共數據重要的存儲者和提供者,在政府數據開放背景下發揮其應有作用,推進我國形成科學的政府數據開放政策體系,具有不可推卸的職責和義務。

1.3 參與數據開放是公共圖書館未來的發展趨勢

2016 年,國際圖聯建議在國家和社區層面提高圖書館工作人員的可持續發展意識,加強圖書館在社會發展中的作用,讓圖書館參與國家和區域層面的數據推廣,并確保公眾能夠通過圖書館服務獲取有關可持續發展的最新信息。 2021 年12 月,該組織又發布了《開放圖書館數據聲明》,提出數據開放和可重復使用有助于讓更廣泛的參與者參與有關圖書館的討論,呼吁政府直接負責有關圖書館及其使用的數據的收集和公開發布,或通過支持他人來實現此事,并確保在需要時為此類數據收集提供資金支持[12]。

由此可見,圖書館應該利用數據開放的機會,提供有價值的數據和信息,提高在社會及公眾中的影響力,公眾也可從公共圖書館中獲得更專業更深層次的信息,從而更加鞏固公共圖書館與社會服務群體的聯系,更好地推動公共圖書館向智慧圖書館轉型。

2 公共圖書館參與政府數據開放的基本現狀

2.1 調查方式

鑒于目前全國公共數據開放門戶網站的建設主體主要為各級地方政府,截至2022 年11 月底,筆者采用網絡調查法,訪問我國已上線的19 個省級政府數據開放平臺,以“圖書館”為檢索關鍵詞進行了網絡調查,并對檢索結果圍繞數據開放主體、數據發布數量、數據開放內容、數據開放類型以及數據利用情況這5 個方面的內容進行了收集(表2),為進一步分析圖書館數據開放現狀提供依據。

表2 19 個省級政府數據開放平臺有關“圖書館”數據開放情況

2.2 基本現狀

2.2.1 數據開放主體

數據開放主體即開放數據的發布單位,一般為各級行政機關、履行公共管理和服務職能的事業單位。 《山東省公共數據開放辦法》里進一步提出“具有公共服務職能的企業事業單位,人民團體等在依法履行公共管理職責、提供公共服務過程中,收集和產生的各類數據均屬于公共數據,應納入公共數據開放辦法管理”[13]。 從而擴大了數據開放的主體規模,拓展了公共數據的適用范圍,對保障圖書館開放數據的數量與質量具有重要意義。

開放主體是考量數據發布權威性的重要指標。調查發現,各省級政府數據開放平臺圖書館數據發布單位比較單一,公共圖書館特別是省級公共圖書館作為數據開放主體的參與度不足。 例如,筆者對“浙江數據開放網”和“貴州省政府數據開放平臺”中共176 個包含圖書館內容的數據集進行分析,它們的發布單位最主要是各市區縣文化旅游局,其次是省文化和旅游廳、各級統計局、大數據發展管理局和自然資源規劃局等相關行政部門,公共圖書館只有2 家,分別是溫州市圖書館和遵義市圖書館。

2.2.2 數據發布數量

數據發布數量可以衡量數據開放的規模,主要通過調查數據集數量、數據量和API 接口數來表現。 如表2 所示,在19 個政府數據開放平臺中共有開放數據集721 個,各省級政府數據開放平臺上提供的圖書館數據集數量差異較大。 其中,山東省數量最多,為257 個,而海南省、遼寧省和陜西省的數量為0。 近50%的省級平臺的圖書館開放數據集的數量在十個及以下,這些平臺還應加大數據開放的力度。

2.2.3 數據開放內容

數據開放內容是由數據提供者根據數據目錄的編制規范,編制包括數據目錄、開放清單、開放屬性、開放條件等內容,并進行動態調整,通過統一的數據開放平臺向社會公開。 此次調查中,圖書館開放數據的內容基本以圖書館名稱、地址、網址等基本服務信息為主,其次是館藏量、流通人次、借閱人次等統計數據和書名、ISBN、出版社等書目數據,極少數開放了館藏數據和借閱數據等內部數據,例如遵義市圖書館開放了文獻逾期信息。 開放公眾需求度高的數據,是圖書館數據開放工作的開放目標。 此外有個別平臺上傳年度報告等信息,嚴格意義上講,這些不能算作開放數據。

2.2.4 數據開放類型

數據開放類型是數據開放標準化的體現,包括數據集文件、API 接口和APP 應用幾方面,代表數據的可讀性和可獲得性,對開放類型的調查主要對數據集下載和API 接口兩種方式進行分類統計。調查發現,74%的圖書館數據都是數據集形式,16個平臺里有8 個只提供了數據集,未提供API 接口。

不同的數據格式可以適用于不同的應用場景,比如,CSV 格式適合用于數據分析,JSON 格式適合用于Web 開發,XML 格式適合用于數據交換。 為了促進數據的共享和使用,數據開放平臺應該提供更多類型的數據格式。 調查發現,上海市、浙江省、山東省提供了XLS、CSV、XML、RDF、JSON 等比較全面的圖書館數據格式,更便于數據分析與開發利用工作;貴州省提供了XLS、JSON 等部分數據格式;天津市、寧夏回族自治區僅提供了XLS 格式,個別省份還存在DOCX、ZIP 等其他格式的文件,如北京市提供的數據集里有“2020 年北京市密云區圖書館決算”等2 個文件是docx 格式,“順義區圖書館”等5個文件是zip 格式,“數字圖書館和文化館建設信息”文件是rar 格式;天津市提供的“西青區圖書館信息”文件是doc 格式;此外個別平臺提供的數據無法下載,如重慶市提供的數據均沒有下載選項。

2.2.5 數據利用情況

數據開放的目的是促進數據有效利用,數據利用情況是評估數據開放平臺對公眾產生的實際影響的重要途徑。 通過對比分析數據開放的預期目標與實際效果,還可確定數據開放平臺需要改進的方面。對利用情況的調查主要從圖書館數據瀏覽量、數據集下載量以及API 接口調用量三方面進行。 如表2所示,可以看出上海市、廣東省、山東省和浙江省提供的圖書館數據數量多,下載量高。 這些數據反映了公共圖書館數據的利用價值,值得其他省份學習借鑒。

2.3 主要問題

2.3.1 頂層設計賦能但標準規范缺失

調查發現,我國政府在大數據時代高度重視公共數據開放的頂層設計,并逐步將其提升為“國家戰略”。 如表1 所示,黨中央、國務院、各部委及各級地方政府都相繼出臺數據開放相關政策意見,為加快公共數據開放步伐、提高開放數據質量提供了堅實的政策保障。 但由于不同地區、不同部門參照的技術標準和管理規范存在差異,在推進數據開放的政策文件中,公共圖書館數據缺乏統一有效的標準化支撐,同時由于圖書館界對標準規范的實施推廣和應用績效評估等工作不夠重視,從而降低了數據的利用價值,使公共圖書館不僅未能發揮自身優勢,反而影響了公眾對圖書館數據的查詢與利用。

2.3.2 開放意識不足且數據質量參差

從數據開發角度,對數據收集、處理、篩選和開發需要投入大量人力財力,但公共圖書館缺乏數據開發專項經費和類似“全國文化信息資源共享工程”的數據開發部門,數據開發的規范化水平有待提升,在標準規范、數據開發到數據開放三個層面尚未形成有機整體。

從數據質量角度,各政府數據開放平臺開放的圖書館數據質量差距明顯,很多存在標題不規范、數據格式不規范、數據字段少、數據量不足等問題,影響了數據的統籌管理和高效共享。 ①標題不規范。標題要素不全、與正文內容有偏差就不能反映數據集的主要內容,從而影響檢索效率。 表現為“種類繁多、名不副實、格式不一”,如北京市、貴州省等省市的很多數據集直接使用“圖書館”“公共圖書館”“圖書館信息”等名稱文字作為標題,沒有揭示具體的機構名稱、數據內容等關鍵信息。 ②數據格式不規范。 數據開放平臺應發布標準格式的數據文件,如XLS、CSV、XML、RDF、JSON 等,以提高開放數據資源的可用性和互操作性,一般不建議發布壓縮包、DOC 文件等其他格式的數據文件。 例如,北京市提供的數據集里有DOCX、ZIP 及RAR 格式;天津市提供的數據集有DOC 格式,這些文件格式不屬于可機讀格式,不利于數據分析與處理,增加了數據開發利用的難度。 此外部分省級數據開放平臺的數據格式較為單一,貴州省僅提供了XLS、JSON 數據格式,天津市和寧夏回族自治區僅提供了XLS 數據格式,不便于各類分析處理軟件進行數據查找讀取和選擇,從而影響利用者進行挖掘和研究。 ③數據字段少。例如貴州省“公共圖書館”這一數據集,僅有“名稱”“數量”兩個屬性字段;廣東省“2021 年順德圖書館集群成員館”僅有“名稱”“地址”兩個屬性字段。 這些數據集的數據字段不夠完整,沒有充分發揮數據價值。 此外,貴州省“公共圖書館”這一數據集中數據摘要僅為“公共圖書館”,沒有揭示數據關鍵信息,不便于快速獲取和檢索,造成數據價值密度低。④數據量少。 如天津市開放的“南開區公共圖書館信息”這一數據集僅有一條記錄;貴州省提供的“花溪區圖書館日志查詢—采編分系統”僅6 條數據,這些數據集的數據量較少,影響數據分析的完整性和準確性。

3 公共圖書館數據開放發展的建議

3.1 健全數據開放相關標準與制度

鑒于我國數據開放的起步晚于歐美國家,為了更快地推動我國數據開放的發展,可借鑒其它國家已有經驗,并在此基礎上制定適合中國國情的數據開放標準,比如設置推進數據開放的專門機構,完善數據開放的頂層設計,針對各級數據開放平臺建立統一的開放數據標準,準確定義數據的概念并明確數據質量的判斷標準,同時對開放數據質量進行嚴格的監管,對分級分類、開放數據內容及數據安全等方面進行規定,避免出現重復數據和質量較低的數據。

目前國家圖書館相繼出臺了《電子圖書元數據規范》《圖書館數字資源長期保存元數據規范》等一系列有關數據開放的行業標準規范,建議各數據開放平臺參照相關規范統一元數據、數據集、數據格式和數據接口等內容,可有利于平臺的數據格式、質量趨于一致,推進數據開放共享,提高數據利用率。

3.2 數據開放納入考核評估,推進各方共同參與

圖書館評估定級工作是對各級公共圖書館執行政策法規和標準、開展服務水平與效果的重要監督機制,能夠推動公共圖書館事業發展理念創新,帶動公共圖書館事業體系不斷完善。 調查發現,在2022年度的第七次全國公共圖書館評估定級考核中,尚無考核指標涉及圖書館數據開放。 因此,業界有必要制定圖書館數據開放的考核評估標準,推進評估常態化建設,強化政府監管的主導地位,加強圖書館數據開放業務規范化,在行政管理上形成數據開放落實的相應壓力與動力,全面加強圖書館信息化,實現圖書館信息化提升改造,充分發揮評估定級“以評促建、以評促管、以評促用”的作用[14]。

3.3 促進數據互聯互通,提升數據使用效能

圖書館數據開放應該在對技術標準、公共數據、服務數據集、應用資源、服務系統和程序代碼等內容的整合、互聯、協同基礎上,加快推進數據互聯互通,實現數據開放一體化,提高資源共享水平,滿足讀者個性化服務需求和支持圖書館服務創新,實現圖書館數據的統一和全方位開放。 例如截至2020 年底我國縣級以上公共圖書館的電子圖書館藏書總量近9.61 億冊,如果能讓這些數據資源實現開放共享,就能發揮更大的數據應用價值。

鑒于目前我國數據開放一體化程度仍偏低,未能充分滿足社會對跨域數據融合利用的需求,建議各地公共圖書館主管部門聯手推出有利于促進數據開放區域互聯互通的政策文件,整合各區域平臺的數據集主題、數據名稱等方面內容,實現相互鏈接,促進跨地區的數據融合利用,提升數據使用效能。

猜你喜歡
公共數據數據格式開放平臺
公共數據使用的路徑探尋
——訪工信部信息通信經濟專家委員會委員、中國科協決策咨詢首席專家王春暉
制定中國公共數據開發利用法規的建議
論公共數據管控權的規范建構
基于在線開放平臺的混合式課堂教學模式構建與實踐
公共數據開放許可的規范建構
基于AliGenie語音開放平臺的傳統家居智聯網解決方案
在智能交通系統中PLC數據格式轉換方法的研究
搭建開放平臺 收獲真情實感——談《品德與生活》教學中開放式教學的實施
云計算開放平臺的知識產權問題研究
論子函數在C語言數據格式輸出中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合