?

安全可信數據空間的工程化路徑研究

2023-10-30 11:29陸志鵬
信息通信技術 2023年4期
關鍵詞:數據安全元件主體

陸志鵬

中國電子信息產業集團有限公司 深圳 518057

引言

近年來,世界主要國家都陸續開展了關于數據空間的探索、布局和實踐,一定程度上促進了數據共享流通、賦能價值創造[1]。但受制于制度框架、技術手段以及互信機制,數據空間建設并未取得預期成效。本文深入剖析當前數據空間建設的主要模式,總結不同模式共同依賴的核心要素,提出一種制度與技術緊密融合的新型安全可信數據空間建設路徑,體系性破解多主體數據融合共享與數據安全之間的矛盾,以期為行業數據安全融合共享提供參考范式。

1 國內外數據空間發展現狀

由于不同國家和地區數字化能力基礎、產業數據應用訴求及數據管理理念等存在顯著差異,其共同數據空間的建設模式也有較大不同,主要包括政府主導、政府引導以及市場主導三種模式。不同模式的底層運行邏輯趨同,均具備制度規則、標準規范、工具產品三類核心要素,共同構成數據空間內部主體開展數據交換的基礎。

1.1 三種主要模式

1.1.1 政府主導模式

在政府主導模式下,政府負責數據空間的頂層設計,并承擔規則制定、基礎設施建設等職能,市場主體經審核滿足相關要求后,擔任相應角色并按需參與數據交換過程。典型實踐為歐盟公共數據空間[2]與美國國家信息交換模型(NIEM)[3]。歐盟2020年發布《歐盟數據戰略》[4],部署在工業、科學研究、綠色協議等影響公共利益、具有戰略價值的領域啟動建設公共數據空間,聯盟層面開展戰略規劃及監督指導,行業層面負責制定數據空間標準和要求以及構建技術支撐平臺,市場主體根據相關要求參與數據空間運行。美國NIEM體系旨在解決不同行業領域之間以及同一領域內各級部門之間的信息共享問題,由國土安全部和司法部發起制定信息交換實施框架和標準,聯邦層面負責NIEM發展規劃、政策制定、資金保障及日常運營,行業領域負責本領域模型構件的維護,相關主體遵循NIEM體系所規定的三層模型構件及實施規則驅動具體業務開展。

1.1.2 政府引導、市場主建模式

在政府引導、市場主建模式下,政府對數據空間進行統籌管理并提供資金劃撥或籌措支持,由行業協會、聯盟或龍頭企業牽頭開展總體設計,審核、吸納市場主體形成生態圈,分別擔任相應角色并按需參與數據交換過程。典型實踐為德國工業數據空間[5]與日本互聯產業開放框架(CIOF)[6]。德國工業數據空間由弗勞恩霍夫協會牽頭,連接130多家成員公司共同推進,德國政府部門按照研究經費總額的50%進行投入配比,以支撐其進行工業數據空間及相關非營利基礎研究。日本互聯產業開放框架旨在促進不同企業之間通過統一的數據互換進行設備聯機及價值聯動,該項目由日本經濟貿易和工業部資助,發那科、三菱、德馬吉森精機和日立參與研究,當前正在日本100強企業中推進。

1.1.3 市場主導模式

在市場主導模式下,行業內部采取自組織的形式約定形成數據交換方式和相關要求,逐步吸納行業主體參與,按既定規則參與數據交換過程。典型實踐為我國可信工業數據空間。我國工業互聯網產業聯盟、信通院牽頭,聯合16家工業企業提出建設可信工業數據空間,構建數據空間數據流通模式,形成基礎共性、關鍵技術、行業應用三類標準體系,明確參與方類型及功能職責,面向廣大市場主體提供數據開放共享和可信流通的新型基礎設施和技術解決方案[7]。

上述三種模式并無優劣之分,而是需要結合不同行業的制度基礎、技術條件與發展訴求靈活選擇最優。

1.2 數據空間的核心要素

剖析當前全球數據空間先進建設經驗,盡管不同國家和地區在數據空間發展模式、體系結構、建設路線、管理機構等方面各有差異,但其底層運行邏輯趨同,均具備制度規則、標準規范、工具產品三類核心要素,如圖1所示。

圖1 數據空間三大核心要素

一是制定制度規則,明確數據空間運行架構。制度規則從治理側厘清數據空間的總體建設、管理和實施架構,包括明確組織機構、統籌戰略規劃、開展總體設計、明晰建設原則、確定技術路線、制定參考架構等相關工作。二是構建標準規范,統一數據空間描述維度。標準規范從技術側統一數據空間的話語體系、屬性維度、描述方式,包括確定技術路線、明確設計規則、梳理元素字典、制定標準格式等工作,為數據空間內不同場景應用提供共同的對話規則。三是提供工具產品,提升市場主體應用能力。工具產品從實操側為數據空間主體賦能,提供封裝、便捷、豐富的即時應用工具庫,包含基礎設施、運行平臺、業務組件、各類輔助工具包等,降低市場主體參與數據流通活動的門檻,提升效率和互換性[8-9]。

2 我國數據空間建設存在問題

縱觀國內外數據空間探索實踐,以及各參與主體在實際開展數據共享流通過程中遇到的現實難題,當前數據空間在安全、信任和規則標準三個方面的問題依然沒有得到有效解決。

2.1 安全風險突出

1)基礎設施安全難以保障。當前,數據空間的建設主要側重在組織、機制、標準等層面,并提供了軟件技術工具,但在基礎設施層面仍以利舊為主,導致數據流通共享仍然依靠原有設施以及開源技術,安全風險隱患較大。與此同時,我國數據安全的底層技術與關鍵產品國產化率低,核心環節“卡脖子”現象突出,迫切需要自主可控的新型數據基礎設施保障數據存儲、治理與流通的安全可控。

2)過程安全日益嚴峻。數據流通共享流程復雜、環節多,潛在的泄露、篡改、非法買賣、濫用等風險種類多,安全脆弱點分布廣、防范難度大。傳統外掛式、被動式和封閉式的安全技術體系,越來越難以滿足多主體、多環節和開放性的高效數據流通共享和開發利用的需求,亟待建立內生性、主動性的數據安全防御體系。

3)制度安全權責不清。細分行業重點數據識別、數據安全評估、數據分類分級等數據安全相關制度建設進度不一,與國家數據安全立法銜接尚不充分。數據治理主體安全權責不清,機構內部數據安全管理制度尚不完善,數據在不同主體之間流動、共享和交換過程中的權責邊界模糊,責任判定與追溯困難。

2.2 信任基礎薄弱

1)雙邊信任難以建立。對于數據供方而言,由于制度、技術等方面的保障仍然不完備,共享數據可能會導致數據供方失去對數據的掌控力,或減弱其商業競爭優勢,還額外需要承擔因數據非法使用帶來的連帶責任。對于數據需方而言,在“阿羅信息悖論”之下,數據需方缺少事前核驗數據質量與價值的手段與能力,數據市場極易演化為“檸檬市場”。建立供需雙方雙邊信任成本較高,難以滿足生態開放、多對多流通的數據空間建設要求。

2)第三方信任仍待加強。由于公共部門多數僅提供開放數據,對數據空間的開發支持力度不足,導致缺少有公信力的數據空間開發及運營主體,“重門戶建設、輕空間運營”“重技術推廣、輕數據治理”的現象突出,數據空間缺乏統一的第三方信任平臺。

2.3 規則標準散亂

1)治理體系不兼容。不同區域、行業之間存在較大的治理能力落差。公安、醫療、市場監管等部委,以及信息化領先的省份已經建立起較為完善的數據共享管理制度[10],信息化欠發達的地區和大多數行業尚未形成完整的數據治理體系,數據共享流通仍然采取“一事一議”方式,這導致不同區域、不同行業的主體之間共享數據面臨較高的合規成本。

2)標準規范不一致。當前,地方、行業和國家標準之間兼容性和一致性仍然有待提升,越到細分行業、越到下級行政單位,所需遵從的技術標準龐雜、兼容困難的問題越突出。這導致跨層級、跨區域、跨行業間的數據格式不統一、元數據標準不一致,數據互操作困難,極大推高了數據共享的技術成本。

3)數據形態不穩定。數據在開發利用過程中,不僅會因不同的采集設備、數據處理軟件等呈現異構的技術格式,還會在流通使用過程中產生復雜多元的形態變化,數據的多元異構性導致在數據共享流通過程中極不穩定,承載的數據要素價值和勞動價值邊界模糊,增加了質量評價、價值評估、安全審查、過程追溯等的難度。

3 安全可信數據空間的工程化路徑

安全可信數據空間定位于解決數據流通過程中的安全、信任和規則標準問題,以數據金庫[11]和數據元件[12]為基礎、以可信計算和合規措施為支撐,融合原有數據基礎設施和數據資源,通過數據空間操作系統和安全治理機制實現多主體間數據的安全合規、共享流通。

3.1 兩大基礎

一是定義數據元件,以“中間態”形式實現原始數據和數據應用解耦,破解安全可信數據空間的數據流通系列難題。數據元件是通過對數據脫敏處理后,根據需要由若干相關字段形成的數據集或由數據的關聯字段通過建模形成的數據特征。在確權方面,將數據相關權利在數據資源、數據元件、數據產品的三個階段分別進行確權,降低確權復雜度;在流通方面,以數據元件作為數據交易標的物,實現數據要素的安全流通與高效配置;在定價方面,數據元件使數據價值評估有了計量單元,在三個階段可分別采用成本法、收益法和市場法進行定價;在安全方面,數據元件去除了涉及國家安全、商業秘密和個人隱私的信息,顯著降低信息泄露風險。

數據元件和數據金庫的功能示意如圖2所示。

圖2 數據元件和數據金庫功能示意圖

3.2 總體架構

以“安全合規、共享流通、智能敏捷”為目標,構建以“制度+機制+技術”三點互為支撐的安全可信數據空間總體架構,連接跨行業、跨層級主體,提供統一安全可信數據空間,支撐不同行業的業務應用開發需求。安全可信數據空間的總體架構如圖3所示。

圖3 安全可信數據空間總體架構

在制度層面,為確保數據空間有效運轉,圍繞管理機制、組織架構、標準體系與安全體系,形成層次豐富、協同高效的配套制度體系。在機制層面,構建多主體廣泛參與的協同治理機制,以保障數據空間的安全可信運營和管理。在技術層面,以五層架構和數據空間操作系統為核心共同構建統一的安全可信數據空間技術體系。

3.3 制度體系

3.3.1 組織架構

安全可信數據空間以數據增值過程為主軸,以數據空間運營服務中心為樞紐,形成“一橫、一縱、富生態”協同運行的組織架構體系,如圖4所示。

圖4 安全可信數據空間組織架構

一橫:以數據從原始數據、數據資源、數據元件到數據產品的價值鏈為主線,涵蓋數據的供給、流通與使用三大環節,涉及數據主體(即數據原發者)、數據持有主體、數據元件開發商、數據空間運營服務中心、數據應用開發商、數據消費者等六類主體(角色)。

一縱:以安全可信數據空間的治理與運營為主線,以數據空間運營服務中心為樞紐,涵蓋數據空間的統籌管理、業務運營與技術支撐三個層面,涉及數據空間管理委員會、數據空間技術委員會、數據空間生態聯盟、數據空間運營服務中心、數據金庫運營商等五類主體(角色)。

犢牛肉肉質細嫩,色澤一般。嫩度反映肉的質地和老嫩,是消費者在購買時品質評價的常用指標[5]。pH值直接反映糖原酵解的強度,是測定肉品質時最重要的指標之一。pH值不僅直接影響肉的適口性、嫩度,還與牛肉的系水力和肉色等相關[5]。由于環境條件和基因選擇的不同,不同肌纖維的特性也不同。食品風味是消費者在購買時最直觀感受的品質之一。在確定產品的特征風味時,不僅要依靠儀器分析檢測,還需要標樣核對和感觀評定[5]。

富生態:以構建數據空間內數據共享流通所需的數據要素化、數據安全與合規等第三方專業服務體系為目標,集聚數據資產評估機構、數據安全審計機構、數據合規服務機構、數據咨詢服務機構、數據經紀人、數據基礎設施托管運營商、第三方數據技術供應商等產業生態,為安全可信數據空間的參與主體提供優質可靠的專業服務。

3.3.2 管理制度

為保障安全可信數據空間的有序運行,凝聚各方共識,有效滿足政府監管與行業發展需求,構建三級數據空間制度體系。

面向全數據空間的共識類制度。根據數據空間建設模式的不同,可以選擇強監管類的部門規章、地方政府規章,也可以選擇自律公約、聯合聲明等形式凝聚行業共識;對于涉及各參與主體的權利與義務等需要立法予以明確的,可以推動制定法律、地方性法規;對于技術規范類共識,可以根據實際情況選擇制定團體標準、行業標準以及國家標準。

面向數據空間運營服務中心的運營管理類制度。針對數據金庫專營商、數據元件開發商等與數據安全與合規體系建設密切相關的參與主體,應當以數據空間運營服務中心為主體,牽頭制定數據空間基礎設施管理規范、主體準入及管理辦法等安全可信數據空間運營管理制度,確保參與主體身份可信、行為可控。

各參與主體的組織內部制度體系。為增強數據持有主體、數據元件開發商、數據空間運營服務中心、數據應用開發商等參與主體的數據安全防護能力與數據合規能力,應當在組織內部建立涵蓋組織建設、人員管理、項目管控等的立體性安全合規制度體系。

3.4 機制體系

3.4.1 數據確權機制

數據在安全可信數據空間內流通的各個環節,每當要素形態發生轉換時,均需要對其權屬進行準確劃分和確定,為定價、交換和交易創造條件。在安全可信數據空間內,數據主體作為數據源發者,享有數據主體權;數據資源持有主體、數據空間運營服務中心、數據元件開發商及數據應用開發商享有數據的用益權。

3.4.2 數據流通機制

在安全可信數據空間內,支持參與主體間的無償共享交換和有償數據交易等多種流通模式。在數據無償共享交換模式下,以數據元件為主要流通形態,通過數據空間運營服務中心的中介服務實現數據供給方和使用方的供需匹配;在數據有償交易模式下,需要額外引入數據資產評估機構等第三方專業服務商,確定數據資產價值,確保數據合理定價。無論何種數據流通模式,均可以按需購買數據安全審計、數據合規、數據經紀、咨詢服務等多元化服務,滿足各類數據流通場景需求。

3.4.3 數據定價及分配機制

在有償交易模式下,定價機制基于數據價值轉化的不同階段,采用成本法、收益法、市場法等多種定價策略。在數據資源階段,需結合數據資源獲取的稀缺性、數據質量等諸多因素,采用以成本法為主的定價機制;在數據元件階段,結合數據元件應用領域和數據元件價值,采用收益法為主的定價機制;在數據產品及服務階段,發揮市場機制決定作用,按照市場法定價。

3.5 技術體系

3.5.1 五層架構

安全可信數據空間五層架構包含數據資源層、數據組織層、本體孿生層、決策推演層以及業務應用層。其中,數據資源層整合來自政府、組織、企業、個人的多個主體的數據,實現將原有數據基礎設施數據(如數據中心、互聯網等)與數據金庫的數據以數據資源、模型結果集、數據元件等方式歸集存儲,實現融合計算與共享。數據組織層的元件資源融合平臺支撐數據資源與數據元件安全合規的融合共享,保障生產到共享過程的安全合規,并針對空間運營以及共享情況進行統計。本體孿生層通過空間資源管理平臺提供空間數據資源的需求對接、資源目錄管理、參與主體管理以及使用存證等功能,為技術組件、本體組件的開發使用提供統一的管理。決策推演層通過決策推演平臺,為以業務目標為導向的數據挖掘和仿真推演提供搜索研判、時空分析以及本體可視化等相關功能支撐,滿足面向不同行業需求的決策推演需求,支撐不同行業的數據產品開發與應用分析。業務應用層提供面向場景域的各類業務應用。

3.5.2 數據空間操作系統

數據空間操作系統為安全可信數據空間提供空間資源分配、任務編譯、調度管理、組件管理與系統管理等功能,是鏈接數據空間生態的核心能力平臺。數據空間操作系統是各數據主體訪問數據空間的統一入口,是實現數據互操作的統一桌面;同時,數據空間操作系統也是空間內數據組織、本體孿生層與決策推演層之間統一調配的核心引擎,負責組件接入、資源分配、任務協同調度等。

4 公共安全領域安全可信數據空間實踐

當前公安系統煙囪式業務和信息孤島依然存在,跨網跨警種數據融合難,安全風險大,高價值的數據無法與公安業務數據融合計算、碰撞,嚴重阻礙了公安智能化業務融合發展。亟需構建數據安全和融合共享的技術、制度支撐體系,有效化解數據安全與融合共享之間的矛盾。公共安全數據空間定位于以業務場景為驅動,安全合規為前提,有效貫通公安各警種數據資源和外部數據,實現“原始數據不出域,數據可用不可見”的數據融合共享,全面賦能各業務警種實戰應用,如圖5所示。

圖5 公共安全領域數據空間示意圖

公共安全數據空間兼容原有的多云、多級、多警種數據現狀,基于新一代公安網“一網兩域”框架,主要承載面向“多云合一”業務場景下的數據融合共享。政府、互聯網數據可通過數據金庫歸集和安全存儲,數據空間提供統一身份認證、目錄管理、供需對接、數據融合計算能力。各警種數據可通過數據建模平臺在各自數據域(網)中將原始數據加工成數據模型結果,通過單向安全傳輸技術將數據模型結果擺渡到數據空間進行融合計算生成數據元件。通過數據元件方式進行本體建模、決策推演形成本體和業務組件,支撐反詐、實有人口管理等跨警種多數據融合應用場景。在此過程中,通過數據空間安全與合規相關系統將部門規章和法律法規程序化,實現自動化和智能化校驗和審核,保障數據安全與合規,規避公安數據泄露與濫用風險。

公共安全數據空間為解決公安跨警種、跨密級數據融合共享提供了一種可落地、可操作實施路徑,通過建立明責明權明法的空間運行機制和融合創新技術平臺,全面實現了公安數據協同計算、融合賦能。

猜你喜歡
數據安全元件主體
論自然人破產法的適用主體
云計算中基于用戶隱私的數據安全保護方法
建立激勵相容機制保護數據安全
大數據云計算環境下的數據安全
關于遺產保護主體的思考
QFN元件的返工指南
在新興產業看小元件如何發揮大作用
寶馬i3高電壓元件介紹(上)
大數據安全搜索與共享
論多元主體的生成
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合