?

面向區域教育的大數據公共服務模型探究

2022-02-22 22:05鄭志宏方海光孔新梅洪心
中國教育信息化·高教職教 2022年1期
關鍵詞:教育大數據數據服務

鄭志宏 方海光 孔新梅 洪心

摘 ? 要:隨著中國進入教育信息化2.0時代,各類教育公共服務平臺的建設逐漸完善,數據服務是平臺建設和維護不可或缺的部分。為了推動區域內教育大數據互聯互通,提高教育數據服務質量,該研究提出了教育大數據公共服務模型。該模型明確了教育大數據服務主體和數據服務類型,梳理了服務主體與數據服務類型的供給關系和三種數據服務平臺應該提供的數據服務。此外還分析了國家、區域和學校三個層面的平臺應用案例,說明大數據公共服務模型可以通過數據服務對接其他教育服務平臺,形成更加融合的數據互聯共同體。

關鍵詞:教育大數據;教育公共服務;數據服務;DaaS

中圖分類號:G434 ?文獻標志碼:A ?文章編號:1673-8454(2022)01-0018-13

一、問題的提出

技術的發展不斷推動著教育向前探索,互聯網技術的應用給教育體系的完善提供了更多的選擇?;ヂ摼W技術給人們帶來了顛覆性的變革,教育信息化已成為推動教育發展的重要動力。[1]中國從“教育信息化1.0時代”走向“教育信息化2.0時代”,這是面對新時代教育發展的新要求, 教育信息化在發展理念、建設方式上的一次躍升。[2]互聯網技術在教育上的應用為最終的教育目標服務。今年為了應對疫情,教育部發出“停課不停學”的通知,集中國家和各地區的力量與資源為廣大學生提供學習資源和學習支持服務。[3]

目前,推動建立數據公共服務體系已經成為各國公共服務發展的趨勢。澳大利亞在2013年發布了 “澳大利亞公共服務大數據戰略”(The Australian Public Service Big Data Strategy),推動了大數據在該國公共服務中的應用。[4]在我國,各級政府相繼建立了不同規模的數字教育資源公共服務平臺。教育資源公共服務模式也逐漸從以上傳下載資源為主的單一模式,走向以網絡學習空間為主要載體的整合、交流、共享。[5]中國大學MOOC也在努力從構建開放教育資源平臺轉變到構建終身學習公共服務平臺。[6]

有學者預測,我國未來移動學習的發展將經歷基礎環境建設、知識體系化建設和學習服務建設三個階段。[7]大數據有助于發現真實公共需求、提高公共服務水平。[4]在教育大數據背景下,學習者的在線學習活動和學習行為可以得到全面的跟蹤和記錄,通過學習者學習行為能夠深度挖掘學習者信息,并由此形成立體化數據模型,為學生提供個性化服務。[8]目前已有一些關于大數據公共服務模型的探究,劉邦奇等[9]提出了教育大數據規劃的三個關鍵要素;余勝泉等[10]剖析了區域教育大數據的技術架構,提出構建區域大數據開放生態系統等,但是已有研究未徹底實現當下運行的各類教育服務平臺的數據互聯互通,平臺間仍需要一個協調機制作為各級各類教育服務平臺的溝通橋梁。

二、相關概念

(一)數據服務

數據是指對客觀事件進行記錄并可以鑒別的符號,是對客觀事物的性質、狀態以及相互關系等進行記載的物理符號或這些物理符號的組合。它是可識別的、抽象的符號。[11]服務是為客戶提供價值的一種手段,使客戶不用承擔額外的成本和風險就可獲得所期望的結果。[12]數據服務作為一種服務模式,就是為客戶提供數據價值的一種手段,使客戶不用承擔額外的成本和風險就可獲得所期望的數據。

數據即服務原本存在于云服務架構中,后來將數據存儲和數據處理拆分并實現服務化。數據即服務(Data as a Service, DaaS)是指與數據相關的任何服務都能夠發生在一個集中化的位置,如數據聚合、數據質量管理、數據清洗等,再將數據提供給不同用戶和平臺,而無需考慮數據源。

本研究結合以上兩種觀點,從數據生命周期角度出發,界定數據服務范圍。從某種角度來看,數據服務是指提供數據采集、數據傳輸、數據存儲、數據處理、數據交換、數據銷毀等數據各種生存形態演變的一種信息技術驅動的服務。換個角度來看,數據服務就是為客戶提供數據價值的一種手段,使客戶不用承擔額外的成本和風險就可獲得所期望的數據。

(二)教育公共服務

公共服務是公共部門提供給整個社會的服務,包括政府提供的公共服務和非營利機構提供的服務。[13]教育公共服務可以解釋為由政府主導、惠及社會公眾與滿足社會教育共同利益需求的公益性服務,教育公共產品可以分為公共產品、準公共產品和私人產品。[14]

世界銀行在1989年描述非洲可持續發展危機的報告中首次提出治理理論(governance)一詞,該理論在政治和管理領域獲得了極大的發展。在治理理論中,管理者與被管理者、統治者與被統治者界限逐漸模糊,認為面對公共服務事務,所涉及的各個主體需要溝通、協調、資源交換等,把除了政府外的其他社會組織納入到公共服務中來。我國在2013年將公共服務供給事項放入市場當中,從此越來越多的公共服務項目由政府部門、公共組織、私營部門等共同完成。由政府提供、社會各部門參與生產的教育公共服務,可以促進政府職能轉變、提高公共服務效率和質量、激勵社會組織規范發展、推動教育服務均等化。

教育公共決策決定了教育公共服務的走向,近年來教育公共服務逐漸形成公開透明、多元協商、多元參與的新模式。起促進作用的因素有:行政管理方式的改革和服務導向的政府的建立,建立起良好的公民教育權利表達機制;教育公共決策的反饋機制逐漸發揮作用,政府能及時了解當下所需,盡早改善服務;教育市場的多元競爭,豐富了教育產品的種類,擴大了公民選擇的范圍。目前,教育大數據公共服務越來越受各地政府重視,提供優質的教育數據公共服務、提升服務質量和教育管理效率等也是政府職責所在。

三、教育大數據公共服務基本架構

(一)服務主體

服務主體是大數據公共服務的主要部分,關涉提供服務的主體和服務的對象,包括政府部門、教育機構、其他組織和個人。

政府部門主要包括教育部、教育廳和各級教育局。政府部門主要職責包括研究擬訂教育方針、政策,起草教育相關的法律等;研究提出教育改革與發展戰略、發展規劃;研究提出各類學校的設置標準、教學基本要求、教學基本文件;負責組織審定各級學校的統編教材等。

教育機構廣義是指進行各種教育工作的場所和教育管理機關,狹義指各級各類學校。[15]一般認為,教育機構主要包括學校教育機構和教育培訓機構。其中學校教育機構根據辦學經費是否屬于國家財政性經費可以劃分為公立學校和私立學校。學校主要分為五種:幼兒園、小學、初中、高中和大學。根據國家教育統計指標的標準,教育培訓機構與學校最主要的區別是是否具有頒發國家承認的學歷文憑的資質。相關報告顯示:至2017年底,中國共有超過10萬家K-12課外輔導服務商,中國城市學生每周平均花費10.6小時參加課外輔導。

其他組織指除了政府和教育機構,參與大數據公共服務的其他社會群體。其他組織主要負責公共服務的基礎建設、技術支持等,在教育數據公共服務建設中扮演重要的角色。如國內三大電信運營商為大數據公共服務提供通訊服務支持、相關廠商為智慧校園建設提供硬件支持和軟件服務等。

個人指有教學實踐參與的個體,包括學生、教師、家長、教育管理者、教研員和領域專家等。個人是教育大數據公共服務的主要服務對象。不同的個體享受不同的服務,如學生可以獲得個性化學習資源推薦、形成性學習評價結果、適配學習風格的學習規劃等服務;教師可以獲得學生學情分析、學生成績分析報告、知識點分析等服務;家長可以獲得學生進校門時間推送、校園消費數據和消費模式分析、學生成績分析等服務;教育管理者可以獲得學員和教學資料等信息和教育管理軟件等服務支持,以便更好地完成教育管理工作;教研員可以獲得全校學科知識點掌握情況、階段性檢測數據分析等服務;專家可以獲取相應的教育大數據驗證提出的理論等。

(二)數據服務類型

數據服務,也稱數據即服務(Data as a Service, DaaS),是面向數據的一種服務模式,涵蓋數據生命周期的全過程。數據生命周期是特定數據單元從最初生成、采集、最終存檔、在其使用壽命結束時刪除的一系列階段,數據生命周期的各個階段可以衍生出不同的數據服務形式。聯合國教科文組織教育信息技術研究所出版的《在線教育平臺個人數據安全技術指南》將數據生命周期分為數據收集、數據傳輸、數據使用、數據存儲和數據銷毀5個階段。數據采集是按照一定的數據標準,將所需的數據從數據源收集匯總。數據傳輸是按照一定規程,將數據從數據源傳輸到數據終端。數據使用是根據需求,對數據進行清洗、處理等操作,以滿足對數據的需要。數據存儲是將數據存儲在可靠的介質上,防止數據丟失,并提供可靠的訪問性能。數據銷毀是出于保密的需要或者數據失去價值,對數據進行徹底刪除,并無法復原。

根據教育數據的使用情況,可以延伸為數據采集服務、數據交換服務、數據處理服務、數據分析服務、數據存儲服務、數據安全服務等數據服務類型。而數據來源分類、數據質量、數據標準等可以延伸為數據來源分類服務、數據質量提升服務、數據標準服務等服務類型。各種數據服務根據服務自身的特點、使用場景、技術、權限等,可以由數據服務提供商或數據服務平臺提供。如表1所示。

數據采集服務。數據采集服務是其他數據服務的前提,數據采集是否規范、是否符合既定標準決定了其他數據服務的質量和效率。根據應用場景不同,數據采集的方法、應用的技術、數據格式各有不同。一般來說,數據采集包括人工采集、業務數據采集、消息采集、物聯網設備采集、文件采集、日志采集、消息采集等。數據采集服務是建立在數據采集技術之上的一種數據服務形式,數據采集服務提供者應將所涉及的各種技術和硬件進行封裝,提供方便好用的服務產品。數據采集服務應該盡可能滿足服務對象的采集需求,數據采集的過程盡可能公開透明,數據采集的結果盡可能可視易懂,采集到的數據應具有良好的數據可遷移性,便于數據進一步處理與使用。

數據交換服務。數據交換涉及網絡通信芯片、模塊、基站、平臺、應用層等軟件建設和硬件建設,就要在不可信的鏈路中建立可靠的連接,為用戶完整地傳輸數據。伴隨著TB、PB級的數據跨區域傳輸需求越來越多,用戶對鏈路穩定性和數據可靠性的要求也越來越高。截止到2020年6月,我國建成5G基站超過25萬個,可見的未來數據規模將越來越大。為更大規模的數據提供高質量數據交換服務,異構數據源之間如何交換、鏈路中斷如何快速恢復、數據遷移與數據同步等都是數據交換服務需要解決的問題。

數據處理服務。數據處理服務是影響數據質量的重要因素,好的數據處理方式可以提供更高質量的數據,減少無效數據的比例,提高數據利用率和效能。由于數據的來源、采集技術、數據采集標準等各有不同,數據處理是數據使用的必要環節。數據處理包括數據清洗、數據轉換等。數據清洗是將不符合數據標準的缺失數據、錯誤數據、重復數據等無效數據進行處理,以滿足數據要求。這一過程既可以在數據采集過程中進行,也可以在數據采集后進行,處理工具既可以集成在數據采集工具中,也可以是單獨的腳本程序。數據轉換是將不同格式的數據按照一定規則進行規整,以便數據的再使用。數據轉換包含統一不同平臺編碼的數據編碼轉換、統一不同平臺粒度的數據粒度轉換與統一不同平臺規則的數據規則轉換。數據轉換常見于不同數據庫數據合并等場景,是打破“數據孤島”的重要方法之一。

數據分析服務。數據分析服務包括大數據分析、數據挖掘和可視化等,是體現數據價值的關鍵, 涉及統計分析、算法、程序編寫等。大數據分析和數據挖掘都是通過適當的算法提取數據中的有用信息并形成結論的過程,可視化是將結果以更加直觀的形式展示的過程,可視化也是數據分析和展現數據分析結果的關鍵技術。常見的數據分析方法和數據挖掘方法有趨勢分析、對比分析、分組分析、漏斗分析、留存分析、分類分析、聚類分析、預測分析、關聯分析、決策樹等。常見的數據的可視化展示圖包括折線圖、餅圖、柱形圖、散點圖、雷達圖、熱力圖、儀表盤、畫像、知識地圖等。提供數據分析服務的主體就要靈活運用各種數據分析方法,使用恰當的數據可視化技術,清晰明了地展示數據結果,以便服務對象獲取服務信息。

數據存儲服務。數據存儲服務,也稱存儲即服務(Storage as a Service, SaaS),是一種專門提供數據存儲技術專業知識和存儲空間的數據服務模式。與傳統數據部署與交付方式不同,數據存儲服務將業務應用與存儲架構組件分離,容量、性能、數據容錯級別等都是服務級別的考量指標。使用數據存儲服務,可以降低數據存儲的經濟成本和人力成本,簡化存儲環境,減少各種數據受損的風險,提高數據的使用效率。提供數據存儲服務的主體,要對存儲數據進行設計,保證在整個數據生命周期內數據的可用性,保證數據資產的完整性以及保證數據存取過程的性能,提升用戶體驗。此外,還需要考慮服務成本,選擇設計合適的數據存儲環境,降低數據受損風險,建立經濟高效的數據保護和維護機制。

數據安全服務。數據規模的激增也放大了數據安全和隱私等問題,數據安全服務是一種解決數據安全問題的服務,包括平臺運行安全、數據安全和隱私安全。[16]大數據平臺安全是指對大數據平臺數據傳輸、存儲、運算等資源和功能提供安全保障;數據安全是指在平臺上對支撐數據流動安全所提供的安全功能;隱私保護是指利用去標識符、匿名化等加密技術將個人數據進行處理,防止數據流轉過程中泄露個人隱私信息。數據安全服務對大數據的良好發展具有重要意義。目前的數據安全問題涉及大數據產業的各個環節,有平臺內部的風險,也有平臺外部的風險,有技術導致的風險,也有管理導致的風險。因此提供數據安全服務主體要提升大數據平臺安全保護,確保數據從采集到銷毀各個環節的安全性,保障平臺安全、數據安全,防止隱私外泄。

數據來源分類服務。數據來源分類影響數據采集、數據存儲等多個過程,數據來源分類是否合理、分類邊界是否明晰、分類標準是否完善都決定了最終數據服務的質量?,F有的數據分類方式還尚未統一,從數據結構化程度來劃分,可以分為結構化數據、半結構化數據和非結構化數據;就數據產生的環節而言,可以分為過程性數據和結果性數據;從主體劃分,可以分為個體數據、學校數據、區域數據等;而楊現民將教育大數據分為基礎層、狀態層、資源層和行為層。數據來源分類服務將為服務對象提供統一的數據分類標準,為其他數據服務提供支持。

數據質量提升服務。數據質量提升服務是在數據采集、數據處理等階段對數據進行預處理,根據數據質量的各項指標對數據進行規范的過程。數據質量包括數據的規范性、時效性、可訪問性、一致性、完整性和準確性。數據質量的高低影響數據處理的效率和效果。數據質量提升服務將對數據進行判斷、打分,根據數據質量指標評判標準給出對應的分數。其他數據使用者可以根據評分快速篩選出高質量的數據。數據質量提升服務能夠激勵用戶采集高質量數據,對教育大數據的質量提升具有重要作用。

數據標準服務。數據標準是大數據驅動教育信息化建設和發展的參考依據和實施準則,是促進數據互聯互通的有力保障,對教育數據平臺具有重要的作用。數據標準服務為服務對象提供統一的教育大數據標準,該規范對接國際上的ISO、IEC、JTCI、IEEE,我國的CELTSC等組織的大數據相關標準和規范,對提升數據服務質量具有積極的作用。

(三)國家數據服務平臺

國家數據服務平臺是教育大數據和教育支持服務的主要載體。作為各個服務對象公開獲取教育相關服務的門戶,國家數據服務平臺的構建將影響教育管理、教師教學、學生學習的諸多方面,也是教育大數據在智慧校園領域的重要應用之一。作為教育公共服務的主要載體,政府在國家數據服務平臺建設方面發揮引領作用,其他社會組織提供技術支持和承擔開發工作,形成政府提供、社會各部門參與生產的教育公共服務模式。國家數據服務平臺的主要功能是為各個主體提供教育數據服務。如對接已有的各類教育平臺、提供其需要的數據資源與數據服務。國家數據服務平臺包括功能集成化的中心、數據治理架構和平臺基本架構。

中心包括數據匯集中心、數據存儲中心、數據交換中心、數據處理中心和平臺服務中心。數據匯集中心是平臺數據匯集的統一入口,負責從不同數據源獲取數據。數據采集方式包括主動從網絡中爬取數據、從信息化平臺主動獲取數據、采集其他平臺提交的數據等,實現平臺間的數據互聯互通,保證數據的規范性。數據存儲中心是數據存儲服務的交易場所,通過統一的數據倉庫建設標準和數據規范,為各個主體提供統一完善的數據存儲服務,用戶可以根據需求自由選擇合適的數據存儲方案。數據交換中心是主體間數據交換的服務場所,主要為海量數據的遠距離傳輸提供服務支持和安全保障,確保數據的完整性與安全性。數據處理中心是數據處理方案的交易場所,使用者可以在中心選擇已有的數據處理方案來處理教育數據,也可以根據自身需求,發布個性化的數據處理訂單,尋求個性化的數據處理方案。平臺服務中心是平臺為各個主體提供的數據相關服務的場所,提供數據標準服務、數據分類服務、數據安全服務等,保證其他服務的正常進行。

數據治理架構包括:①標準,包括涉及數據的各類標準與管理規范,如數據分類標準、主數據、數據模型、技術工具標準等。②安全與提升,包括數據安全的規范、數據質量管理與提升的各類規范,數據安全規范、數據質量指標,數據質量改進等。③組織,包括數據治理的組織管理等相關細則,涉及規劃與責任、培訓與教育、規劃與優先級、組織變革管理等。

平臺基本架構包括存儲層、開發層、服務層、網絡層、用戶層和業務層。存儲層負責平臺數據的存儲,包括SQL數據庫和NoSQL(not only SQL)數據庫。開發層包括平臺開發框架、服務器配置等,負責平臺功能的開發與拓展。服務層負責支撐平臺的各項功能,包括消息隊列、服務中心、配置中心等。網絡層負責平臺網絡的負載均衡和內容分發網絡等,保證網絡性能與可用性。用戶層主要負責用戶管理與權限設置等。

四、數據服務的供給關系和平臺數據服務

面向數據的公共服務需要依據數據服務的具體內容、服務性質,明確數據服務邊界,確立服務內容框架,既便于服務提供者發揮自身優勢、深入垂直領域、提升服務質量,又便于服務對象從容選擇合適的數據服務、優化自身平臺、降低成本等。本研究將數據服務提供者分為兩類:服務主體參與的數據服務和平臺提供的數據服務。

(一)服務主體與數據服務的供給關系

服務主體與六類數據服務的供給關系如圖2、表2所示。

服務主體包含政府部門、教育機構、其他組織和個人四類,提供服務的主體稱為服務提供者,使用服務的主體稱為服務使用者。每一個服務主體都將至少扮演服務提供者和服務使用者中的一個角色,部分服務主體將扮演雙重角色,既提供服務,也會使用來自其他主體的服務。多主體協同提供教育公共服務。政府作為教育公共服務的提供者,其他組織負責生產公共服務,教育機構和個人使用公共服務。

根據現實教育數據的采集、使用情況,本研究描述一個數據服務的一般場景。

在數據采集階段,政府部門、教育機構、專家等共同擬定數據采集技術標準和規范,為數據采集服務提供理論框架。根據標準和規范,相關組織研發生產數據采集設備,開發數據采集平臺,數據接口與數據服務平臺對接,保證數據的規范性和一致性。教育機構和個人使用數據采集軟件和硬件進行數據采集,如新冠肺炎疫情期間,學校使用傳感器采集學生體溫數據;教師使用在線問卷采集學生問卷數據等;學生使用拍照軟件采集學生作業數據。

在數據傳輸階段,政府負責監管工作,可靠的數據交換服務由專門的數據交換服務提供者提供。不同主體對數據交換有不同需求。如:學校內教師為了學習優秀班級的管理策略,訪問其他班級的班級管理數據,這樣的數據交換借助教育管理軟件就可以完成,小規模數據的短距離傳輸不需要使用數據交換服務。如果省、市一級的教育局要訪問學校一年內的學生學習數據,用于學校教學評估等,這樣大量的數據的遠距離傳輸就需要使用數據交換服務。

在數據使用階段,政府、教育機構需要對數據進行數據處理與分析,數據處理與分析所涉及的技術、算法、程序編寫可以由政府與教育機構獨立完成,也可以根據分析難度和數據的不同,購買其他組織的數據處理和數據分析服務。如某學校要對全校學生的學習行為進行分析,尋找有助于成績提高且與學生學習風格相匹配的學習習慣。這樣的數據分析任務特點是數據量大,涉及數據類型多,分析耗時較長,分析的模型需要定制設計,一般的學校很難完成這樣的分析任務。此時就可以選擇購買其他組織的數據處理服務和數據分析服務,能省時省力地得到想要的分析結果。

在數據存儲階段,教育機構的教育數據在本地和云端混合存儲。經常調用的數據和重要的學校數據保存在本地,占用更多存儲資源的教學資源數據、學生行為數據、監控數據等保存在云端。云服務由其他組織提供、政府監管、社會監督。如:一名新生入學,入學時采集的學籍信息、身份信息、健康數據等保存在本地數據庫,并在云端備份。學生自主學習時,視頻、VR教材等學習資源從云端數據庫獲取,還可以訪問專屬的校本課程資源庫,學生學習過程中的行為數據、過程性評價數據在云端保存,教師、學生、家長可以隨時訪問。

個人一般不扮演服務提供者的角色,即個人只使用教育公共服務,不提供教育公共服務。主要有以下原因:①價值角度。個人會采集自身或者小規模的數據,數據量較小,對于更高層次的教育服務而言價值較低。②技術角度。個人提供的教育服務競爭力不強。個人包含的學生、教師、家長、教研員等缺乏處理大數據的技術、能力,難以提供高質量的教育服務。③需求角度。相比政府、機構與組織,個人沒有提供教育公共服務的現實需求。

(二)教育大數據來源分類服務

教育大數據來源分類服務是國家數據服務平臺提供的數據服務之一,該服務將支撐其他數據服務。本研究在其他教育大數據分類研究基礎上,結合教育數據采集、使用等現實需求,提出一個教育大數據分類方案,為教育大數據來源分類服務提供支持。如圖3、表3所示。

人與技術共同參與的教育實踐活動是教育大數據的主要數據來源,根據教育活動的性質和類型,可以分為教學活動、評價活動與管理活動。教學活動包括師生面對面的課堂教學活動、線上教學活動和自主學習活動等,教學活動產生的數據包括課堂學習行為數據、在線學習行為數據、教學行為數據、學生和教師互動數據等。評價活動包括學生學習過程中的形成性評價、總結性評價,對教師的教學評估、對學校的評估活動等。教學評估數據包括學生期末成績數據、教師職業測評數據、學校教育質量評估數據等。管理活動包括學校管理和教育行政管理等。學校管理數據包括招生數據、科研成果數據、經費情況數據等,教育行政管理數據包括教育政策數據、人事調動數據、教育規劃數據等。

基本信息能夠表明數據產生的主體等信息,明確數據所屬與所在環境,目前的基本信息研究也會以畫像的形式呈現?;拘畔▽W生基本信息、教師基本信息、班級基本信息、學?;拘畔⒌?。學生個人信息包括個人信息數據、學籍數據、課程數據、學習行為數據、網絡社交數據、校園生活數據等。教師基本信息包括個人信息數據、職稱信息數據、授課課程數據、科研數據、校園生活數據等。班級基本信息包括班級內設備信息、人數、當前課程名等。學?;拘畔ń處煍盗?、學生數量、智慧教室數量、資產信息、地理位置等。

教學資源,主要包括教學材料、教學環境及教學支持系統。教學材料包括各種數字化的素材、教學軟件、補充材料等,教學環境是學習者運用資源開展學習的具體情境,教學支持系統是支持學習者有效學習的內外部條件。教學材料所涉及的數據包括用于教學的演示文本、視頻、音頻、VR/AR資源等各類多媒體資源數據。教學環境所涉及的數據是指教學環境產生的與教學相關的數據,如光照強度、空氣質量等。教學支持系統產生的數據包括操作日志等數據。

(三)教育大數據標準服務

教育大數據標準服務是國家數據服務平臺提供的數據服務之一,教育大數據標準服務的質量取決于標準體系是否完善、所提供的標準是否與使用場景契合等。標準體系是一定范圍內的標準按其內在聯系形成的科學有機整體。目前教育大數據的標準體系主要參考國內外大數據的各項標準,結合教育行業自身的需求與環境的變化不斷發展和更新。大數據標準體系框架包含基礎標準、數據標準、技術標準、平臺/工具標準、管理標準、安全和隱私標準、大數據治理標準和行業應用標準等。[17]對于一般性的數據標準,在教育領域的應用需要結合教育數據的使用現狀和數據特征,對這類標準的對接工作是教育大數據標準服務的內容之一。對于針對教育數據的相關標準,標準的歸納、更新等工作也是教育大數據標準服務的范疇。

本研究以教育大數據質量評價指標為例,將《GB/T 36344-2018 信息技術 數據質量評價指標》這一國家標準在教育大數據上的應用加以解釋,以描述教育大數據標準服務的一般應用。

《GB/T 36344-2018 信息技術 數據質量評價指標》于2019年正式實施,該標準將數據質量評價指標分為六個維度,分別是規范性、完整性、準確性、一致性、時效性和可訪問性。

規范性:指的是數據符合數據標準、數據模型、業務規則、元數據或權威參考數據的程度。針對教育數據,可以舉例:《GB/T 33782-2017 信息技術 學習、教育和培訓 教育管理基礎代碼》中定義10表示升學、11表示本科、12表示高職(??疲?。

完整性:指的是按照數據規則要求,數據元素被賦予數值的程度。針對教育數據,可以舉例:《GB/T 36345-2018 信息技術 通用數據導入接口》規范要求,進行登錄操作和文件傳輸操作時,用戶名、密碼、目標地址、端口、返回結果是必選項。

準確性:指的是數據準確表示其所描述的真實實體(實際對象)真實值的程度。針對教育數據,可以舉例:電子課本元數據用于描述電子課本整體時,標識符是電子課本的唯一標號,只能填寫正確的標識符。

一致性:指的是數據與其它特定上下文中使用的數據無矛盾的程度。針對教育數據,可以舉例:學生的身份信息與學籍信息是否一致,身份證號碼與學籍記錄是否匹配。

時效性:指的是數據在時間變化中的正確程度。針對教育數據,可以舉例:電子課本進行了內容更新,關聯的相關資源也相應進行了更新,這類資源是否可以及時得到更新。

可訪問性:指的是數據能被訪問的程度。針對教育數據,可以舉例:教學資源數據在需要時的可獲取性以及在設定有效生存周期內的可使用性。

(四)教育數據質量提升服務

高質量的教育數據影響后期數據處理、數據分析等操作的效率,教育數據質量也將決定其他數據服務的質量,提供高效便捷的教育數據質量服務也將大大增加數據平臺的吸引力,目前數量巨大、標準不一的教育數據導致數據分析結果,難以支持教學活動、給教育決策提供有效參考已經能說明這個問題。低質量的教育數據會增加數據分析成本、降低分析效率,從而阻礙教育數據的應用和發展。因此,教育數據質量提升服務對數據平臺的服務對象具有重要的意義。

教育數據質量提升服務包括數據質量評估框架與數據質量改進流程兩部分內容。本研究參考IMF的數據質量評估框架,結合教育大數據的數據質量評價指標和數據特征,形成教育數據質量評估框架(Education Data Quality Assessment Framework,EDQAF)。教育數據質量評估框架包括測量維度、測量類型和特定的數據三個主要內容,評估方法是通過測量類型對數據質量的六個維度進行量化,評價特定數據的質量。維度、測量類型和特定的數據這三個層次,從上到下來看是抽象逐漸過渡到具體的過程, 降低了數據質量維度的抽象程度,更接近數據,從而評估具體數據的質量。從下往上看,提高理解和解釋測量結果的能力,使教育數據質量評價能夠盡可能覆蓋大多數的教育數據。如圖4所示。

數據質量評估框架是一個具有高度可操作性的質量評估框架,可操作性源于其中的測量方法,即測量類型。測量類型通過計算百分比的方式可以得出要測量數據的質量結果,每個值集的有效范圍存儲在另一個標準表上,通過比較數據質量結果與標準表上值集的有效范圍即可確定數據的有效性。

教育數據質量提升服務是按照一定的流程,通過教育數據質量評估框架EDQAF對教育數據的規范性、時效性等質量指標進行評價并提升的一種數據服務。該服務有準備、數據質量提升和數據交付使用三個階段。如圖5所示。

在準備階段,數據質量管理組織的構建、數據規范的完善和評價指標的確定是提升數據質量的前提。數據質量管理組織主要負責人事的管理,保證數據質量提升服務的有效進行。數據規范包含相關數據標準,是數據質量的參考性文件。評價指標包含教育數據質量的維度等,如規范性、時效性、可訪問性、一致性、完整性、準確性等。

在數據質量提升階段,數據質量提升包含四個階段。在Plan(計劃)階段,根據數據的類型和用戶對數據的需求等,制定數據提升的目標,用戶需求可以采用問卷等方式進行調查。在Do(實施)階段,根據目標和需求,按照一定的方法、步驟,設計具體的方案和計劃,并對方案和計劃進行實施。在Check(檢查)階段,總結計劃實施的結果,看是否得到期望的數據并滿足用戶的需求。在Act(行動)階段,對檢查的結果進行處理,如果數據滿足用戶需求,則將數據交付使用,如果不滿足,則進行下一輪的數據質量提升。

在數據交付使用階段,將處理后的數據提交給用戶,如果數據交付后不滿足用戶需求,數據將再次進行質量提升,直到滿足需求或者更換其他數據為止。

五、支撐多領域教育服務平臺的數據服務

隨著教育信息化的不斷推進,面向各種教育場景的服務平臺越來越多,在國家層面,有中國大學MOOC、國家開放大學學分銀行等公共平臺;在區域層面,各級教育部門建設了各類教育平臺,如北京市中小學學籍管理云平臺、上海教育資源庫、廣東省的粵教云、天津市和平區教育云數據中心等;在學校層面,許多學校根據自身的需求,建設了為校園內師生服務的服務平臺,如北師大實驗中學的精細化管理與大數據服務平臺等。本研究以國家開放大學學分銀行、天津和平區教育系統平臺和北師大實驗學校大數據平臺為例,從國家層面、區域層面和學校層面三個角度出發,結合案例的平臺特點,提出的教育大數據公共服務模型為案例提供數據服務支持。

(一)國家層面:國家開放大學學分銀行

“學分銀行”就是在終身學習理念的推動下,在不同類型教育間(包括不同形式學歷教育、非學歷教育的不同課程) 以學分認定、累積和轉換為主要內容的一種新型的學習制度和教育管理制度。[18]從服務主體來看,國家開放大學學分銀行涉及平臺、教育機構和學習者三類主體。從服務類型來看,國家開放大學學分銀行提供學分認定、學分累積、學分折算和學分兌換等服務。

當前學分銀行的平臺提供的服務可以分為四類,其中數據服務DaaS包括數據組織、數據交換共享平臺、數據存儲、數據源、數據管理等內容。如圖6所示。

作為面向全國的公共服務平臺,國家開放大學學分銀行根據職能定位的不同可以分為多個層級,分別是國家學分銀行、學分銀行省級中心、學分銀行分中心和學分銀行認證受理點。目前相關的數據服務由學分銀行平臺提供,隨著終身學習理念的不斷深入,社會對學分認證的需求也將大大增加,經過認證的學分也將在更多教育平臺呈現。伴隨學分銀行的普及,用戶數據、學分數據等數據數量會大大增加,訪問頻率和頻次也會激增,平臺的數據處理、數據交換等能力將面臨挑戰,根據需求提供數據服務將成為必要環節。面對不斷增加的數據服務需求,數據服務平臺可以對接學分銀行的數據服務DaaS,為學分銀行提供定制的數據服務,以滿足學分銀行業務增長的數據服務需求。

(二)區域層面:和平區教育云數據中心

和平區是天津市中心城區核心區,和平區教育云數據中心為區內28所中小學、20所幼兒園提供教育服務。在和平區教育局的推動下,和平區通過“開放平臺+多種教育服務”構成的應用生態圈的模式,構建教育信息化生態系統,該區的智慧教育應用還兩次被評為教育部基礎教育信息化應用典型案例。

和平區教育云數據中心的數據服務包含數據收集模塊、數據處理模塊、數據展示模塊和數據資源中心等。如圖7所示。目前的和平區教育云數據中心的數據服務涉及數據采集、數據處理、數據分析、數據交換、數據安全等多種數據服務類型,未來教育云數據中心的架構也有利于根據需求兼容其他數據服務,形成優化已有數據服務、增加數據服務類型、擴展數據服務范圍的數據服務生態環境,為深挖教育數據價值、更好服務于整個區域的學校師生和教育管理者提供數據支撐。

和平區現有的教育數據來源于多種場景,能夠產生豐富的過程化數據,多維度的教育數據的數據分析、數據處理過程更為復雜,分析結果也能夠為各個教育場景提供更好的支持。作為教育部基礎教育信息化應用典型案例,和平區涉及教學、科研、管理數據等數據的采集、分析和處理服務,可以共享到教育數據服務平臺,為其他區縣級教育數據平臺建設提供數據服務支持。也可以根據數據類型擴充等現實需求,從教育數據服務平臺獲取其他數據服務。

(三)學校層面:北師大實驗學校精細化管理與大數據服務平臺

北師大實驗學校大數據服務平臺是為北師大實驗中學數字校園云平臺提供數據管理和數據服務的大數據服務平臺,涉及學校管理、教學、學習、師生等多領域數據,大數據服務平臺對提升學校治理水平、促進協同辦公、實現科學決策和精準服務具有重要作用。

北師大實驗學校大數據服務平臺以數據中臺和業務中臺為框架,利用數據中臺技術對學校核心業務的流程和邏輯進行梳理,在對核心業務數據聚合、挖掘、分析的基礎上,形成可靠的數據服務,為學校各個業務和應用場景服務,形成以用戶需求為驅動力的數據服務模式。在管理業務方面,該平臺根據學校崗位的職責劃分,提供精準的數據服務,推動各項管理標準化、工作規范化、業務協同化。在教學方面,該平臺為每一位教職工提供業務主題數據服務,教職工可以查看學生基礎數據大屏、對權限內各項數據進行管理、訪問學生畫像等。在學習方面,該平臺能為每一位學生和家長提供學習相關數據,如考試后為學生推送個人考試成績和成績分析結果,讓學生和家長準確掌握學情。

北師大實驗學校大數據服務平臺是一個典型的學校層面的教育數據服務平臺,該平臺為學校的開放式數字校園云平臺提供數據服務。教育數據服務平臺建設的目標是促進從數字化校園向智慧校園的轉變。學校的數據服務要伴隨智慧校園的建設不斷提高服務質量,通過對接國家數據服務平臺,可以降低數據服務的研發成本,縮短研發周期,減少學校運營成本,及時讓最新的數據服務直通到學校,服務到個人。

本研究選取了三個平臺案例,涵蓋國家層面、區域層面和學校層面,對每一個案例的服務架構進行解析。研究發現:數據服務作為平臺中不可或缺的組成部分,平臺的數據服務與國家數據服務平臺的對接,可以有效減少重復開發、充分利用資源、縮短其他平臺的數據服務建設成本和運營成本,實現多平臺數據互聯互通、數據服務的資源共享。

六、優化教育大數據數據服務的建議

鑒于數據在教育領域發揮著越來越重要的作用,數據將是未來學校最重要的資產,如何充分利用教育大數據、兼顧發揮數據價值與保護數據權益是一個重要的舉措。本研究提出的大數據公共服務模型,是一個維護各方數據權益,以數據服務的互通共享為出發點,為各方平臺提供高效好用的數據服務的公共服務模型。關于該模型的未來發展有如下展望。

(一)加快推進國家數據服務平臺建設

大數據公共服務模型的提出梳理了服務主體與數據服務間的關系,各教育服務平臺的對接需要國家數據服務平臺實體的支撐,教育大數據來源分類服務、教育大數據標準服務和教育數據質量提升服務需要平臺支持來實現。由政府主導、學校支持、社會組織參與的國家數據服務平臺將會給多領域的平臺提供數據服務,形成多方參與、共同建設、成果共享的數據服務協同共同體,最終實現不同平臺間的數據互聯互通和數據服務流通,提高數據的使用效率和效果,降低學校、教育部門等機構的數據服務建設成本。

(二)提高數據服務在教育資源服務中的地位

隨著信息化的不斷深入,需要更多的數據分析方法和分析角度處理與日俱增的教育大數據,得到想要的分析結果來服務教育中的各個主體。作為一種特殊的教育資源服務,數據服務是諸多教育信息服務的前提,數據服務的質量也將影響最終教育服務的效果。推動數據服務建設科學化、規范化,發揮教育大數據在教育教學、管理等領域的支撐引領作用,利用優質數據服務提高學校管理水平、教學水平,形成以數據服務促學校發展、教師提高、學生進步的良好局面。

(三)優化教育領域數據服務的供給機制

高效可用的數據服務源于數據提供主體,合理的數據服務供給機制促進數據服務流轉、建立連接各個主體的交流通道,可以有效促進數據服務質量的提升,因此優化教育領域數據服務的供給機制至關重要?;诟鱾€主體的數據服務需求,建立數據服務需求清單,提供數據服務的組織機構,根據清單內容,按照平臺的數據標準和開發需求提供合適的數據服務。還需確立數據服務的服務界限,明確數據服務的主體責任,增加數據服務的供給透明度。

參考文獻:

[1]祝智庭.互聯網誕生50周年紀念專題:“互聯網+教育”[J].浙江師范大學學報(社會科學版),2019(4):1.

[2]任友群.走進新時代的中國教育信息化——《教育信息化2.0行動計劃》解讀之一[J].電化教育研究,2018(6):27-28,60.

[3]祝智庭,郭紹青,吳砥,等.“停課不停學”政策解讀、關鍵問題與應對舉措[J].中國電化教育,2020(4):1-7.

[4]張序.促進大數據應用于公共服務[N].中國社會科學報,2020-04-21(007).

[5]林毅君,楊非,張綱,等.國家數字教育資源公共服務體系建設研究和實踐[J].中小學電教(綜合),2020(4):15-18.

[6]袁松鶴,劉選.中國大學MOOC實踐現狀及共有問題——來自中國大學MOOC實踐報告[J].現代遠程教育研究,2014(4):3-12,22.

[7]方海光,王紅云,黃榮懷.移動學習的系統環境路線圖——國內外移動學習研究與應用案例研究專欄綜述篇[J].現代教育技術,2011(1):14-20.

[8]方海光,羅金萍,陳俊達,等.基于教育大數據的量化自我MOOC自適應學習系統研究[J].電化教育研究,2016(11):38-42,92.

[9]劉邦奇,張振超,王亞飛.區域教育大數據發展參考框架[J].現代教育技術,2018(4):5-12.

[10]余勝泉,李曉慶.區域性教育大數據總體架構與應用模型[J].中國電化教育,2019(1):18-27.

[11]王珊,薩師煊.數據庫系統概率(第5版)[M].北京:高等教育出版社,2014.

[12]DAMA國際.DAMA數據管理知識體系指南(原書第2版)[M].北京:機械工業出版社,2020.

[13]李偉民.金融大辭典[M].哈爾濱:黑龍江人民出版社,2002.

[14]何鵬程,宋懿琛.教育公共服務的理論探討[J].教育發展研究,2008(9):39-43,48.

[15]顧明遠.教育大辭典[M].上海:上海教育出版社,1998.

[16]中國信息通信研究院.大數據安全白皮書2018[R].北京:中國信息通信研究院,2018.

[17]中國電子技術標準化研究院.大數據標準化白皮書(2018 版)[R].北京:中國電子技術標準化研究院,2018.

[18]郝克明.終身學習與“學分銀行”的教育管理模式[J].開放教育研究,2012(1):12-15.

作者簡介:

鄭志宏、孔新梅、洪心,首都師范大學教育學院碩士研究生;

方海光,首都師范大學教育學院教授、通訊作者,郵箱: fanghg2013@163.com。

Inquirying on Big Data Public Service Model for Regional Education

Zhihong ZHENG, Haiguang FANG*, Xinmei KONG, Xin HONG

(College of Education, Capital Normal University, Beijing 100048)

Abstract: As China enters the education informatization 2.0 era, the construction on various educational public service platforms is gradually improved that the data service becomes indispensable in constructing and maintaining the platform. In order to promote the inter-connection of big data in educational region and to improve the quality of educational data service, this research proposes a public service model of education big data. This model clarifies the types in educational big data service subject and data service, while it sorts out the supply relationship between the service subject and the data service type, and the data service that the three-data service platform should provide. In addition, it analyzes the cases in platform application at national, regional,and school levels, showing that the big data public service model can connect to other education service platforms through data services and can form a more integrated data interconnection community.

Keywords: Big data in education; Education public service; Data services; DaaS

編輯:王天鵬 ? 校對:王曉明

猜你喜歡
教育大數據數據服務
地理空間大數據服務自然資源調查監測的方向分析
基于數據中臺的數據服務建設規范研究
數據服務依賴圖模型及自動組合方法研究
基于云計算的高校大學生信息平臺的研究
狹義教育大數據在英語教學中的應用模式
教育大數據在教育管理中的運用分析
如何運用稅收大數據服務供給側結構性改革
基于頻繁子圖挖掘的數據服務Mashup推薦
一種基于數據服務超鏈進行情景數據集成的方法*
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合