?

基于知識圖譜的老年教育知識庫系統設計與實現

2021-06-20 13:00孫涵齊悅
計算機與網絡 2021年8期
關鍵詞:應用系統老年教育知識庫

孫涵 齊悅

摘要:在老年教育建設過程中,將信息技術與老年教育特點相結合,為提高老年教育過程中大量的數據、知識存儲和查詢效率,設計了一種基于知識圖譜的老年教育知識庫系統。系統以知識圖譜為核心,通過對老年教育不同角色的業務進行分析并設計本體,將多領域和多類型的數據通過本體映射,完成知識圖譜構建,將繁雜無序的數據形成具有內在多種關聯的知識庫,并為學員和教師提供在線的知識管理和知識服務功能。與傳統的數據管理方式相比,知識檢索和信息獲取效率得到有效提高。

關鍵詞:知識圖譜;老年教育;知識庫;應用系統

中圖分類號:TP391文獻標志碼:A文章編號:1008-1739(2021)08-57-6

0引言

構建全民終身學習教育系統是我國基本公共服務的重要組成部分,在全民終身學習的倡導下,老年教育的建設有著重要作用,老年教育是幫助老年人在晚年實現繼續學習、增長文化知識、豐富生活以及提高老年社會參與感的教育形式,是建設全民終身學習型社會的重要一環。國務院辦公廳印發的《關于推進養老服務發展的意見》也鼓勵各類教育機構通過多種形式舉辦或參與老年教育,有效滿足老年人多樣化、多層次養老服務需求[1]。發展和建設現代化的老年教育在構建全民終身學習教育體系和提高老年人生活品質等方面有重要意義。

目前在老年教育網絡化和現代化的建設過程中已形成了大量的教育資源,老年教育在以課程教學、體驗式教學、活動式教學、多媒體教學等多方面積累了海量的教學資源內容。老年教育由于其特殊性未來必然向著集約化、規?;l展,才能最大程度提高教育質量。針對老年教育特征的知識管理數據服務系統還有所欠缺,建設高效的知識庫系統對老年教育管理有著重要的意義。

1系統需求分析

隨著近些年老年教育的不斷發展,我國在老年教育領域也取得了長足進步,在課程設計、人才培養、服務模式以及多種類的教育活動都有了大量的數據和經驗的積累。人民日報指出,有810多萬老年人在6.2萬多所老年教育機構學習,上千萬老年人通過社區教育、遠程教育等各種形式參與老年教育[2]。目前,在老年教育現代化建設中已進行了大量的研究。如高慧敏[3]提出數字化服務下的社區老年教育,以云南昆明為例研究線上結交好友、擴大人際圈子、線下共娛共樂、有益身心的老年教育模式。續芳[4]通過微課納入老年教育體系的研究,開展移動學習終端的設計和傳播,切實推動“互聯網+”時代老年教育的供給側改革。陳艷莉[5]闡述了以網絡媒介為基礎的電大老年教育推進策略,通過打造自適應的數字化學習平臺,應最大限度地發揮互聯網優勢,大力開發老年教育網站和手機App等數字平臺擴大老年教育覆蓋面。

因為老年教育與傳統的教育模式相比具有一定的特殊性,因其覆蓋范圍廣、課程類型多、教學類型多、學員分布不均衡等原因,造成老年教育過程中數據管理成本高、資源對接難度大的問題。目前主要依賴傳統的記錄方式以及人員經驗維護相關的資源內容,對老年教育的現代化建設發展造成了一定的困難。針對這一問題,本文設計了一種基于知識圖譜的老年教育知識庫系統。知識圖譜是指由多個概念以及概念之間關聯關系的有向圖的集合,通過概念和實體之間的聯系以及通過對數據的挖掘而生成的,是建立在個人對相關知識理解上建立的有體系、有關聯的數據[6]。面向老年學員、教師與管理人員等多個角色,實現智能搜索、智能推薦和智能關聯的功能,建立針對老年教育過程多樣的教學實踐,聚合學生信息、教師信息及課程信息等內容,形成老年教育知識庫系統,幫助老年教育參與人員在不同的業務場景下高效獲取和管理相關信息。

1.1功能模塊

基于知識圖譜的老年教育知識庫系統,主要針對老年教育過程中學員信息、教師信息、課程信息、活動信息、教學信息等數據,根據業務流程設計本體,并構建老年教育知識圖譜,面向學員、教師、管理人員在不同的業務需求基礎上設計不同的功能應用。系統建設主要功能有知識管理、知識庫服務和數據管理,如圖1所示。

①知識管理:對業務建模構建本體,將上傳的數據與本體進行映射形成知識圖譜,并針對不同的實體進行數據融合,合并相同的數據,同時支持知識的動態更新功能。

②知識庫服務:基于知識圖譜提供相關的知識服務功能,包括知識檢索、關聯搜索、知識推薦和知識問答。知識檢索是通過用戶的檢索詞與知識實體進行匹配獲取對應的源數據;關聯搜索通過知識圖譜的關聯性質,將匹配的數據根據其關聯的數據,獲取相關的關聯數據;知識推薦通過用戶檢索和查詢的數據類型和領域,基于知識圖譜推薦相關的數據內容。與關聯搜索的區別是知識推薦主要是主動推送數據,而關聯搜索則是被動推送數據;知識問答,根據用戶的意圖匹配到相關的本體,返回對應的實體數據,知識問答主要實現方式是通過規則匹配完成。

③數據管理:針對基礎數據進行管理,包括數據上傳、存儲、更新、刪除以及數據的類別和數據標簽進行相應的增刪改查。數據類別主要是針對上傳的數據劃分對應的數據領域,便于后續的數據映射操作。數據標簽則是根據上傳數據的內容項進行標簽記錄,便于對數據的內容進行分析和挖掘。

1.2系統用例

老年教育知識庫系統角色主要有管理員、教師和學員3個角色,系統用例圖如圖2所示。管理員主要功能有用戶管理對系統用戶的訪問權限進行設置,知識管理對圖譜的更新和構建以及本體設計,數據管理主要是數據的增刪改查等操作,知識服務主要是針對應用服務的后臺配置,例如針對推薦和關聯搜索的策略設置等操作。教師和學員主要關聯查詢、知識檢索、知識推薦和知識問答,根據角色的業務定義不同設置不同的數據訪問權限。

2系統設計

根據系統需求,老年教育知識庫系統在保證系統功能可用的基礎上還具備數據安全性、可靠性、容錯性和擴展性。知識庫系統基于B/S架構設計,提高系統的適用性和易用性。為保證系統的高可用和高性能,在存儲方面采用MySQL數據、Neo4j圖數據庫、Redis內存數據庫以及HDFS分布式文件系統的組合存儲方式,其中,MySQL主要存儲業務數據、用戶數據和本體-關系模型數據;Neo4j主要用于存儲圖數據、Redis用于緩存命中的元數據實現高速的數據訪問功能;HDFS用于存儲用戶上傳的文件數據。

混合存儲模式主要是分離源數據、圖數據和元數據。元數據用于管理圖數據和源數據的數據映射,在業務應用中首先通過圖數據命中數據項,然后通過元數據獲取對應的源數據,進而滿足圖數據的高性能查詢和更新操作,以及源數據的無損存儲。

2.1架構設計

系統實現主要采用前后端分離的思想,前后端的交互通過REST風格規范的接口完成。系統后端開發主要基于SpringBoot框架,通過注解的方式完成相關的配置,讓開發過程專注于業務本身,提高開發效率。將應用配置通過注解的方式完成配置,簡化Spring應用的開發、創建、運行、調試和上線部署。使用Gradle完成項目的自動化構架和包的管理,同時集成Docker使用Springboot內置的Tomcat完成項目的打包上線。系統后端采用MVC設計模式,將系統分為模型、視圖和控制器,同時領域模型、業務服務和數據處理分離到不同的模塊中,實現分層架構的設計模式,降低系統的耦合度提高系統的可維護性和擴展性?;诜謱釉O計思想將系統劃分為接口、服務和存儲3個模塊,如圖3所示。

①Web接口:與前端進行數據交互,封裝了查詢、本體管理、圖譜管理、資源管理等模塊的接口。查詢接口(Query-api),主要是對接前端的數據查詢服務;本體管理(EntityCollectClient),主要是實現業務模型的本體構建,支持本體的相關操作功能的接口;圖譜管理(KGVis),主要是完成圖譜的創建、更新、映射以及知識圖譜的匹配和版本管理等功能;資源管理(Rescoure),主要是針對業務流程中的資源進行管理的接口,包括用戶、權限、數據等內容;

②Service層:對系統的服務和數據處理等后端功能的封裝,包括知識圖譜服務、知識圖譜構建、資源管理、URl管理、狀態管理、元數據管理等ResourceService/ResourceManager執行資源管理的相關操作和服務的封裝功能。QueryService,執行查詢的操作和服務的封裝功能。OntService,執行本體的相關操作和服務的封裝功能。KGService/KGVisService,執行知識圖譜的創建、更新、映射等操作和服務封裝。MetadataManager,執行元數據管理,根據圖譜和源數據的映射完成元數據的相關操作和服務封裝。

③Store層:對數據存儲,包括圖數據、元數據、源數據以及索引等。MySQLDao,封裝所有的業務數據存儲功能,實現統一的數據庫連接、執行、結果封裝等功能;ESDao,封裝查詢索引功能,實現索引創建、更新、刪除等操作,根據業務需求依賴圖數據和源數據實時的操作索引,并支撐數據查詢和搜索功能;Neo4jDao,封裝圖數據的存儲,主要針對知識圖譜和本體結構的存儲并與元數據建立對應關系。

2.2核心業務流程

基于知識圖譜的老年教育知識庫系統核心業務流程包括數據管理、知識管理和知識服務三部分,同時3個核心流程之間互相關聯和依賴。數據管理的流程主要是上傳數據,實現基礎數據的線上維護,將新產生和需要更新的數據上傳到系統,根據數據內容錄入相關的數據標簽,登記數據類別然后對源數據進行存儲。知識管理,其核心流程是知識圖譜的構建,首先根據業務需求構建本體,依賴已經標簽化的數據與本體映射完成圖譜的構建,根據數據內容和本體結構完成知識融合功能,最后將圖數據存儲。知識融合是知識管理中重要的步驟,主要是對實體消歧和對齊操作,將相同但表述不一致來源不一致的數據進行合并操作;知識服務,用戶在不同的業務場景中分別使用知識檢索、知識關聯和推薦、知識問答功能,將用戶輸入的信息與圖進行匹配,然后根據元數據的映射獲取關聯數據并對結果封裝返回。

2.3本體設計

根據老年教育過程中的教育資源進行分析建模,主要本體概念有教師、學員、課程、教學內容、活動、領域類目、活動場所及資訊等,根據其業務中的相關性設計教授、學習、關聯、參加、興趣等幾個關系。實現老年教育資源的本體建模。該模型基本涵蓋了主要的老年教育服務中不同領域實體的內在關聯特征,能夠支撐基礎教育資源內容管理和查詢功能。

3關鍵技術與系統實現

3.1關鍵技術

知識融合針對已經上傳的數據和映射的知識圖譜,根據知識融合的算法遍歷每一條數據,為提高知識融合計算的效率采用多線程的并發計算,利用Redis實現二級緩存的方式實現高性能計算。將多個線程正在計算的數據加入二級緩存,將已經過計算的數據加入一級緩存,將已計算未達到合并要求但是超過計算因子的數據合并成一個數據桶,進而減少數據計算量。

其中,閾值為根據相似度算法結果判斷是否將數據進行融合的值。計算因子為根據相似度算法結果判斷是否將數據與數據桶合并的值,其大小值為閾值×0.8。數據桶為相似度計算結果大于計算因子且小于閾值的數據集合。

獲取一條新數據首先向前遍歷所有數據桶的第一條數據,如果是第一條數據則直接創建一個數據桶,當計算結果大于閾值則直接融合,如果計算結果小于閾值而大于計算因子時,繼續遍歷數據桶內數據,如果計算結果全部大于計算因子小于閾值時則將新數據加入該數據桶。數據桶則使用Redis的list作為存儲結構,詳細的實現流程如圖4所示。

3.2系統實現

(1)數據錄入及知識構建

Client流程加載原始數據后,為數據構建標識和數據類別,然后將數據存儲。

Resolver獲取數據、解析數據獲取數據標識、判斷當前數據類型。根據設置的映射規則,通過規則生成該類型數據的元數據,每一類型數據只生成一條元數據,元數據的作用是指導圖數據找到并獲取自身數據。

ETL根據不同的數據類型,生成標注的圖數據存儲對象和存儲語句。若Redis緩存不存在該數據,則為其創建版本號進行管理;若存在,則在當前版本的基礎上增加一個版本。

Execute并發、批量執行圖存儲語句,同時將圖ID等信息同步到Redis緩存中。

(2)知識查詢

用戶輸入關鍵詞,首先對關鍵詞進行降噪處理,去除雜亂的特殊字符;然后進行分詞,從ES中獲得對應實體索引。獲取檢索規則,從Redis中獲取實體數據,并發執行檢索過程完成圖數據檢索。對每一類的圖數據,通過其元數據獲取原數據的存儲位置及存儲結果,通過關聯本體屬性獲取對應數據,完成檢索。在技術實現上,采用Pipeline設計模式,在Controller層組裝業務邏輯。通過4個Handler,完成關鍵實體及本體查詢、圖數據檢索、數據處理、獲取屬性數據并生成結構化文檔。

3.3系統效果

知識構建中的本體設計效果如圖7所示,通過可視化的方式更新和創建本體模型。

4結束語

基于知識圖譜的老年教育知識庫系統實現了對大規模、多領域的數據進行有效分析、管理和應用。通過知識圖譜技術對業務分析、針對不同類型的數據挖掘形成教育資源本體,涵蓋了學員、教師、課程、活動、領域、教學內容及活動場所等方面,聚合大規模數據形成知識圖譜,并根據不同的用戶角色提供不同權限的知識服務,實現知識檢索、知識更新、關聯查詢等功能,有效提高了老年教育過程中知識獲取效率,提高老年教育體驗。在知識圖譜的基礎上后續可持續地構建智能化的知識庫服務,在數據處理方面未來可集成自然語言處理算法實現對非結構化數據的信息自動化抽取,在知識服務方面逐步完成基于知識圖譜的用戶畫像、知識可視化分析等功能,不斷提升數據挖掘和分析能力。

參考文獻

[1]國務院辦公廳.《關于推進養老服務發展的意見》國辦發〔2019〕5號[R/OL][2019-4-16] http://www.gov.cn/zhengce/ content/2019-04/16/content_5383270.htm.

[2]姜泓冰.我國老年教育機構達6.2萬所[N].人民日報, 2018-04-12.

[3]高慧敏.數字化服務支持下社區老年教育初探———以云南省昆明市“916”數字養老社區為例[J].成人教育,2016,36(9): 65-68.

[4]續芳.微課納入老年遠程教育體系推動“互聯網+”時代老年教育供給側改革的研究[J].天津職業院校聯合學報,2019,21(4):93-96.

[5]陳艷莉.“互聯網+”背景下電大開展老年教育的推進策略———以常德電大為例[J].內蒙古電大學刊,2018(5):95-97.

[6]王琛琛,張睿,吳天剛.大學物理知識圖譜的構建及其在個性化教學中的應用[J].物理與工程,2020,30(5):76-81.

猜你喜歡
應用系統老年教育知識庫
我國機構知識庫內容質量服務探討
引導社會參與豐富老年教育形式研究
老年教育供給側改革與發展研究
VB應用技術下電教管理系統
高職學院信息化建設中面臨的問題和思考
基于微信公眾平臺的應用系統開發模式研究
淺談對老年計算機教育的幾點思考
企業云平臺建設研究
葫蘆島市城市人口老年教育問題調查研究及發展規劃
基于Lucene搜索引擎的研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合