?

基于知識圖譜實現企業文檔知識化管理研究

2019-01-06 02:19高靖宇楊俊劉園麗劉勇堅李緒平
中國科技縱橫 2019年22期
關鍵詞:知識管理知識圖譜

高靖宇 楊俊 劉園麗 劉勇堅 李緒平

摘 要:企業文檔資料越來越多,普遍存在保存困難,查找、使用不方便、知識管理難的問題。企業知識一般主要建立在企業文檔數據基礎上,通過信息關聯和處理,形成用以支持業務應用和領導決策的數據資源;知識圖譜的核心是建立實體與實體的關系,形成知識網絡。因此,將知識圖譜及相關技術應用到企業知識管理過程中,用于解決以上問題有重要意義。本課題是通過應用知識圖譜技術,在企業內部的文檔庫、數據庫的基礎上,構建企業知識圖譜,以支撐企業的搜索引擎、智能推薦、智能問答等方面,優化企業知識管理的用戶體驗,提高知識服務的準確性和便捷性。

關鍵詞:知識圖譜;知識管理;文檔智能管理

中圖分類號:X913 文獻標識碼:A 文章編號:1671-2064(2019)22-0241-02

0 引言

目前企業文檔管理主要使用FTP或云盤進行文件存儲,存儲類型較為單一,僅存儲了文檔、表格、圖片等文件類型;文檔應用較為簡單,只是進行查詢和下載;文檔之間關聯性較弱,無法通過分類或標簽將不同類型文檔關聯到一起;無文檔版本管理,僅通過創建日期或命名來判斷版本新舊,經常出現一個文件多個版本或版本應用錯誤的問題。隨著企業文檔的持續增加,在企業文檔管理中普遍存在文檔數量持續增長,造成保存困難;文檔版本管理混亂;資源協作共享困難;查找、使用不方便;知識資源閑置,安全缺乏保障等問題。如何建立文檔間信息的聯系,如何實現知識資源的融合共享,如何幫助用戶快速檢索和找到所需要的知識,并據此實現新知識的生產,以及應用到業務實踐中等,對現代企業越來越重要。企業知識一般主要建立在文檔數據基礎上,通過信息關聯和處理,形成用以支持業務應用和領導決策的數據資源;知識圖譜的核心是建立實體與實體的關系,形成知識網絡。因此,將知識圖譜及相關技術應用到企業知識管理過程中,用于解決以上問題有重要意義。

基于知識圖譜實現企業文檔知識化管理研究,是通過應用知識圖譜技術實現企業文檔知識化管理目標。在企業內部的文檔庫、數據庫的基礎上,構建企業知識圖譜,以支撐企業業務的創新與應用,改善企業知識管理和應用方式,提高企業知識開發與利用的便捷性和準確性,為最終實現“信息化智慧型企業”打下堅實基礎。

1 相關理論研究

知識圖譜概念最初來源于語義網絡,1956年由Richard H于最早提出;進入21世紀,Berners Lee提出了語義Web的概念。在此基礎上,谷歌公司在2012年提出“知識圖譜”概念,知識圖譜是一種描述實體之間關系的語義網絡,可以對現實世界的事物及其相互關系進行描述。谷歌當初主要目的是用于改善其搜索引擎的智能化水平,可以此為基礎構建新一代的智能化搜索引擎。目前知識圖譜技術已被互聯網企業用于各種大型的知識庫建設。

知識圖譜建立主要涉及三大關鍵技術:知識抽取、知識融合和知識加工。知識抽取過程包括:實體抽取、關系抽取以及屬性值抽取,知識抽取的的質量很大程度影響知識圖譜的生成質量。知識融合是通過實體關聯和知識并合,來消除知識中的概念歧義、錯誤和冗余,保證知識庫的建設質量。知識加工主要步驟包括:本體構建、知識推理和質量驗證,目的是通過計算與推理,豐富知識網絡體系。

2 企業知識圖譜構建

企業知識圖譜的構建,需首先梳通過對企業知識管理的現狀進行調研;梳理企業構建知識圖譜的數據來源、數據特征、數據流向及管理機制;了解企業知識開發利用中面臨的問題,以及企業知識管理需求;進一步明確建立企業知識圖譜的目標要求,并明確知識圖譜的具體應用場景(如圖1所示)。

2.1 數據獲取

首先需要明確知識的來源、類型、結構、存儲方式,企業知識一般主要來源于企業的工作文件、管理文件、技術文件等,以及信息系統等積累的數據,其中包括企業工作論壇和個人微博等。

2.2 知識抽取

知識抽取是從企業各種非結構化和半結構化的數據源中,提取出知識實體、屬性和實體關系,形成結構化的知識描述。

知識抽取主要過程包括:實體抽取、關系抽取和屬性抽取。實體抽取是指從文本數據中識別出命名實體;屬性抽取是識別出企業的機構、人員、設備、文檔等實體的屬性;關系抽取是抽取出實體與實體之間存在的關系,將分散的知識關聯起來。

2.3 知識融合

通過知識抽取后,獲得了知識單元實體、實體的關聯關系以及實體的屬性信息,但這些信息僅是知識碎片,散亂無章,有些知識碎片可能是錯誤碎片,并且各知識碎片間缺乏必要的層次和邏輯;那么如何解決這一問題,就需通過知識融合來解決。

知識融合,就是從文本中抽取得到的實體對象,鏈接到知識庫中其他相關的實體對象的操作,消除實體指稱項與實體對象之間的歧義,得到一系列基本的事實表達,并通過知識建模方式,將知識實體以一種結構化、規范化的方式組合成知識體系。

2.4 知識加工

從原始數據源中提取出了知識實體、實體關系與實體屬性等要素,并且經過知識融合得到一系列基本的事實表達,但事實表達并非是可利用的知識。還需進一步進行知識加工,才能最終獲得結構化、網絡化的知識體系。知識加工是通過本體抽取、知識推理和質量驗證等技術,進一步深度獲取知識間的關聯和邏輯關系,得到的知識網絡體系更加緊密和豐富。

2.5 知識更新

知識圖譜的內容更新有兩種方式:(1)全面更新:是以所有原始數據為輸入數據,重新開始構建全部知識圖譜。這種方法比較簡單,但對資源消耗大。(2)增量更新:以當前新增數據為輸入,向現有知識圖譜中添加新增知識。這種方式資源消耗小,但一般需要大量人工干預,實施組織比較困難。

2.6 知識應用

即通過知識應用技術的提升,對進一步挖掘知識應用潛力,擴展知識的應用范圍;同時將知識圖譜與移動通信、人工智能等新技術的結合,從多個層面深化和擴展企業知識應用場景。

3 基于知識圖譜的企業知識應用

企業知識應用目的對企業知識資源進行有效管理和利用,促進知識在企業內的順暢交換和分享,提升工作效率和服務質量,助力企業競爭力提升。結合大數據分析、人工智能等新技術,在企業知識圖譜的基礎上,可實現知識的智能搜索、智能推薦、不一致性驗證、異常分析、智能問答、決策支持等創新應用。

3.1 智能搜索

智能搜索是知識圖譜最為典型的應用場景,谷歌最初提出知識圖譜技術就是應用于搜索引擎。也是自動給出與相關事物相關的搜索結果,并構建事物關系圖,查看更多維度的數據。

3.2 智能推薦

智能推薦是將不同的業務知識精準推薦到企業員工,促進企業內部知識的傳播與流通,是一種智能化的企業知識傳播方式。在企業內部,主要應用場景包括:(1)場景化推薦;(2)任務型推薦;(3)跨領域的推薦。

3.3 不一致性驗證

通過知識關系的推理,對信息的不一致性進行驗證,類似交叉驗證,盡量避免錯誤信息傳播和使用。

3.4 異常分析

異常分析包括靜態分析和動態分析。靜態分析:給定一個知識結構和某個時間點,從中去發現一些異常點。動態分析:分析其結構隨時間變化的趨勢。假設短時間內知識圖譜結構的變化不會太大,如果它的變化很大,就說明可能存在異常,需要進一步的關注和提醒。

3.5 智能問答系統

智能問答系統是基于傳統的信息檢索技術基礎上,結合知識圖譜技術,能夠為用戶提供準確簡潔的問題解答。目前很多問答平臺引入了知識圖譜,如國內百度公司研發的小度機器人,專門為各類互聯網平臺提供智能問答解決方案。

3.6 決策支持

基于企業知識圖譜,信息系統將相關決策支持知識,智能地與企業的生產計劃、執行調度和流程審批等決策點關聯起來,以支持或輔助決策。借助知識圖譜可及時感知市場新的關系和變化,例如通過知識圖譜對市場的變化進行智能檢測,幫助企業管理者及時發現市場變化和產品趨勢,及時采取措施。

4 結語

事實上,基于知識圖譜的企業知識應用遠不止于此。整個企業與其外部世界就是一張巨大的知識圖譜,是無數個實體關系對,近年來企業界對圖數據庫、知識圖譜的巨大應用價值給予越來越多的關注。識圖譜目前在新聞、金融、司法等領域的應用比較成功,在企業知識管理中的應用比較鮮見。本文雖然提出了基于知識圖譜實現企業文檔知識化建設思路和方法,并對其應用場景進行了探討,但研究仍然還不夠全面與深入,需要進一步在實踐中持續改進和完善。

參考文獻

[1] 彭鑫.基于知識管理的企業知識圖譜構建研究[D].武漢:武漢大學,2018.

[2] 曹倩,等.知識圖譜的技術實現流程及相關應用[J].北京:情報理論與實踐,2015(12):131-136.

[3] 劉嶠,等.知識圖譜構建技術綜述[J].北京:計算機研究與發展,2016(3):582-600.

[4] 趙宇.知識圖譜自動演進算法研究[D].北京:北京郵電大學,2017.

[5] 聶莉莉.概述知識圖譜在人工智能中的應用[J].北京:醫學信息學,2018(06):11-16.

猜你喜歡
知識管理知識圖譜
基于知識管理的高校圖書館管理創新
提升企業知識管理能力 增強企業的強勁發展態勢
從《ET&S》與《電化教育研究》對比分析中管窺教育技術發展
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合