?

經方小程序知識圖譜的構建及應用

2023-07-21 11:02黃英璇謝潤昕
計算機應用文摘·觸控 2023年14期
關鍵詞:知識圖譜

黃英璇 謝潤昕

摘 要 文章基于中醫經方構建知識圖譜 搭建信息檢索 智能問診系統 以圖的形式對經方進行計量和可視化分析 為小程序用戶提供更加精準詳細的經方信息 首先 探討了知識圖譜的基礎理論與構建技術 其次 采用人工標引的方法 對經方中的語義實體進行提取 對語義關系進行梳理 利用python對形成的邏輯數據進行處理 并基于neo4j 構建知識圖譜 最后 在neo4j 圖數據庫中 定義了經方 病癥 癥狀 藥材 體質5 大實體 形成了 12種概念類型以及13 種概念間關系及其約束規則包含 412個節點和805 條關系 實現了中醫經方知識圖譜的初步構建及智能檢索 結果表明 結合neo4j圖數據庫技術構建中醫經方知識圖譜具有直觀 高效的特點 便于小程序進行中醫藥知識智能化服務以及經方推薦

關鍵詞 中醫藥經方 知識圖譜 語義關系

中圖法分類號r197 文獻標識碼a

1 引言

中醫藥知識是中華民族世代傳承的醫藥知識,是民族智慧的結晶,具有獨特的哲學基礎、基本理論體系、診療實踐和教學模式,以及研究范式。傳統的中醫藥傳承多屬于個體傳授,在中醫傳承的過程中老中醫的臨床經驗、診療能力及技巧只有一部分可通過語言、文字、圖像、符號等顯性知識方式表達出來,更多的隱性知識因其難以表達而不容易傳承[1] 。在中醫藥知識傳承方面,通過現代信息技術手段來對顯性和隱性知識進行知識管理,從一定程度上能對中醫知識進行深度挖掘,發揮中醫知識的價值。所謂顯性知識,就是指已經存在的方藥、典籍以及其他已經編碼的中醫藥知識,本文將對顯性知識進行知識圖譜的構建及應用[2] 。

作為人工智能的一個分支,知識圖譜相關技術近年來取得突破性進展,使得傳統知識表示和推理技術有了落腳點[3] ,其在互聯網等各大領域均有滲透且成果顯著。本文根據黃煌《經方使用手冊》開發微信經方小程序,應用知識圖譜來構建中醫經方的百科系統,搭建信息檢索、智能問診系統,以圖的形式對經方進行計量和可視化分析,為小程序用戶提供更加精準詳細的經方信息。

2 經方知識圖譜的設計與構建

2.1 本體層構建

知識圖譜的構建是形成知識體系邏輯結構的重要環節,包括本體層構建和數據填充2 部分。本文采用自頂向下和自底向上相結合的構建方法,依次經過模式圖定義、知識抽取、知識融合3 個步驟完成基礎知識庫的構建[4] 。模式圖包含知識庫的概念、概念的屬性,以及概念之間的層次關系。在經方數據庫中,定義了5 個實體,包括經方、病癥、癥狀、藥材、體質;形成了12 種概念類型,包括經方、疾病、體質、病因病機、先天稟賦、后天調養、環境因素、面象、舌象、脈象、癥狀、藥材,形成了13 種概念間關系及其約束規則。構建經方本體12 種、語義關系13種,經方知識圖譜本體層框架如圖1 所示。

2.2 數據層處理

2.2.1 知識獲取

本文對中國知網、萬方數據知識服務平臺、維普資訊中文期刊服務平臺、中醫草藥網站進行檢索,設置主題詞為“中醫經方”“體質”“草藥”。同時,收集黃煌關于中醫體質與經方的著作和中醫體質學教材,并整理黃煌會議演講稿、訪談稿以及門診病例,共同構成經方知識圖譜相關知識的資料來源。本文對黃煌先生整理的《十大類方》《經方使用手冊》進行考證,校對整理電子文本,并上傳到已有的數據庫。根據知識圖譜模式層設計要求從知識元中提取語義實體并建立語義關聯,要求是盡量遵循原文直接提取,對于助詞、連詞、形容詞等無實際意義的詞匯則不予提取。例如,《經方使用手冊》中描述的當歸芍藥散“婦人腹中痛,或浮腫,或冒眩,或頭痛,或自下利,或月經不調者?!?提取“腹痛” “目?!?“頭痛” “月經不調”“自下利”為癥狀表現語義;當歸芍藥散為經方語義,并建立經方與癥狀關系。癥狀語義提取圖如圖2所示。

2.2.2 知識抽取存儲

根據經方知識圖譜本體層框架,采用人工標注的方法對獲取的非結構化文本資料進行結構化處理,抽取實體、語義關系、屬性等關鍵信息并保存。本文使用Neo4j 圖數據庫軟件對上述結構化數據進行知識存儲,該軟件以節點表示實體,以標簽表示實體類別,以邊表示實體與實體之間的相互關系,并以三元組的形式構建實體與實體間的聯系。將數據導出為半結構化的json 格式,再使用Python 將其轉化為csv 文件。即根據不同的csv 文件設置不同的lavel,再將其中的“經方名” 提取為節點名稱name,以構成節點Node<label,name>。例如,小柴胡湯節點<fang,小柴胡湯>, 而后, 將“ 關系” 作為實體間的關系Relationship<經方名,藥材名,關系>,如經方藥材關系<補中益氣湯,人參,成分>。最后,使用Neo4j 數據庫將各個csv 文件導入數據,完成知識圖譜的構建。本文構建的知識圖譜共包含經方節點87 個,癥狀節點207 個,藥材節點118 個以及805 條邊。知識圖譜展示圖如圖3 所示。

3 經方知識圖譜的檢索

Neo4j 將數據存儲在網絡結構中,這種形式能夠隨時添加或更改數據,且無論節點或關系的數量或深度如何,都能確保處理過程的零延遲和實時性能,特別適合路徑查詢與模式發現。Neo4j 圖數據庫內設有專屬Cypher 語言,可以對數據進行創建、查詢、更新、刪除等操作,亦可構建出更為高級的查詢語句而無需編寫復雜代碼即可實現對語義實體及語義關系的檢索及可視化展示[5] ?;冢危澹铮矗?知識圖譜的小程序設計,中醫經方的邏輯數據以“病脈證并治”的形式儲存在知識圖譜中,計算機便能以該形式對用戶的提問搜索進行推理并返回結果。

首先,計算機從用戶的搜索問題中提取關鍵詞并判斷問題類型,通過模式串匹配的方式,找出問題中的實體詞,利用AC 自動機優化模式串匹配,以提高匹配的速度。匹配的具體過程為從圖數據庫中提取所有相關實體詞,構建AC 自動機,將輸入的問題作為主串、AC 自動機作為模式串進行匹配,匹配主串中存在的實體詞,并將匹配的實體詞標簽和疑問詞標簽進行組合,以判斷問題的類型。其次,將問題轉化為CQL 語句,不同的問題類型,其轉化的方式不同。最后,根據CQL 語句返回結果并輸出答案。利用Neo4j 圖數據庫進行檢索,以及使用計算機模擬醫生的診療邏輯,通過數據推理直接給出用戶想要的答案,使經方的知識服務更便捷、高效,由此實現輸入幾個癥狀,便可返回可用于治療的經方,同時包含經方藥材的劑量等。例如,當輸入“惡寒” “發熱” 等癥狀表現時,計算機會根據數據庫內容給出答案。針對該癥狀,可用“大青龍湯”“附子湯”等治療調理,實現為用戶提供更準確經方信息的功能。

4 結束語

本文將經方數據轉化為邏輯數據并利用Neo4j 構建知識圖譜,初步實現了經方智能檢索的應用?;诮浄街R圖譜,小程序可以實現口語化語言的輸入,根據關鍵字進行句式模板匹配,根據一定的匹配原則,產生相應的查詢語句,在已有的經方知識庫中檢索需要的經方,以提供給用戶使用。

參考文獻:

[1] 范宇鵬,毛煒,呂玉波,等.從隱性知識管理角度探討名醫工作室在中醫傳承工作中的作用[J].中醫藥管理雜志,2009(3):3.

[2] 劉中英,張英娟.探討知識管理在中醫傳承發展中的作用[J].價值工程,2012,31(16):316.

[3] 王昊奮,漆桂林,陳華鈞.《知識圖譜:方法、實踐與應用》[J].自動化博覽,2020,37(1):7.

[4] 陳可佳,馮子恩,劉羿,等.基于知識圖譜的急診問答系統構建方法[P].中國,CN111191048B,2023?06?02.

[5] 王余藍.圖形數據庫NEO4J 的內嵌式應用研究[J].現代電子技術,2012,35(22):36?38.

作者簡介:

黃英璇(2002—),本科,研究方向:信息管理與信息系統。

猜你喜歡
知識圖譜
國內外智庫研究態勢知識圖譜對比分析
國內信息素養研究的知識圖譜分析
國內圖書館嵌入式服務研究主題分析
國內外政府信息公開研究的脈絡、流派與趨勢
基于知識圖譜的產業集群創新績效可視化分析
基于知識圖譜的產業集群創新績效可視化分析
基于知識圖譜的智慧教育研究熱點與趨勢分析
國內酒店品牌管理研究進展的可視化分析
從《ET&S》與《電化教育研究》對比分析中管窺教育技術發展
專家知識圖譜構建研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合