?

巴蜀中醫藥古籍醫案數據挖掘系統構建及應用

2015-09-19 20:49聶佳任玉蘭江蓉星許霞
中國中醫藥圖書情報 2015年4期
關鍵詞:醫案巴蜀古籍

聶佳 任玉蘭 江蓉星 許霞

摘要:中醫藥古籍是中醫藥傳承發展寶貴的知識財富,巴蜀中醫藥古籍特色突出。承載醫家豐富理論和臨床經驗的醫案,是知識發現不可或缺的研究對象。構建基于關聯規則方法分析的巴蜀中醫藥古籍醫案數據挖掘系統,不僅能深入研究巴蜀中醫藥學術流派的特色,亦能為中醫藥古籍數據挖掘系統開發和應用提供有效的支持。

關鍵詞:巴蜀;中醫藥;古籍;醫案;數據挖掘系統;構建

巴蜀地區獨特的地理和文化環境,造就了一批在傳統中醫藥方面卓有成就的名醫大家,如北宋的唐慎微、清代的齊秉慧等,尤其在中醫診療、方藥方面特色突出,給后人留下了寶貴的醫案記錄,為祖國的醫藥事業繼承和發展作出了不朽的貢獻。本研究基于所收集1063部巴蜀中醫藥古籍中醫案的特點,利用現代計算機技術,構建數據挖掘系統,旨在深層次發現巴蜀歷代醫家辨證論治的知識信息,發揚巴蜀中醫藥文化。

1.數據挖掘系統構建

1.1總體思路

數據挖掘能從大量的、不完全的、有噪聲的、模糊的、隨機的數據集中提取有效的、新穎的、潛在有用的知識和規律,具有處理海量模糊性、非線性數據及知識發現的優勢。本研究以中醫藥古籍資源的分析利用和知識發現為目的,在試驗相關數據挖掘技術特點和適用性基礎上,結合巴蜀中醫藥名家診治思路和特點,探索性地建立了基于關聯規則的辨證施治、用藥規律挖掘模型,并驗證了其可行性,建立符合中醫臨床規律的數據分析方法,建造巴蜀中醫藥古籍數據挖掘的計算機模型。

1.2主要構建步驟

構建步驟共兩部分。第一部分先明確研究需要,定義研究數據,將原始數據通過數據轉換、加工等數據預處理方式,抽取正確可靠的數據,構建多維的數據倉庫挖掘模型;第二部分即根據不同的查詢條件進行數據挖掘,根據研究需要,選用恰當的數據挖掘算法,計算出滿足條件的模式集合,以數據條形式表達出來,調整參數進行模式篩選,通過挖掘前臺系統向導進行數據挖掘操作,將數據挖據信息以關聯規則形式展現給用戶,總過程如圖1所示。

1.2.1數據的轉換和加工 從數據源中抽取的數據不一定完全滿足目的庫的要求,例如數據格式的不一致、數據輸入錯誤、數據不完整等,因此有必要對抽取出的數據進行數據轉換和加工,包括數據過濾、數據清洗、數據替換、數據計算、數據驗證、數據加解密、數據合并、數據拆分等。本研究根據抽取數據的特點進行數據轉換和加工研究,主要包括數據清洗、噪音處理、數據規范。

1.2.1.1缺失值的處理 在中醫處方信息中,有時會出現期望有數據的地方卻沒有數據的情況,如對臨床決策有重要價值的藥量等數據的缺失。針對數據的特點和對決策意義的不同,采用不同的缺失值填充算法,補充缺失數據。如針對樹脂類數據,缺失值采用平均值填充法。

1.2.1.2噪音數據的處理 主要指針對一詞多義、多詞一義、詞義模糊、詞義交叉或涵蓋等噪音數據進行處理。處理方法主要是根據《中華人民共和國藥典》《中醫診斷術語標準》《中醫證候鑒別診斷學》《中醫癥狀鑒別診斷學》《中藥學》《方劑學》等標準進行刪除或規范處理。

1.2.1.3藥物名稱的規范處理 針對處方中對藥物的描述存在大量異藥同名、同藥異名等現象,本研究采用改進的編輯距離算法,對數學名稱進行自動化、智能化的規范處理。規范處理過程通過兩級數據規范實現。

1.2.1.4癥狀名稱的規范 中醫古籍文獻對癥狀的描述常存在不規范性,多表現為癥狀名稱不標準以及癥狀表述的模糊性。為了使系統可以正確處理對癥狀的描述,本研究根據癥狀規范采用改進的編輯距離算法,對癥狀進行自動化、智能化的規范處理。規范過程與藥物規范一致。

1.2.2數據倉庫的實施 構建巴蜀中醫藥古籍數據倉庫的目標數據庫由藥物表、癥狀表、疾病表等構成。數據庫中各表根據情況向下細化到不能分解的原數據。各表之間的數據可以借助外鍵建立聯系,從而形成一個龐大的中醫體系結構。

1.2.3建造數據挖掘模型 為了從多個維度、不同概念層次對藥物運用規律進行漸進分析,本項目基于中醫數據存在復雜冠詞,結合關聯規則建立了癥候關聯、藥物配伍等挖掘模型。

1.2.4數據挖掘 運用多維關聯規則分析在不同維度下癥狀、證候、藥物的頻次和支持度,提取中醫某一疾病的多發癥狀、證候及治療所需常用藥物;運用關聯規則分析的頻繁項集分析中醫醫案中癥狀與證候、藥物與藥物等的配伍規律,計算癥狀、證候、藥物項集的支持度和置信度,提取常用二元或者多元癥狀、證候、藥物配伍;采用多維關聯規則挖掘算法分析中醫辨證思路、處方選藥規律,分析不同年代、出處、文獻類型等條件下辨證論治規律。

2.應用示范

2.1功能界面操作

用戶通過用戶名和密碼登錄巴蜀中醫藥數據挖掘系統,進入數據挖掘操作界面,見圖2。首先選擇“導入數據”選項,在目標文件中選擇準備數據挖掘的源數據,導入數據挖掘系統,然后根據研究需要,分別選擇藥物關聯、癥候關聯(癥狀與證候關聯)等選項,實現疾病與藥物、病因與癥狀等之間的關聯規則分析,達到數據挖掘的目的。

2.2藥物關聯分析展示

以《圣余醫案》為例,導入所要進行數據挖掘的源數據,點擊“藥物關聯分析”按鈕,在病名下拉選項中選擇“咳嗽”,在藥物復選框中選中“全部藥物”,在支持度和置信度選項中選擇0.5,點擊“數據挖掘分析”按鈕,顯示出如下結果。見表1。

從表1中可以看出,在《圣余醫案》中治療咳嗽所用的藥物配伍組合,支持度和置信度>50%的共有12條數據。其中,半夏與白術組合的支持度為78.95%,置信度為100.00%。說明該書記載咳嗽病醫案中,半夏和白術同時出現的頻率為78.95%;而當半夏或白術二者其中一味出現時,另一味中藥出現的概率為100.00%??梢?,在《圣余醫案》中,醫家治療咳嗽時,半夏與白術是常用藥對,而且其單味藥使用頻率也是最高,均為15。半夏燥濕化痰、降逆止嘔,白術健脾益氣、燥濕利水,二者伍用倍增鎮咳化痰之功。

3.體會

本研究引進現代計算機技術,針對巴蜀中醫藥古籍醫案,探索性地構建基于關聯規則方法分析的數據挖掘系統,以期為中醫藥古籍數據挖掘系統的開發和應用提供有效的支持。關聯規則是中醫藥領域數據挖掘研究常用的方法,對于蘊含豐富的理論知識和實踐經驗的中醫藥古籍而言,應嘗試不同的方法,多角度發現知識。將數據挖掘技術應用于不同種類的中醫藥古籍,將是下一步研究工作的重點。

猜你喜歡
醫案巴蜀古籍
青年共建“雙城圈” 攝影同話“巴蜀情”
曲韻巴蜀話發展 藝薈雙城譜新篇
川渝兩地攜手共建“巴蜀電影聯盟” 聯合打造巴蜀特色電影
巴蜀文化翰墨第七屆詩書畫印藝術展作品
西藏大批珍貴藏文古籍實現“云閱讀”
古籍修復師的巧手與匠心
江蘇完成九成以上古籍普查
以關節炎為首發癥狀的結節病1例
類風濕關節炎并寰樞關節脫位死亡1例并文獻復習
譚波診治腦中風恢復期驗案2則
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合