?

基于數據挖掘的消化系統疾病藏醫用藥規律研究

2023-05-29 09:24劉鴻譚穎肖宗朋
電子技術與軟件工程 2023年7期
關鍵詞:方劑醫藥數據挖掘

劉鴻 譚穎 肖宗朋

(1.黔南民族職業技術學院 貴州省都勻市 58000)(2.西南民族大學計算機科學與工程學院 四川省成都市 610000)

藏醫藥學作為世界四大傳統醫學之一,不僅以青藏高原自身醫學理論與實踐為基礎,還吸收了中醫學、印度醫學等醫學精華,是具有完整理論基礎的少數民族傳統醫學體系。但極具民族特色的醫學理論與晦澀難懂的藏醫文獻,阻擋了藏醫藥學的推廣。為方便研究人員能根據個人需要對傳統藏醫藥方劑進行查詢與使用,本研究利用現代信息技術,收集、整理經典的藏醫藥方劑與藥材信息,將其存儲在關系型數據庫中,實現藏醫藥方劑、藥材信息的數字化存儲,實現信息資源共享。

消化系統是人體最大的免疫和內分泌器官, 為所有飲食必經的要道, 因此易受到病原的侵犯。在當今社會,很多人受工作影響,無法按時吃飯休息,使消化系統承受了巨大的壓力,發生在胃腸道的疾病也在不斷增加。而藏醫藥學注重人的整體調和,內外平衡以求達到療效,對于消化系統方面的常見病、慢性病及疑難雜病的診療具有自己的特色和優勢。由于藏醫復方成分往往多達數十位藥材,因此本研究將依靠數據挖掘技術尋找其中的核心處方,以期發現傳統藏醫藥方劑的用藥配伍規律。

1 材料和方法

1.1 數據來源

本研究主要收集并整理藏醫藥相關數據資料,包括《晶珠本草》、《藍琉璃》、《妙音本草》等藏藥經典著作,參考《中國藏藥材大全》[1]、《藏藥方劑寶庫》[2]對其內容進行整理歸類,并對收集到的數據進行規范化,方劑及藥材數據中的藥物名稱均參考《中華本草?藏藥卷》和《四川省藏藥材標準》2014 版進行統一。

1.2 數據初步錄入

通過前期的文獻收集與整理工作,我們發現藏藥制劑的主治十分廣泛, 一個制劑往往可以治療多個系統疾病。在疾病描述方面,多參照現代醫學知識體系。疾病信息主要按照生理系統性疾病進行分類,例如消化系統疾病、呼吸系統疾病、循環系統疾病等[3]。為方便保存整理成果及為后續研究提供參考,本研究搭建了“藏醫藥傳統方劑藥材數據庫”,并使用SQL Sever 軟件進行數據的存儲與后臺管理工作。

1.3 數據分析

1.3.1 數據預處理與頻數統計

為保證后續數據挖掘工作能順利開展,需對數據進行預處理。首先將方劑數據根據其主治的病名和癥狀屬性按照生理系統性疾病進行分類。此外,數據庫為保證文獻記載的全面和準確性,保留了其中的描述性文字,因此在數據預處理時需對文本內容進行抽取。在處理過程中,部分方劑中出現的輔助藥物或食材,如茶、白糖、生米等不再計入統計;將方劑組成中出現的“各適量”、“各等量”、“g”、“握”等詞都刪除,使非結構化數據轉化為結構化數據。

根據藏醫治療消化系統疾病的441 個記載在冊的方劑,使用SPSS 軟件統計出方劑中藥物的使用頻率。取出排名前30 的藥物作為高頻藥物,根據藏醫藥學的藥材性味理論,整理藥材的“六味”、“三化味”及“十七效”等信息。

1.3.2 關聯規則

關聯規則主要反映事物之間的關聯性,目前常用于傳統醫藥領域,主要是從大量且復雜的傳統醫藥信息中發掘不同數據集之間潛在的聯系,常見于方劑配伍規律的研究等。關聯規則的興趣度由其支持度(support)和置信度(confidence)來度量,它們分別反映規則的有用性和確定性。在用藥規律挖掘中,支持度是指所有藥物組合中同時出現兩味或者多味藥材組合的概率;置信度則是在某一藥材出現的條件下,另一藥物出現的概率。同時滿足最小支持度閾值和最小置信度閾值的規則稱為強關聯規則。

Apriori 算法是挖掘布爾關聯規則頻繁項集的經典算法,其最大的優勢是算法流程簡單直觀,原理易于理解。Apriori 算法挖掘過程主要包含兩個階段:第一階段采用逐層搜索的迭代方法,從數據集中找出所有的頻繁項集,即項集出現的次數至少與預定義的最小支持計數一樣;第二階段再從這些頻繁項集中產生強關聯規則,這些規則必須同時滿足最小支持度和最小置信度[4]。

本研究首先通過頻數統計得到治療消化系統疾病的方劑中使用頻率較高的藥物及其藥味藥性特點,并計算出頻率。借助SPSS Modeler18.0 軟件,使用Apriori 算法對高頻藥物進行關聯規則挖掘,發現核心藥對和配藥組合,并繪制關聯網絡圖。

1.3.3 因子分析

因子分析是通過研究很多變量間的相關系數矩陣,將變量間復雜的關系劃分為少數的幾個綜合因子,并可以據此對所有變量進行分類的一種統計分析方法。通過這種方法,可以從許多變量中找出隱藏的具有代表性的因子,即把相關性高的變量歸入一個因子,不僅可以將變量數目減少,還能檢驗對變量間關系的假設。在本研究中通過因子分析法對高頻藥物進行歸類,從而發掘不同藏藥類群的主要特性[5]。

袁安十六歲,李離、吳耕十五,上官星雨最小,十四歲。他們在華陰縣下的一個破廟里結拜成兄妹,袁安年長,堪堪成了大哥。

首先取出排名靠前的前30 味藥物,將每一味藥物作為變量,每個方劑作為個體進行統計,其中方劑中含有該藥物記為1,沒有則記為0,為因子分析做準備,使用SPSS Statistics22.0 軟件對整理完畢的高頻藥物數據矩陣進行因子分析[6]。

2 結果

2.1 藏醫藥傳統方劑藥材數據庫

藏醫藥傳統方劑藥材數據庫共收錄了4499 首單驗方,以及752 種藥材信息,15 類系統疾病類別以及233種疾病與癥狀名。實現了傳統文獻向現代數字化的轉變,保障了傳統文獻的存儲和傳承,也為后續的數據挖掘研究提供了有效的數據來源。

2.2 針對消化系統疾病的藏醫用藥規律的數據挖掘

2.2.1 頻數統計分析

藏醫藥傳統方劑藥材數據庫中存有治療消化系統疾病方劑有441 首,總計使用藥物310 種,用藥頻次3207味,通過SPSS 軟件得到用藥頻次排名前30 味藏藥。根據統計結果顯示,藏醫治療消化系統疾病的前30 味藥物中,使用頻次為1826 次,占總體使用的50%以上,十分具有代表性。因此,統計整理了使用頻率前30 味藥物的性味信息,藥材六味中辛味的出現頻數最多,藏醫學中的三化味是指患者服用藥物后,在體內經吸收后其原來的藥味發生變化,最終轉化為甘、酸、苦三味,經統計,苦味頻率最高,其次為甘味。藏藥的十七效作為藏醫遣藥組方的理論基礎,對臨床用藥有著極大的影響,對此統計結果顯示溫性藥物最多,出現頻率高達28.4%,其次為輕、銳性藥物,如表1、表2、表3 所示。

表1:使用頻率前30 味藥物的六味統計

表2:使用頻率前30 味藥物的三化味統計

表3:使用頻率前30 味藥物的十七效統計

2.2.2 關聯規則

針對頻數統計的結果,將高頻藥物數據導入至SPSS Modeler18.0 軟件中,選擇Apriori 算法模型,構建數據流,設最低條件支持度為10,最小規則置信度為75%,為了發現核心藥對,將最大前項數設為1,發掘兩種中藥之間的關聯規則,得到4 條藥對關聯規則,如表4 所示。為發現藥味數更多的藥物搭配關聯規則,同樣選擇Apriori 算法模型進行分析,設最低條件支持度仍為10,最小規則置信度改為80%,最大前項數設為5,得到4 條三種藥物間的關聯規則,如表5 所示。

表4:消化系統疾病高頻藥對關聯規則表

表5:消化系統疾病高頻藥物組合關聯規則表

2.2.3 因子分析

進行因子分析前,應通過KMO 檢驗與Bartlett 球形檢驗判斷數據是否適合進行因子分析,高頻藥物的數據經檢驗后顯示,KMO 值為0.624>0.5,Bartlett 球形檢驗的卡方值為2922.182,自由度為435,顯著性Sig=.000<0.05,測試值均符合,適合做因子分析。

運用主成分分析法提取公因子,發現前11 個主成分對總方差的累積貢獻率達到了64.363%,包含大部分信息,因此提取前11 個主成分,并選擇最大正交旋轉法,將11 個公因子旋轉后,得到其載荷矩陣,其中將載荷系數絕對值大于0.5 的變量全部取出[7-9],其結果如表6所示。

表6:消化系統疾病高頻用藥載荷系數表

3 分析與總結

本次研究通過收集整理傳統的藏醫藥藥材和方劑信息,將數據按統一標準進行規范化處理,并使用SQL Sever 對其進行數字化存儲和管理,建立了藏醫藥傳統方劑藥材數據庫。不僅有利于傳統文獻的保存,也便于研究人員深度挖掘藏醫藥的用藥原理和配伍規律。

為了推動藏醫藥在消化系統疾病方面的研究,本研究借助數據挖掘的算法發現其傳統文獻記載的藥方中隱含的配伍規律。首先對方劑中的藥材及其藥味等進行頻數統計,我們發現治療消化系統疾病的方劑中前三十味高頻藥材中辛味藥材最多,其次為苦味和甘味,辛味藥物具有增生胃溫,健胃消積,驅殺腸胃中的寄生蟲等功效,可用于胃寒、消化不良、不思飲食等病癥。甘味藥材有滋補強身的功能,對食道阻塞等病較為有效,苦味藥物主要有開胃、驅蟲、止渴、清熱解毒等功效。對頻數較高的常用藏藥功能進行分類,蓽茇、光明鹽、干姜、白豆蔻、胡椒、肉桂等藥多有溫中散寒、恢復脾陽溫煦功能,主治寒性培根病、隆病等癥;石榴、訶子、小米辣、阿魏等藥多用于提升胃陽、助消化;紅花、巖精、甘青青蘭、小葉杜鵑、甘青烏頭等藥多用于清熱瀉下;紫硇砂、堿花、鐵線蓮等藥多用于理氣通便、消脹。

從關聯分析的結果可以看出,從藥對到角藥搭配中,石榴的出現頻率最高,根據藏醫的三因學說和君臣佐使的配藥思想,治療消化系統疾病的方劑中,石榴多為君藥,有健胃消食的作用;蓽茇、白豆蔻、肉桂為臣藥,共奏溫中行氣、化滯除濕的作用,對脾胃虛寒等寒癥效果顯著;紅花可為佐藥,活血化瘀,可對消化道的供血功能進行調理。

對高頻藥物進一步展開因子分析,可以得出傳統文獻記載的方劑中包含的遣方思路。公因子F1 的組方藥物與關聯規則分析的結果相似,因此其組方思路不多做贅述;公因子F2 以清熱瀉下、消除壅滯為主;公因子F3 主要起清熱疏肝的功效、公因子F4 主要提升胃溫、F5 以溫中散寒為主;F6 主要是清熱止瀉;F7 則以行氣止痛、提胃陽為主;F8 則是清熱滋補、活血的功效;F9 為除寒健胃;F10 可殺蟲解毒、消積利便;F11 體現了健胃消食、強體壯肌為主的遣方思路。

本文使用多種數據挖掘技術,分析藏醫藥傳統方劑治療消化系統疾病的用藥規律,可以發現其核心藥物搭配與隱含的組方思路。該研究對發掘方劑中的用藥規律以及優化藥方有較大的意義。

猜你喜歡
方劑醫藥數據挖掘
中藥方劑在治療黃褐斑中的應用
《金匱要略》黃芪類方劑探析
論方劑的配伍環境
傳統醫藥類非遺
基于并行計算的大數據挖掘在電網中的應用
甘草在方劑中的作用及配伍規律
醫藥下一個十年 創新為王
一種基于Hadoop的大數據挖掘云服務及應用
《中國當代醫藥》來稿要求
《中國當代醫藥》來稿要求
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合