?

基于CNKI 的中醫藥領域網絡藥理學知識圖譜分析*

2024-02-22 05:27鄒孟龍黃曉燕陳雅璐
西部中醫藥 2024年2期
關鍵詞:圖譜聚類中醫藥

鄒孟龍,黃曉燕,陳雅璐,寧 芯

1 湖南中醫藥大學,湖南 長沙 410208; 2 廣西中醫藥大學第一附屬醫院,廣西 南寧 530023

中藥是以中醫基礎理論為指導方向,臨床用于防治疾病的藥物的總稱。中藥已在我國發展了數千年,是祖先智慧的結晶,已經形成獨特的治療體系。近年來,中醫藥快速發展,在許多疑難雜癥中發揮了重要作用。然而,如何使中醫藥走向現代化是目前亟待解決的問題。眾所周知,中藥通過多成分、多靶點、多通路相互作用而發揮防治疾病的作用。因此,通過藥物活性成分與作用靶點的相互作用網絡揭示中藥防治疾病的分子機制是促進中藥走向現代化的重要方法之一。

網絡藥理學(Network pharmacology,NP)是通過聯合計算模擬與實驗數據挖掘技術,整合大量信息,以探索藥物作用靶點和分子機制的研究方法[1]。NP 揭示“中藥-活性成分-基因靶點-疾病”相互作用的復雜網絡,通過復雜網絡預測藥物的作用機制[2]。運用NP的研究思路探索中藥的本質屬性,揭示中醫藥多成分、多靶點、多通路的整體效應,這在中醫藥走向現代化的進程中發揮著重要作用。近年來,隨著組學分析、高通量篩選等技術的逐漸成熟,為疾病數據庫的構建提供了大量信息,NP 在中醫藥領域的相關文獻同樣逐年增長[3]。采用文獻計量學的研究方法分析NP在中醫藥領域的發文情況,對該領域具有重要指導意義。

陳超美教授借助Java語言研發的CiteSpace軟件主要用于分析文獻中含有的潛在知識[4-6]。CiteSpace軟件可以繪制不同類型的知識圖譜,將大量文獻信息進行可視化,目前已成為最流行的文獻計量分析軟件之一[7-9]。本研究運用CiteSpace軟件分析NP 在中醫藥領域的發文量、作者分布、機構分布、關鍵詞共現、關鍵詞聚類、關鍵詞突現等情況,為中醫學者準確、及時且快速把握NP 在中醫藥領域的研究現狀及發展趨勢提供參考,促進NP在中醫藥領域的后續發展。

1 資料與方法

數據來源于中國知網(CNKI)。檢索步驟為:主題詞欄輸入“網絡藥理學”,時間設為建庫至2021 年2 月28 日,資源類型選擇“學術期刊”,知識導航欄選擇“中醫學、中藥學”。初步檢索獲得2872 篇相關文獻,閱讀文獻題目及摘要,刪除通知、廣告、與主題明顯不符等文獻,將文獻以“Refworks”格式導出,借助CiteSpac(e版本5.7.R2)軟件刪除重復文獻,最終獲得文獻2474 篇。具體流程見圖1。

圖1 文獻篩選流程圖

2 結果

2.1 發表文獻數量NP 在中醫藥領域的發展趨勢可初步分為三個階段。第一階段:2006 年中醫藥領域開始出現NP 的相關文獻,2006 年至2011年發展非常緩慢,這表明在該階段NP 幾乎沒有引起我國中醫學者的關注;第二階段:2012 年至2017年,發文量逐年增長,年均56篇,這表明在該階段NP 逐漸引起中醫學者們的關注;第三階段:2018 年至今,發文量成倍增趨勢,其中2020 年發文量多達1053篇,這表明在該階段NP已引起我國中醫學者的廣泛關注,目前研究熱度較高。見圖2。

圖2 NP在中醫藥領域的發文量趨勢圖

2.2 文獻作者運用CiteSpace 軟件設置參數,Time span 選擇“2006 至2021”,Years Per Slice選擇“1 年”;Node types 選擇“Author”,Pruing 選擇“Pruing sliced networks”,其余參數選擇默認,對文獻作者進行繪制圖譜(其中節點越大,發文量越多,連線代表作者之間的合作關系,不同顏色的聯系表示不同年份,顏色越紫年份越遠,顏色越黃則表示年份越近),見圖3。

圖3 作者共現網絡圖

由圖3 可知,發文量較多的作者有張濤、李杰、鄭景輝等。楊洪軍連線較多,表明其與其他作者合作度較高。中介中心性是指某一結點作為其他兩個結點之間最短路的橋梁的次數,若高于0.1,則可視為團隊的核心成員。在本次分析中,中介中心性均低于0.1,表明NP 在中醫藥領域尚缺少核心研究者。另外,借助CiteSpace 軟件進行突現分析。突現值越大,在一定程度上代表研究的創新性越強。結果顯示王博龍團隊突現強度最大,突現起始時間為2018 年,結束時間為2019年。這表明2018年至2019年期間,王博龍團隊在NP方面的研究內容較為新穎。

2.3 研究機構運用CiteSpace 軟件設置參數,Node types 選擇“Institution”,其他參數與“2.2”項相同。本研究在分析時,合并機構名稱中不同科室,僅保留醫院名稱和大學名稱。發文量排名前5 的機構分別為:北京中醫藥大學、遼寧中醫藥大學、北京中醫藥大學東直門醫院、遼寧中醫藥大學附屬醫院、山東中醫藥大學。見圖4。

圖4 機構共現網絡圖

2.4 關鍵詞

2.4.1 關鍵詞共現分析 運用CiteSpace 軟件設置參數,Node types 選擇“Keyword”,其他參數與“2.2”項相同。為了使統計結果更加清晰規范,本研究在分析時,將“作用機制”“機制”等同義詞進行合并。見圖5。

圖5 關鍵詞共現網絡圖

圖6 關鍵詞突現圖譜

由圖5 可知,除了“網絡藥理學”外,“作用機制”“分子對接”“靶點”“信號通路”“新型冠狀病毒肺炎”“黃芪”“2 型糖尿病”“冠心病”等關鍵詞出現的頻次較多。這說明NP 在中醫藥領域的研究熱點,主要集中在聯合分子對接技術探討中藥調控作用靶點干預信號通路傳導防治新型冠狀病毒肺炎、2型糖尿病、冠心病等疾病方面。

2.4.2 關鍵詞突現 基于“2.3.1”項的分析圖譜,在控制面板中選擇“Burstness”進行關鍵詞突現分析。NP 在中醫藥領域研究文獻的關鍵詞突現圖譜見圖7。

其中“Year”表示關鍵詞出現的年份;“Strength”表示突現的強度,強度越高則影響力越大;“Begin”“End”分別代表關鍵詞突現的起止年份。本文將突現值居于前25 的關鍵詞按突現的起止時間分為三個階段。第一階段:2006—2017年韋莖湯、貧血等關鍵詞迅速增長,研究重點集中在單純的NP研究;第二階段:2018—2019年,NP在中醫藥領域的快速發展,以及各類疾病數據的建立,NP 結合生物信息學、數據挖掘等技術進行研究;第三階段:2020—2021 年,NP 技術在中醫藥領域已經逐漸成熟,隨著新型冠狀病毒肺炎的爆發,NP 在研究中醫藥防治新型冠狀病毒肺炎的作用機制中發揮著重要作用。

2.4.3 關鍵詞共現聚類分析 基于“2.3.1”項的分析圖譜,運用Log-Likelihood Ratio算法在關鍵詞共現圖譜的基礎上進行聚類分析,共獲得到NP在中醫藥領域研究的關鍵詞共現聚類10個,見圖7。

圖譜中的不同色塊代表不同聚類;聚類大小與聚類序號呈反比關系,即聚類越大則序號越小,所以#0 代表最大的聚類。聚類分析得到的圖譜模塊是整體結構的全局性度量,Modularity Q(模塊化Q 值)與(Weighted Mean Silhouette S)平均輪廓S 值是評價圖譜整體結構性能的關鍵指標。Q值>0.3表明圖譜聚類有效;S值>0.5表明圖譜中的聚類分析結果可信[10]。由圖5 數據面板可知,Q 值=0.7629>0.3;S 值=0.9413>0.5,這表明該聚類分析有效且可信,具體聚類標簽見表1(其中輪廓值越高,表明該聚類成員間的一致性越高;年份則表示聚類的平均引用年份,初步表明聚類的文章發表年代的遠近)。結合圖6與表1進行分析可知,聚類#0、#1、#2、#3、#4、#5、#6、#7 之間交集較多,聯系較密切,#0 主要包括槲皮素、木犀草素、山柰酚、血管緊張素轉化酶∏、柚皮素等關鍵詞,圍繞著對中藥活性成分的作用機制研究;#1主要包括黃連、黃芪、質量標志物、動脈粥樣硬化、指紋圖譜等關鍵詞,圍繞著對單味藥治療心臟疾病方面的研究;#2 主要包括分子對接、潰瘍性結腸炎、慢性心力衰竭、作用機制、槲皮素等關鍵詞,圍繞著NP 聯合分子對接在治療潰瘍性結腸炎方面的研究;#3 側重于聚類目前NP 研究較多的中藥;#4側重于NP聯合數據挖掘在治療腫瘤方面的研究;#5、#7、#8分半側重于對2型糖尿病、重癥肌無力、胃癌前病變方面的研究;#6則側重于聚類NP的研究方法;#9 輪廓值為0,表明聚類成員一致性較差。聚類#0、#1、#3、#5、#7、#9可歸為NP在不同中藥的研究情況,聚類#2、#6、#8可歸為NP的研究方法,聚類#4可歸為NP在不同疾病的研究情況。

表1 關鍵詞聚類標簽

3 討論

本研究運用CiteSpace軟件將NP在中醫藥領域的發文量、作者分布、機構分布、研究熱點及趨勢的發展演變繪制成可視化圖譜,初步梳理了NP在中醫藥領域的研究現狀。NP 在中醫藥領域的相關文獻主要發表于2006 年后,2006—2017 年發文量相對較少,2017年后NP在中醫藥領域的文獻量明顯增多。分析發現,這與2017年多篇NP方法學的文獻相關[11-13]。在這些文獻中,詳細地分析了NP 常用數據庫的優缺點、NP 的步驟及方法,這極大地推廣了NP 在中醫藥領域的應用。本領域具有影響力的機構是北京中醫藥大學、遼寧中醫藥大學、北京中醫藥大學東直門醫院、遼寧中醫藥大學附屬醫院、山東中醫藥大學,合作關系多為大學與其附屬醫院之間的合作,各大學之間及各醫院之間的合作較少。

關鍵詞通常是對一篇文章核心內容和主要信息的凝練。共現分析是將大數據中,共同信息進行定量化的分析方法,可揭示內容關聯所隱含的共現關系,反映某領域的研究熱點[14]。文章關鍵詞之間存在著一定的關聯,用共現的頻次表示這種關聯,定義為關鍵詞共現分析。關鍵詞共現聚類分析是在關鍵詞共現分析的基礎上的進一步分析,借助計算機的Log-Likelihood Ratio 算法將大量關鍵詞根據同質性進行歸類,反映某領域內的基本知識結構[15]。突現是指關鍵詞在某段時間內使用頻次突然激增,通常被作為分析某領域某段時間的研究熱點[16-17]。本研究通過CiteSpace軟件對納入文獻的關鍵詞進行分析,結合共現分析、聚類分析以及突現分析的結果,可以發現目前NP 在中醫藥領域的關鍵詞可歸納3 類:描述NP 方法學的關鍵詞、描述疾病的關鍵詞和描述中藥的關鍵詞。NP 應用于中醫藥領域的主要目的是研究中藥的作用機制,為臨床中藥的運用提供理論依據[18]?!鞍悬c”“信號通路”“作用機制”等描述方法的關鍵詞出現的頻次較高,這再次驗證了NP 應用的主要目的。同時,這也表明了納入文獻與研究主題相符合。本次研究發現,NP 在中醫藥領域關注的疾病主要是“新型冠狀病毒肺炎”“2 型糖尿病”“冠心病”等,關注的中藥主要是“黃芪”“黃連”“丹參”“人參”等。新型冠狀病毒肺炎是21 世紀以來最大規模的傳染性疾病,由于缺乏特效治療藥物,對社會穩定及經濟發展造成巨大的影響[19]。新型冠狀病毒肺炎可歸屬于中醫“疫病”范疇,而中醫藥歷經數千年的發展,對于防治“疫病”已積累了一定的經驗,且以天人合一、辨證論治等理念為指導方向,形成了獨特的診療體系。在疫情的防控過程中,全國各地名老中醫紛紛獻出“抗疫方”[20-23]。學者們借助NP的研究思路分析“抗疫方”的作用機制,為臨床運用提供理論依據,在中醫藥參與防控疫情中發揮著重要作用[24-26]。黃芪在《本草綱目》中被列為上品藥。藥理研究表明,黃芪的藥效成分包括黃芪多糖、黃芪甲苷、生物堿等,具有抗腫瘤、調節血壓、保護心腦血管、營養視網膜神經節細胞及防治糖尿病血管并發癥等方面的作用。這表明黃芪在中醫藥領域中具有重要地位??偠灾?,黃芪、黃連、丹參、人參等中藥及新型冠狀病毒肺炎、2 型糖尿病、冠心病等疾病是NP在中醫藥領域研究的主要熱點。值得提出的是,NP 在中醫藥領域所關注的中藥及疾病種類較多,涉及的疾病包含消化系統疾病、免疫系統疾病、腫瘤等,涉及的中藥包含中藥復方、中藥單味藥,而“白芍”“甘草”“血管緊張素轉化酶∏”等關鍵詞在近幾年的突現值較高,這在一定程度上代表了NP在中醫藥領域的發展趨勢。

本研究運用CiteSpace軟件繪制NP在中醫藥領域發展的知識圖譜,分析該領域的研究現狀及發展趨勢。與傳統綜述的人工梳理方法相比,知識圖譜可以高效快捷地提取文獻的主要信息,節省了大量的人力時間。不僅如此,將整理的信息繪制成可視化的知識圖譜,更有利于生動地展示NP在中醫藥領域方面的發展演變。

值得注意的是,本研究尚存在一定的局限性。首先,本研究只納入CNKI 數據庫,而萬方、維普、PubMed 等常用數據庫的相關文獻均沒有被納入,故本研究結果僅代表CNKI 數據庫的情況。其次,本研究結果是基于文獻的關鍵詞進行分析,而某些文章關鍵詞較為混亂,能否代表該領域的研究主題有待進一步考證。

4 結論

NP在中醫藥領域的應用研究從2006 年開始,2017 年之后發文量劇增,合作發文主要集中在機構內部。分析文獻的關鍵詞可以發現NP 在中醫藥領域的研究熱點主要集中于黃芪、黃連、丹參、人參等中藥治療新型冠狀病毒肺炎、2 型糖尿病、冠心病等疾病的作用機制。

猜你喜歡
圖譜聚類中醫藥
中醫藥在惡性腫瘤防治中的應用
中醫藥在治療惡性腫瘤骨轉移中的應用
繪一張成長圖譜
基于DBSACN聚類算法的XML文檔聚類
從《中醫藥法》看直銷
補腎強身片UPLC指紋圖譜
基于高斯混合聚類的陣列干涉SAR三維成像
中醫藥立法:不是“管”而是“促”
主動對接你思維的知識圖譜
一種層次初始的聚類個數自適應的聚類方法研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合