?

基于CNKI的CiteSpace應用可視化分析

2023-06-25 12:03丁士寧張克旺
現代信息科技 2023年6期
關鍵詞:可視化

丁士寧 張克旺

摘? 要:為了解CiteSpace軟件的應用現狀,基于CNKI數據庫中檢索的核心期刊文獻,從年度文獻數量、作者、研究機構、關鍵詞等多方面進行分析,并使用CiteSpace 6.1.R3進行可視化。結果顯示,2007年至2021年期間,相關論文數量呈增長趨勢,超過70%的文獻在2016年至2021年間發表;參與發表文章數量在10篇及以上的作者僅有7位,超過80%的作者發文量僅為1篇;相關成果較多的研究機構均是大學;CiteSpace軟件應用于探測信息技術、醫療健康、農業、人工智能等多學科領域的研究熱點和研究趨勢。

關鍵詞:知網數據庫;核心期刊;可視化;CiteSpace軟件

中圖分類號:TP391? ? 文獻標識碼:A? 文章編號:2096-4706(2023)06-0124-05

Visualization Analysis of CiteSpace Application Based on CNKI

DING Shining, ZHANG Kewang

(Xinyang Agriculture and Forestry University, Xinyang? 464000, China)

Abstract: In order to understand the application status of CiteSpace software, based on the core journal literature retrieved in the CNKI database, the paper analyzes the number of annual literature, authors, research institutions, keywords and other aspects, and uses CiteSpace 6.1.R3 for visualization. The results show that, the number of relevant papers showed an increasing trend from 2007 to 2021, and more than 70% of the papers were published from 2016 to 2021. Only seven authors participated in the publication of ten or more papers, and more than 80% of the authors published only one paper. The research institutions with more relevant achievements are universities. The CiteSpace software is applied to detect research hotspots and trends in information technology, medical health, agriculture, Artificial Intelligence and other multidisciplinary fields.

Keywords: CNKI database; core journal; visualization; CiteSpace software

0? 引? 言

CiteSpace軟件是美國德雷賽爾大學陳超美教授研發的可視化分析軟件,可以繪制學科知識領域的知識圖譜,廣泛應用于分析和探究特定領域研究成果的整體狀況以及該領域研究的熱點和前沿[1-3]。陳超美教授最早于2004年闡述了該軟件[4];大連理工大學劉則淵教授是國內最早關注科學知識圖譜的先驅者[5,6];候劍華等于2007年發表國內第一篇以CiteSpace為分析工具的核心期刊論文,這篇文章描述了用CiteSpace可視化分析戰略管理學領域的前沿和演化[7];姜春林等將CiteSpace軟件應用于分析CSSCI中文數據庫上的期刊論文[8];劉則淵等將CiteSpace軟件用于分析CNKI數據庫上的論文[9]。CiteSpace已廣泛應用到醫學[10]、圖書館學[11]、教育學[12]、信息技術[13]。

目前也存在作者對CiteSpace應用進行統計分析。侯劍華等對知識圖譜的應用領域和使用功能進行分析,并對CiteSpace的應用前景和趨勢進行了分析和展望(2013年)[14];陳悅等從CiteSpace工具的設計理念、理論基礎、使用流程、新進技術介紹等方面闡釋CiteSpace知識圖譜的方法論功能(2015年)[15];宋秀芳等基于Web of Science數據庫上、以生物燃料為主題的期刊文獻數據比較Vosviewer和CiteSpace軟件的分析結果(2016年)[16];呂俊杰探究學者如何利用CiteSpace軟件進行學術研究,并簡要說了應用軟件進行研究時存在的問題(2022年)[17]。本文基于CNKI數據庫,通過對CiteSpace相關文獻的作者、研究機構和關鍵詞圖譜網絡,分析CiteSpace應用的熱點和趨勢。

1? 數據來源與研究方法

以中國知網(China National Knowledge Infrastructure, CNKI)為檢索平臺,主題設置為“CiteSpace”或“Cite Space”,僅檢索期刊文獻。同時為保證檢索文獻的質量,期刊來源選擇為“SCI來源期刊”“EI來源期刊”“北大核心”“CSSCI”“CSCD”,檢索時間范圍不限。檢索得到2 700篇文獻,將文獻以Refworks格式導出并轉換為CiteSpace可用的格式。其后按照如下規則篩選數據:

(1)根據題目、關鍵詞、摘要信息剔除明顯與主題無關的文獻。

(2)利用CiteSpace自帶功能去除重復的文獻。

(3)剔除Refworks格式中不含年份信息的文獻。篩選后得到文獻2 607篇。

本文使用CiteSpace軟件對相關文獻的作者、研究機構和關鍵詞進行可視化分析,軟件版本為6.1.R3。

2? 結果與分析

2.1? 年度發文量統計與分析

年度發文量數量是該研究領域是否為熱點研究的重要體現[18]。如圖1所示,是主題CiteSpace的年度發文量曲線。關于CiteSpace的應用研究主要出現在2007年及之后,2007年至2021年,年度發文量整體呈現上升的趨勢。2007年至2010年年度發文量較少,均在15篇以內;2011年至2014年發文量基本維持在50篇上下;在2016年年度發文量首次突破100篇,并在之后維持在較高的水平;2016年至2021年發文量占整體文獻數量的74.53%。認為CiteSpace應用研究受到了越來越多人的關注與使用,并在最近6年維持在較高的熱度,具有廣闊的研究前景。

2.2? 文獻作者情況分析

文獻作者的統計可以分析該研究領域核心作者及合作強度[19]。本研究中的2 607篇文獻中包含6 819名作者,出現頻次在10及以上的僅有7人,發文量在1篇的作者占比達86.02%。參與發文量在10篇以上的作者及首發年份展示如表1所示。其中出現頻次最多的是侯劍華,發文量在20篇,而且侯劍華是國內以CiteSpace為分析工具發表文章的第一人[7],該篇文章對戰略管理學進行了可視化分析研究。金榮疆(13篇)、李涓(12篇)、李杰(12篇)三人的首發年份在2017年及之后。

CiteSpace分析得到N(網絡節點數量)=538,S(連線數量)=467,Density(網絡密度)=0.003 2的作者合作網絡圖,時間設置為2007年至2022年,時間切片為1年,‘Selection Criteria設置為‘g-index,未對網絡進行剪切。作者合作網絡如圖2所示。在圖中,每個節點代表一個作者,節點之間的連線代表作者之間的合作。不難看出,許多研究者應用CiteSpace軟件發表文章,但合作研究者比較分散,僅分別形成了以侯劍華、劉則淵、金榮疆&李涓等為核心的研究團隊。

2.3? 研究機構情況分析

對研究機構進行統計分析可以看出該領域科研力量的分布[20]。表2和表3在所有文獻上統計了參與發文量靠前的一級機構和二級機構。如表2所示,發文量排名前9的一級機構均是大學。其中武漢大學發文量最大,達到76篇;大連理工大學的研究時間最早,首次發文在2007年;成都中醫藥大學相關文章發表起于2019年,并在不到4年的時間內發文量達到31篇。如表3所示,二級發文機構排名靠前的是大學內的學院。因相當部分文章未列二級機構,表3中發文量和首發年份均是根據列明了自身二級機構的文章統計而來。

使用CiteSpace繪圖,時間設置為2007年至2022年,時間切片為1年,‘Selection Criteria設置為‘g-index,未對網絡進行剪切。繪制的發文機構合作網絡圖如圖3所示,N=445,S=189,Density=0.001 9。值得注意的是,圖3并未將二級機構歸并到一級機構中,且部分文章不列二級機構這一事實客觀存在。從圖3整體來看,研究機構之間的合作分散,但也形成了以中國科學院大學、中國中醫科學院為核心的研究團隊。

2.4? 關鍵詞分析

關鍵詞是一篇文章的凝練概括,關鍵詞的頻次和中心性可以反映本領域內的研究熱點[21,22]。合并同義詞后,運用CiteSpace軟件對關鍵詞進行分析。如表4所示,記錄了高頻詞的關鍵詞及其中心性。在表4中,中心性大于0.1的關鍵詞是“知識圖像”“研究熱點”“文獻計量”“可視化”和“CiteSpace”。CiteSpace是知識圖譜繪制工具,可以可視化作者共現圖譜、機構共現圖譜、國家分布圖譜、關鍵詞共現與聚類圖譜等,主要用來探測學科知識領域的發展及其研究熱點和研究趨勢。表4的數據與這一事實相符。

如圖4所示,是CNKI數據庫中的CiteSpace研究的關鍵詞聚類分析結果,聚類算法選擇LLR(Log-Likelihood Ratio)算法。經過聚類分析,聚類模塊值Q=0.466 5>0.3,聚類結構顯著;聚類平均模塊值S=0.810 8>0.7,聚類是高效率令人信服的[15]。圖4展示了9個聚類模塊,其中多個模塊之間存在大量重疊,表明模塊之間聯系緊密,如#1(研究熱點)、#5(研究進展)是CiteSpace研究的目的,#0(知識圖譜)、#3(可視化)是CiteSpace研究的方法手段,#6(鄉村振興)、#8(人工智能)是CiteSpace關注應用的領域。

如圖5所示,是關鍵詞的時間線圖。聚類0(知識圖譜)的關鍵詞涉及醫學(腸道菌群、醫學情報、雷公藤)、信息技術(信息技術、信息檢索、文獻流)、教育(教師權利、青少年)等;聚類1(研究熱點)的關鍵詞涉及農業(農業保險、植物修復)、信息技術(信息行為、信息服務、互聯網+,虛擬現實、網絡分析)、健康(健康、健康管理、健康促進、食品檢測)等;聚類2(文獻計量)的關鍵詞涉及環境(園藝學、生態修復、森林)、安全(危機管理、公共危機、健康風險)等;聚類3(可視化)的關鍵詞涉及醫學健康(醫學、中藥、中醫、干細胞、軟骨、中醫流派、健康傳播)、信息技術(4d打印、數據挖掘、信息生態)等;聚類4(演化路徑)的關鍵詞涉及教育(教師離職、慕課)、環境(碳排放、低碳經濟)。聚類0-4中頻次最高的詞仍然是知識圖譜、研究熱點、研究趨勢、可視化、CiteSpace這些詞。

應用于CiteSpace可視化分析的數據主要有兩大來源:CNKI和Web of Science。其中,CNKI是中文數據庫,Web of Science是英文數據庫。從聚類7看出,在英文數據庫Web of Science上主要進行醫學(針灸、臨床研究、軍事醫學)、教育(教育扶貧)、環境(水土保持)方面的研究。

聚類6和聚類8是CiteSpace應用的具體領域方向。對鄉村振興的研究涉及了鄉村旅游(2017年)、鄉村振興(2020年)、三權分置(2022年)等。應用CiteSpace對人工智能的研究涉及了大數據(2015年)、區塊鏈(2017年)、機器學習(2020年)、深度學習(2020年)等方面。

關鍵詞圖像分析結果如圖6所示,圖中展示了關鍵詞突現的起止年份及突現強度?!扒閳髮W”突現的時間起于2010年,止于2015年;“圖書館學”突現的時間起于2012年,止于2014年;“電子政務”突現的時間起于2012年,止于2015年;“專利分析”突現的時間起于2014年,止于2017年;“鄉村振興”突現的時間起于2020年,至今未止。

根據關鍵詞分析的結果,可視化軟件CiteSpace用來分析探測教育學、信息技術、醫療健康、環境科學、農業、人工智能等學科領域的研究熱點和研究趨勢,對于鄉村振興的研究可能是當下及未來的研究熱點。

3? 結? 論

本文在CNKI數據庫上導出與主題CiteSpace相關的核心期刊文獻,對導出的2607篇文獻的作者、研究機構和關鍵詞進行可視化分析,分析結果表明:

(1)使用CiteSpace發表文章的數量隨年份增長呈現增加趨勢,且74.53%的文獻發布于2016年至2021年;

(2)從作者分析結果來看,侯劍華是國內以CiteSpace為分析工具發表文章的第一人,且發文量最多;86.02%的作者發文量僅為1篇;作者之間的合作網絡比較松散,但也形成了分別以侯劍華、劉則淵、金榮疆&李涓等為核心的研究網絡。

(3)從研究機構分析結果來看,該主題的研究機構主要集中在大學;各個大學之間的合作松散,但也形成了以中國科學院大學、中國中醫科學院為核心的研究團隊。

(4)通過對關鍵詞進行分析,認為CiteSpace廣泛應用在教育學、信息技術、醫療健康、環境科學、農業、人工智能等學科領域的研究熱點分析中;鄉村振興是當下及未來的研究熱點。

參考文獻:

[1] CHEN C M. A Glimpse of the First Eight Months of the COVID-19 Literature on Microsoft Academic Graph:Themes,Citation Contexts,and Uncertainties [J].Frontiers in Research Metrics and Analytics,2020,5:607286.

[2] CHEN C M,SONG M. Visualizing a Field of Research:A Methodology of Systematic Scientometric Reviews [J].PLoS ONE,2019,14(10):e0223994.

[3] CHEN C M. Science Mapping:A Systematic Review of the Literature [J].Journal of Data and Information Science,2017,2(2):1-40.

[4] CHEN C M. Searching for Intellectual Turning Points:Progressive Knowledge Domain Visualization [J].Proceedings of the National Academy of Sciences,2004,101(Supplement1):5303-5310.

[5] 陳悅,劉則淵.悄然興起的科學知識圖譜 [J].科學學研究,2005(2):149-154.

[6] 劉光陽.CiteSpace國內應用的傳播軌跡——基于2006—2015年跨庫數據的統計與可視化分析 [J].圖書情報知識,2017(2):60-74.

[7] 侯劍華,陳悅.戰略管理學前沿演進可視化研究 [J].科學學研究,2007(S1):15-21.

[8] 姜春林,劉盛博,丁堃.《中國科技期刊研究》研究熱點及其演進知識圖譜 [J].中國科技期刊研究,2008,19(6):954-958.

[9] 劉則淵,胡志剛,王賢文.30年中國科學學歷程的知識圖譜展現——為《科學學與科學技術管理》雜志創刊30周年而作 [J].科學學與科學技術管理,2010,31(5):17-23.

[10] 張惠玲,李涓,劉丹陽,等.基于CiteSpace軟件探討生物反饋技術在康復醫學中的研究現狀 [J].中華物理醫學與康復雜志,2022,44(3):264-268.

[11] 丁明春,任恒.國內外智慧圖書館研究之概念脈絡、熱點主題及未來展望——基于CiteSpace的信息可視化分析 [J].圖書館理論與實踐,2022(1):99-107.

[12] 苗小燕,張沖.大中小學德育一體化研究的熱點與發展趨勢——基于CNKI數據庫的CITESPACE分析 [J].中國特殊教育,2018(8):85-90.

[13] 謝志明,粟小穎,易玄.基于Citespace的區塊鏈審計熱點及研究趨勢比較 [J].財會通訊,2022(3):23-29.

[14] 侯劍華,胡志剛.CiteSpace軟件應用研究的回顧與展望 [J].現代情報,2013,33(4):99-103.

[15] 陳悅,陳超美,劉則淵,等.CiteSpace知識圖譜的方法論功能 [J].科學學研究,2015,33(2):242-253.

[16] 宋秀芳,遲培娟.Vosviewer與Citespace應用比較研究 [J].情報科學,2016,34(7):108-112+146.

[17] 呂俊杰.CiteSpace應用現狀研究 [J].現代信息科技,2022,6(7):105-111.

[18] SUN Y Q,WU S M,GONG G Y. Trends of Research on Polycyclic Aromatic Hydrocarbons in Food:A 20-Year Perspective from 1997 to 2017 [J].Trends in Food Science & Technology,2019,83:86-98.

[19] LI W S,ZHAO Y X,WANG Q,et al. Twenty Years of Entropy Research:A Bibliometric Overview [J].Entropy,2019,21(7):694.

[20] SUN W J,HUANG P X,SONG H L,et al. Bibliometric Analysis of Acute Pancreatitis in Web of Science Database Based on CiteSpace software [J].Medicine,2020,99(49):e23208.

[21] 林德明,陳超美,劉則淵.共被引網絡中介中心性的Zipf—Pareto分布研究 [J].情報學報,2011,30(1):76-82.

[22] CHEN C M. CiteSpace II:Detecting and Visualizing Emerging Trends and Transient Patterns in Scientific Literature [J].Journal of the American Society for Information Science and Technology,2006,57(3):359-377.

作者簡介:丁士寧(1993—),男,漢族,河南淮濱人,助教,碩士研究生,研究方向:模式識別;張克旺(1982—),男,漢族,河南信陽人,講師,碩士研究生,研究方向:物聯網技術。

收稿日期:2022-10-31

基金項目:信陽農林學院青年教師科研基金項目(QN2021057)

猜你喜歡
可視化
無錫市“三項舉措”探索執法可視化新路徑
基于CiteSpace的足三里穴研究可視化分析
自然資源可視化決策系統
三維可視化信息管理系統在選煤生產中的應用
思維可視化
基于Power BI的油田注水運行動態分析與可視化展示
自然資源可視化決策系統
基于CGAL和OpenGL的海底地形三維可視化
可視化閱讀:新媒體語境下信息可視化新趨勢
“融評”:黨媒評論的可視化創新
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合