?

國內外高被引論文研究綜述

2019-02-20 13:10莫富傳馮翠翠蘇玲
數字圖書館論壇 2019年7期
關鍵詞:影響力學術論文

莫富傳 馮翠翠 蘇玲

(華中師范大學信息管理學院,武漢 430079)

高被引論文作為科學評價的重要組成部分,其相關問題已成為當前業界和學術界共同關注的熱點話題。從現有研究來看,高被引論文研究吸引了多學科研究者的積極參與,不同學科從不同研究視角對高被引論文展開不同層面問題的探討,形成各具特色的研究成果。為正確、及時地把握某一主題領域的研究內容,追蹤研究熱點,既需要在期刊數據庫中檢索相關的文獻,又要掌握文獻發表時間、作者、研究機構等信息,從不同的角度詮釋該領域研究現狀的相關屬性,以宏觀地把握研究領域當前的發展情況和發展趨勢。本文在簡要概述國內外高被引論文研究現狀的基礎上,構建高被引論文研究內容和方向的整體框架,進而對國內外高被引論文的相關研究進行系統梳理和歸納,全面詳盡地展示高被引論文領域的研究主題;并對國內外高被引論文的研究視角、研究主題和研究方法等進行評述,對今后的研究進行展望,以期為未來該領域的理論研究和實踐應用提供借鑒和參考。

1 研究現狀概述

為提高論文數據的內容針對性和學術權威性,本研究使用的外文文獻來源于Web of Science,以“high*+cite*+paper*”和“most*+ cite*+paper*”為檢索詞進行主題檢索,選擇Web of Science核心合集數據庫進行精煉,并按照標題等進行篩選,剔除與研究內容無關的文獻,最終得到有效文獻784篇。中文文獻將中國學術期刊網絡出版總庫CAJD作為數據來源,以標題包含“高被引論文”或“高影響力論文”為檢索式進行高級檢索并剔除與研究內容無關和非核心期刊的文獻,最終得到有效文獻204篇。上述檢索日期均為2019年6月21日。

對上述文獻發表時間進行分析發現,早在1995年國內學者就開始了對高被引論文的研究,而國外始于2000年。2007年以來,國內外關于高被引論文研究的文獻總體呈急劇增長態勢,說明學者高度關注和重視高被引論文的研究,并將保持這種趨勢。進一步分析發現,國內文獻主要發表在圖情檔等領域,學科背景較為單一,而國外文獻除圖情檔外還包括物理、醫學等領域,跨學科性和跨領域性較為顯著;國內作者人數眾多,但分布離散、高產作者較少,缺乏深入性和持續性研究;國外作者之間的合作十分密切,作者合作程度較高。此外,國內外發文較多的機構大多為知名度較高和科研能力較強的高等院校及科研機構,但論文在期刊中的分布不均勻,呈現出較為明顯的集中與分散現象。

論文的關鍵詞是其內容的濃縮和提煉,頻次高的關鍵詞代表一段時間內研究者對該問題的關注熱度,關鍵詞的詞頻越大,表明該關鍵詞的熱度越高,因而關鍵詞的使用頻次能顯示某領域學術研究的重點與熱點、發展脈絡與方向等[1]。統計發現,“高被引論文”“高影響力論文”“highly cited paper”等闡述高被引論文概念界定的關鍵詞,“作者分布”“統計分析”等反映高被引論文分布特征的關鍵詞,“引文分析”“citation analysis”“citation classics”等反映高被引論文引用規律的關鍵詞,“學術影響力”“影響因子”“impact”“impact factor”等反映高被引論文的科學評價作用的關鍵詞,“文獻計量”“研究熱點”“bibliometric analysis”“Trend”等表明高被引論文具備反映學科發展演進作用的關鍵詞,出現頻率較大,其所代表的研究主題熱度較高。這些高頻關鍵詞是國內外高被引論文研究領域的代表性術語,表征了該領域的熱點主題和發展方向。因此,高被引論文的概念界定、高被引論文的分布特征、高被引論文的引用規律、高被引論文的科學評價作用、高被引論文的反映學科發展演進作用研究等主題,是國內外高被引論文研究領域的重點與熱點。

2 高被引論文的概念界定研究

概念的界定是一切理論研究的基礎。關于高被引論文的概念,ESI數據庫將高被引論文定義為近十年來被引頻次排在各學科領域前1%的論文[2]?!吨袊弑灰治鰣蟾?012》將某學科在某一年里被引用過的論文中,按照論文被引頻次高低排序,排位在前1%的論文定義為(該年)高被引論文[3]。Moed[4]認為高被引論文是指被引頻次相對較高、被引用周期相對較長的學術論文;祝清松等[5]認為高被引論文指在某個統計時間段內,被引用次數排在學科前列的論文,在一定程度上代表了學科的研究進展,具有重要的研究意義。程剛[6]認為高被引論文一般具有3個特征:①在闡述同一主題的論文中,具有一定的理論深度和理論突破;②抓住了本學科研究近期和中期的關鍵性及本領域普遍關心的問題,對工作實踐有較大的指導意義;③在理論上有相對的認識超前性??梢?,不同領域、不同時間的出版物和學者基于不同的角度,關于高被引論文內涵的界定和具體表述存在一定的差異,但高被引頻次往往是突破性、創新性研究成果的共有特征之一,這是學界的共識[7]。

在高被引論文的選取方面,目前學界在具體確定某一學科或領域的高被引論文時多采用限定被引頻次法、百分比法[8]和普賴斯定律法[9]等。上述確定高被引論文的方法顯然只考慮論文被引頻次的高低,而沒有考慮發表時間的先后,把不同年代發表的論文等同對待;且限定被引頻次或百分比主觀性較強,缺乏理論依據;是否所有學科或領域高被引論文的分布符合普賴斯定律有待驗證。事實上,論文的被引頻次存在累積效應,論文發表時間的長短對被引頻次的高低有直接的影響:發表時間越長,被引用的機會越多,被引頻次就會相對提高;但也并非發表時間越長,被引頻次就越高,這與論文的研究主題是否屬于學科領域的研究熱點以及在科學發展中的重要程度有關。已有的研究表明,科研工作者使用的引文大多是近二十年內發表的文獻,中文文獻被引用的最佳年限一般為出版后的2~5年,外文文獻為3~8年,某學科或領域論文的被引篇數和總被引頻次的年份分布曲線呈現中間高兩極低的正態分布[10-11]。對此,Levitt等[12]給出了一個結合期刊和單篇文獻的識別指標“Composite Indicator”,楊國立[13]提出的“年均被引頻次”,Thelwall等[14]提出使用期刊影響因子的幾何或算數平均數作為高被引論文識別指標等,是對限定被引頻次、百分比和普賴斯定律等方法的改進。

3 高被引論文的分布特征研究

文獻數量的時序變化是衡量某領域發展的重要指標,繪制相應的分布曲線對文獻分布進行歷史、全面的統計,對評價該領域所處的階段、動態,以及預測發展趨勢具有重要意義[15]。發文量是評價作者和機構科學影響力的重要指標,通過分析作者及其機構與地區的發文量,在一定程度上可以了解各研究人員、機構和地區在學科領域的研究成果、學術水平和權威程度,了解學科領域研究主體的水平分布及其合作情況。研究論文的期刊和文獻類型分布是揭示學科領域的重要期刊情報源的有效方法,也能據此判斷論文的整體質量??茖W基金是現今科學研究的重要公共資源之一,各主要大國都在科學基金上投入了巨額的經費,科學基金的資助產出成果的定量研究有重要意義??梢?,發表時間、研究群體、期刊、文獻類型以及基金分布情況等作為學術論文的重要屬性特征,對這些屬性特征進行統分析,可以從不同的角度詮釋該領域的研究現狀。

在高被引論文的被引頻次分布方面,由于論文的被引頻次高峰一般出現在論文發表后的第2~4年,某些論文則被持續引用多年,其被引篇數和總被引頻次的年份分布曲線呈現中間高兩極低的正態分布[11]。劉曉燕等[16]對高被引論文的類型進行研究,發現相對于一般研究論文,特約綜述性的文章尤其是綜述特刊上的文章和經過嚴格挑選的會議論文在高被引論文中占比較大,且高被引論文在特刊上分布較多。另外,論文篇幅越長、自引的增加、放入開放獲取文檔有利于論文的被引[17]。在高被引論文的基金分布方面,蘇林偉等[18]對16個國家/地區的10個學科高被引基金論文進行了實證研究,發現各國家/地區的高被引論文科學基金資助率在不同學科存在結構差異;陳瓊等[19]對護理核心期刊刊載的臨床護理類高被引基金論文的研究發現,高被引論文以省級、市級、院級資助為主,部隊資助論文受到關注。針對高被引論文地區差異的研究發現,我國圖書館學研究發展不均衡,高水平成果主要來源于少數經濟、文化發達的地區,高校是我國圖書館學研究的重要機構[20]。雖然上述學者的研究得出了較為一致的結論,但Seglen[21]和Larivière等[22]經過對大量數據的分析指出,期刊的影響因子與其刊載的單篇文獻的被引用頻次之間是弱相關的關系;Persson[23]通過對比國內外的高被引論文的國際合作情況,發現國際合作不是論文高被引的決定因素;王知津等[24]的研究發現,作者的影響力大小與文章被引用數量之間沒有明顯的關系,署名單位沒有表現出明顯的向某些研究單位集聚的特征,且高校層次與論文影響力的關系并未存在明顯的關聯特征,是否屬于基金項目產出的文章與高被引論文的形成沒有必然聯系。

4 高被引論文的引用規律研究

文獻間的引用性質主要分為正面引用、中性引用和負面引用。高被引論文的引用行為中正面引用和深度引用占絕大比例,但也存在一定的負面引用和淺度引用,中性引用和中度引用占有相當比例,引文中占多數的正面引用和深度引用對論文質量具有評價作用[25]。在具體文章類型的分析上,張磊[26]針對檔案學的研究發現,引用情感類型以正面引用為主,綜述性和實踐性的文章多是中性引用,而具有商榷性和爭鳴性的負面引用文章很少。

對高被引文獻施引規律的探究可以在一定程度上探析高被引論文的理論基礎和知識構成,科學認識論文高被引與參考文獻的關系以及豐富二者關系研究的學科特性具有重要意義,因而也得到了學者們的關注。Webster等[27]認為參考文獻的數量與被引頻次相關,高被引論文的參考文獻數量明顯比一般論文多。但梁春慧等[28]的研究表明并非越是高被引論文,其參考文獻數量越多。同時,高水平的研究更多建立在高水平的研究基礎之上,高被引論文比一般論文更傾向于引用聲望值和影響因子高的期刊論文,而不是基于中等引用的論文[28]。但隨著被引頻次的降低,其引用的高被引論文所占的比例也在下降[29]。而姜磊等[30]研究表明,參考文獻與被引頻次之間的相關性不明顯,參考文獻可以作為一個獨立于被引頻次的論文評價指標。在高被引論文的下載使用方面,Jahandideh等[31]對Science Direct的論文下載頻次與被引次數報告進行時間序列分析,指出一篇論文在某個時間段的高下載量,很有可能是該文獻高被引的預兆;Harnad等[32]通過對英國醫學期刊的文獻進行統計分析,發現文獻下載量與被引頻次呈強相關關系。

引文曲線是用來描述論文被引次數隨時間變化規律的一種曲線,繪制并進行引文曲線形狀特征分析、特征差異分析、分布狀態分析和引文網絡特征分析有利于不同研究者找到研究同行、挖掘學科研究前沿、推進學科發展,對此學界也進行了深入的研究。隨著科學的“睡美人”等被各國學者相繼提出[33],王海燕等[34]對高被引論文、“睡美人”論文的10~20年被引用數據進行對比分析,發現高被引論文呈現持續增長型、顯峰型、雙峰型、振蕩型,“睡美人”論文則呈現持續增長型、顯峰型、雙峰型、振蕩型、穩定型的被引曲線模式,高被引論文與“睡美人”論文的持續增長曲線表現出近乎一致的增長速率和增長模式,但高被引論文平均早于“睡美人”論文4年達到引用峰值,領域發展趨勢與“睡美人”論文被引曲線的走勢一致。屈文建等[35]的研究發現對于不同研究主題、不同作者的高被引論文引文曲線特征存在差異,并認為高被引論文引文曲線特征可以用來識別不同的研究方向和不同的研究團隊。

5 高被引論文的科學評價作用研究

已有的研究表明,高品質論文不是最高被引論文,但被引頻次都高于學科平均被引;最高被引的論文品質雖然不能肯定最優,但一般具有廣泛的影響力[36]。高被引論文對期刊影響力、影響因子有重要影響是學界的共識:對作者而言,高被引論文意味著高學術影響力;對期刊而言,高被引論文是期刊高質量、高水平的主要貢獻者,對期刊引證指標也有重要貢獻;對機構而言,高被引論文是評價其研究狀況、學科研究特點和學術影響力的客觀指標之一。

目前,國內外期刊評價的理論和實踐都經歷了長期的不斷探索與實踐的過程,目前已經逐漸形成一套比較成熟的理論方法和評價體系,如JCR、《中文核心期刊要目總覽》、《中國學術期刊評價研究報告(武大版)》等。上述國內外較為成熟的期刊評價指標體系均將總被引次數視為評價論文學術質量與期刊學術水平的關鍵標準,反映了期刊及其刊載論文的學術影響力,體現了期刊刊載論文受關注的程度。檔案學期刊的一項研究表明,高被引論文對影響因子貢獻度較高,前5%的高被引論文對影響因子貢獻最大達20.85%,最高達59.86%,平均達37.32%[37]??梢?,高被引論文的質量決定了期刊學術影響力的深度,高被引論文的數量決定了期刊學術影響力的范圍,高被引論文構成了期刊學術影響力的核心,挖掘高被引論文有利于提高期刊的學術影響力[38]。

對高被引論文的多形式多層面的統計與探析,可以為全面深入了解某機構的研究方向、成果、水平、成員等科研綜合實力提供客觀真實依據,這對建設自身機構、分析他方機構都頗有益處。在國際重要刊物上發表科研論文的情況是評估一所研究型大學學術水平的重要指標之一,高被引論文產出數量反映了該學校的科研是否具有較強的科研競爭力,高被引論文在科研績效評價[39]、科研影響力比較[40]和大學評價研究[41]中有廣泛的應用。朱星等[42]以北京大學歷年來被SCI數據庫收錄的科學論文為基礎,著重分析了發表論文的被引頻次,進而深入分析北京大學理科各院系和研究人員的學術成就,為大學的學術評估和科研發展戰略的制訂提供了重要的參考依據;袁心億等[43]對以浙江大學圖書館為第一作者單位并在該數據庫內高被引論文進行了統計,以探析其科研實力;周曉鷗等[44]對東華大學高被引用論文進行多角度的統計和分析,客觀評價其研究狀況、學科研究特點和學術影響力,展現東華大學的優勢學科及論文科研成果的影響力,以期為學校的學科建設規劃以及人才引進提供借鑒。

6 高被引論文的反映學科發展演進作用研究

高被引用論文具有較高的學術參考價值與引領作用,通常會在某研究領域內得到研究者的高度關注和有效利用。文獻高被引現象的形成說明研究者對被引文獻觀點和結論的高度認同,高被引論文集合了領域的核心研究內容,分析、總結具有廣泛學術影響力的高被引論文的學術特征與共同特點,可以較為客觀地反映學科或領域的研究動態和關注熱點,為研究人員把握研究方向以及期刊編輯的選題組稿提供參考。因此,基于高被引論文的研究熱點識別、反映學科發展演進已經得到越來越多的關注和運用,成為重要的研究方向和內容。

Small等[45]證實了文獻被引數量對于評價學術影響力的可靠性,并認為同被引聚類分析可以用來表示某一學科或專題的研究結構和狀況,對某學科和專題的高被引論文的連續同被引聚類分析應該可以動態地表示該學科和專題的變化情況。受Small啟發,國內學者崔雷[46-47]也開展了相關的研究,認為連續、動態的高頻被引論文的同被引聚類分析能夠反映某一專題研究的結構及這些結構的發展過程,不同年代高被引論文的連續同被引聚類分析不僅能反映這一主題客觀上的變化,同時也反映了不同時間里研究人員對該題目的認識過程,當年高被引論文的主題詞鏈聚類分析可以用于預測某一學科研究的熱點。秦衛平等[48]對高被引論文與研究熱點是否具有顯著相關關系進行了初步探討,認為高被引論文具有學科導航作用,對相關學科和領域也有一定的輻射功能,揭示著學科研究方向,體現了學科研究熱點。Martínez等[49]利用H-Classics對高被引論文在社會網絡中的特征進行分析,指出高被引論文與其所在的學科屬性和學科演化有關。莫富傳等[50]從高被引論文的廣泛影響力、高被引論文與引證文獻的主題相關性、引證文獻之間的主題相關性、高被引論文有較大引文網絡4個方面論證基于高被引論文研究熱點識別的理論依據。

在具體應用上,徐劍等[51]通過對新媒體研究領域高被引論文的分析,追溯新媒體研究在中國近十年來發展的歷史脈絡及其主題轉換;高耀明等[52]運用內容分析法對高等教育專題高被引論文所使用的研究方法進行分析,顯示我國高等教育研究方法論正從單一的思辨研究趨向多樣化,但思辨研究仍是主要方法;高燕等[53]通過對《新聞記者》高被引論文的聚焦,來觀察新聞傳播學專業期刊自改革開放以來的學術發展與變遷;陸曉曦[54]選取圖書館學基礎理論研究領域所發表的被引頻率高、具有代表性的重要作品進行梳理和分析,勾勒出了10年間我國圖書館學基礎理論研究的狀況及發展脈絡;季丹等[55]通過對中國網絡輿情領域高被引論文數據的描述性分析,發現中國網絡輿情領域的研究越來越體現出學術化、規范化的發展趨勢。閆娟等[56]對國內期刊編輯工作主題的高被引頻次文章信息進行提煉并匯總這些文章的主要內容,分析目前關于該主題的研究現狀及相關信息。

7 高被引論文研究的評析與展望

7.1 研究評析

縱觀高被引論文的相關研究成果,可從學科領域、研究內容、研究方法方面總結歸納出現有研究的特點。從學科領域上看,不同學科的研究者從不同研究視角對高被引論文展開了不同層面問題的探討,形成了各具特色的研究成果。除圖書情報與檔案管理領域的文獻計量、科學研究管理領域的科學評價、出版領域的編輯選題組稿等優勢領域外,計算機、醫學、生物、教育等眾多學科領域的學者也針對本領域的高被引論文展開了具有學科特色的研究。不同學科從不同視角開展了多維度的研究,為我們開闊眼界的同時也提供了豐富的成果借鑒。從研究內容上看,目前國內外學者對高被引論文不同層面的問題均進行了深入探討。研究內容包括高被引論文的概念界定與選取,高被引論文在發表時間、研究群體、期刊以及基金與學科等分布特征的統計和分析,高被引論文的引用性質、施引規律和引證規律的探究,高被引論文的學術影響力及其在期刊質量與機構科研實力評價上的作用,高被引論文在揭示學科發展演進、識別前沿研究熱點的應用等。從研究方法上看,詞頻統計與共現聚類分析法、數理統計分析法、引文分析法、內容分析法、知識圖譜可視化分析法、社會網絡分析法和多維尺度分析運用較多,不同的研究方法在高被引論文研究中存在明顯交融趨勢。

7.2 研究展望

綜上所述,目前國內外對高被引論文的研究已經取得了突出的研究成果,形成較為完善的理論體系。但同時,通過對現有研究的綜述,發現國內外高被引論文的研究還存在一些不足之處,突破這些不足是繼續推進高被引研究的關鍵。首先,雖然現有研究從多個角度對高被引論文的分布特征進行了統計分析,對引用規律及其表現也進行了揭示,但尚未深入地分析高被引論文的分布特征和引用規律的產生機理,未來研究應進一步加深研究深度,加強對高被引論文特征背后的機理研究。其次,高被引論文分析法已廣泛應用于學科領域研究熱點與前沿的識別與分析,但對高被引論文與研究熱點是否具有顯著相關關系這一問題尚未進行過系統的實例論證,今后應加強對高被引論文分析法的可行性分析,重點探討高被引論文分析法應用于研究熱點識別的理論依據研究、主題識別方法研究和研究熱點熱度評價研究。最后,以往學者多是基于文獻計量或自身科學領域的研究視角探討高被引論文的某些特征和應用,但由于高被引論文作為科學活動中普遍存在的一種必然現象,既涉及文獻計量學理論知識,又在關于科學發展的科學學理論中有所體現,是一個交叉研究領域,涉及的理論知識面較廣,未來研究應該進一步進行多學科的交叉研究,在研究視角和研究方法方面進行進一步的創新。

猜你喜歡
影響力學術論文
學術是公器,不是公地
如何理解“Curator”:一個由翻譯引發的學術思考
對學術造假重拳出擊
天才影響力
黃艷:最深遠的影響力
3.15消協三十年十大影響力事件
傳媒不可估量的影響力
下期論文摘要預登
下期論文摘要預登
下期論文摘要預登
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合