?

基于語言學中文學術圖書的半衰期分析研究*

2019-12-13 08:17
關鍵詞:年數半衰期百分比

程 路

(西華大學 四川學術成果分析與應用研究中心, 四川 成都 610039)

1958年貝爾納(J.D.Bernal)第一次提出用“半衰期”來表征文獻情報老化速度。1960年,巴爾頓(R.E.Burton)和開普勒(R.W.Kebler)提出了文獻“半衰期”的概念,指現時尚在利用的文獻中較新的一半是在多長一段時間內發表的,也被稱為“中值引文年限”。原美國科學信息情報所根據這種定義,從引證與被引證的角度出發,又提出了引用半衰期和被引半衰期。文獻半衰期能夠從文獻利用的角度上,定量地揭示科學文獻的老化規律,衡量科學文獻的老化速度和程度。[1]

經過文獻調查發現,目前關于文獻半衰期的研究大多基于期刊文獻、學位論文或者標準。方紅玲[2]、楊彭[3]、卓可秋[3]、黃利平[4]等分別基于期刊文獻計算了科學、數學和環境科學、藝術學、管理學、圖書情報學等學科的半衰期。N.Zafrunnisha和V.P.Reddy[5]計算了印度的安得拉大學等3所大學哲學學科博士論文的引用半衰期。A.M.S.Angammana和L.A.Jayatissa[6]計算了科倫坡大學、凱拉尼亞大學圖書情報學科的碩士論文引用論文半衰期。陳云鵬[7]等人計算了標準文獻的半衰期。隨著BKCI的發布,也有學者利用BKCI的數據研究某個學科的半衰期。劉曉娟、馬梁[9]、宋雯斐、劉曉娟[10]基于BKCI分析了圖書的半衰期。但少有基于中文圖書研究圖書引用半衰期或者被引半衰期,更少有研究者基于中文圖書同時對圖書的引用半衰期和期刊半衰期進行研究。

因此,本文將利用中文語言學圖書參考文獻數據和引文文獻數據研究中文語言學圖書的被圖書引用半衰期、被期刊引用半衰期以及引用圖書半衰期和引用期刊半衰期,這對補全文獻半衰期研究的版圖,探索中文圖書的老化特征及其演變規律,促進圖書館藏、剔舊等由經驗管理向科學管理的轉變,評價圖書的研究價值,研究圖書著者的學術影響力具有重要價值。

一、數據來源

本文首先從國家圖書館獲取所有中圖分類號以“H”開頭的圖書,然后根據中圖分類號(CLC),過濾非語言學圖書;其次按照圖書記錄中的文獻類型字段,過濾所有非“專著”圖書;再次按照學術著作標準,過濾教材、手冊、科普讀物等所有非學術類語言學圖書:共獲得有效中文語言學圖書20 411本。最后從超星發現數據庫獲取以上語言學學術著作的參考文獻和引證文獻。

本文從20 411本圖書中選擇出版年在1997-2014年之間語言學學術圖書共16 217本進行半衰期分析。其圖書類型參考文獻數量、期刊類型參考文獻數量分別為3 384 447條、743 793條,在統計年被圖書引用總次數、被期刊引用總次數分別為439 766次、370 869次,具體如表1。

表1 1997-2014年中文語言學圖書引用及其被引分布

二、半衰期計算

(一)引用半衰期

文獻引用半衰期是指該文獻集合在統計年(T年度)中所引用(參考)的文獻中,較新文獻的引用(參考)次數達到總引用(參考)的50% 的年數。文獻引用半衰期表示文獻參考利用文獻的新舊程度。根據其定義得出對應的計算公式如公式(1)所示:

HCitingT=N+(50%-R1)/(R2-R1)

(1)

公式(1)中,文獻引用半衰期指數為HCiting,R1為累計引用頻次最接近、并小于50%的那年的累計引用百分比,R2為累計引用頻次最接近、并不小于50%的那年的累計引用百分比,N為累計引用百分比為R1的那年到T年的間隔年數。根據引用的文獻類型的不同,文獻引用半衰期可以分為引用期刊半衰期和引用圖書半衰期。

引用圖書半衰期是指該文獻集合在統計年(T年度)中所引用(參考)的圖書中,較新出版圖書的引用(參考)次數達到圖書總引用(參考)的50%的年數。圖書引用半衰期表示圖書利用圖書的新舊程度,其值越小,表示引用的圖書越新。其計算方法同公式(1)。

對引用年在T年的圖書集合進行統計(即統計年為T),首先把T年引用的圖書按照出版年度統計,然后分別計算其所占T年總引用百分比和累計百分比,最后將相應T年的間隔年數標記為1,并依次標記間隔年數,分別統計出1997-2014年圖書引用圖書出版年分布情況。

根據定義,如表2可知,當統計年為2014年時,累計引用頻次最接近、并小于50%的那年的累計引用百分比R1=49.32%,累計引用頻次最接近、并不小于50%的那年的累計引用百分R2=52.88%,累計引用百分比為R1的那年到T年的間隔年數N=12,根據公式(1),圖書在2014年的引用圖書半衰期HCiting2014=12+50%-49.32%)/(52.88%-49.32)%=12.19。

表2 引用年為2014年語言學圖書引用圖書半衰期

同理可計算出來源圖書在1997-2013年的引用圖書半衰期,計算結果如表3所示。

表3 語言學圖書引用圖書半衰期

由表3可知,在1990年-2014年之間,語言學圖書最大引用圖書半衰期出現在1999年,是19.14年,最小的出現在2010年,是10.49年,平均引用圖書半衰期是13.67年。

引用期刊半衰期是指該文獻集合在統計年(T年)中所引用(參考)的期刊論文中,較新發表期刊論文的引用(參考)次數達到期刊總引用(參考)的50%的年數。引用期刊半衰期表示圖書利用期刊的新舊程度,其值越小,表示利用的期刊越新,其計算方法同公式(1)。

根據定義,由表4可知,當統計年為2014年時,累計引用頻次最接近、并小于50%的那年的累計引用百分比R1=49.76%,累計引用頻次最接近、并不小于50% 的那年的累計引用百分比R2=54.08%,累計引用百分比為A的那年到T年的間隔年數N=10。根據公式(1),圖書在2014年的引用期刊半衰期HCiting2014=10+50%-49.76%)/(54.08%-49.76%)=10.06。

同理,可計算出中文語言學圖書在1997-2013年的引用期刊半衰期,計算結果如表5所示。

由表5可知,在1997年-2014年之間,語言學圖書最大引用期刊半衰期出現在2002年,是17.49年;最小的出現在2009年,是7.46年;平均引用期刊半衰期是11.94年。

表4 引用年為2014年語言學圖書引用期刊半衰期

表5 語言學圖書在1997-2014年引用期刊半衰期

(二)被引半衰期

文獻被引半衰期,指文獻集合在統計年(T年度)被引用的總次數中,較新的一半文獻是在多長時間內發表的,這個時間段就是文獻的被引半衰期。文獻被引半衰期越長,說明文獻的學術生命也越長,該文獻越有長期的參考價值。根據其定義得出對應的計算公式如公式(2)所示:

HCitedT=M+(50%-C1)/(C2-C1)

(2)

公式(2) 中,文獻被引半衰期指數為Hcited,C1為累計被引頻次最接近、并小于50% 的那年的累計被引百分比,C2為累計被引頻次最接近、且不小于50%的那年的累計被引百分比,M為累計被引百分比為C1的那年到T年的間隔年數。根據被引對象的不同類型文獻,可以分為被圖書引用半衰期、被期刊引用半衰期。

被圖書引用半衰期是指該文獻集合在統計年(T年度)被圖書引用的總次數中,較新的占50%的被引圖書的出版間隔年數。被圖書引用半衰期表示文獻生命力,其值越長,表示其對圖書的價值越大,其計算方法同公式(2)。

對被引年在T年的圖書集合進行統計(即統計年為T),首先把在T年被圖書引用的圖書按照出版年度統計,然后分別計算其所占T年總被圖書引用百分比,和累計百分比,最后將相應T年的間隔年數標記為1,并依次標記間隔年數,分別統計出1997-2014年圖書被圖書引用出版年分布情況。

表6 被引年為2014年語言學圖書被圖書引用半衰期

根據定義,由表6可知,當統計年為2014年時,累計被引頻次最接近、并小于50%的那年的累計引用百分比C1=49.31%,累計被引頻次最接近、并不小于50% 的那年的被引累計百分比C2=52.26%,被引累計百分比為C1的那年到T年的間隔年數X=10,根據公式(1),圖書在2014年的被圖書引用半衰期HCited2014=10+50%-49.31%)/(52.26%-49.31%)=10.23。

同理可計算出來源圖書在1997-2013年被圖書引用半衰期,計算結果如表7所示。

由表7可知,在1997-2014年之間,語言學圖書的最大被圖書引用半衰期出現在2010年,是10.96年,最小出現在1997年,是4.36年,平均被圖書引用半衰期是8.53年。

被期刊引用半衰期是指該文獻集合在統計年(T年度)被期刊論文引用的總次數中,較新的占50%的被引圖書的出版間隔年數。被期刊引半衰期表示文獻生命力,其值越長,表示其對期刊論文的價值越大,其計算方法同公式(2)。

表7 語言學圖書在1997-2014年被圖書引用半衰期

表8 被引年為2014年語言學圖書被期刊引用半衰期

根據定義,由表8可知,當統計年為2013年時,累計被引頻次最接近、并小于50%的那年的累計引用百分比C1=45.99%,累計被引頻次最接近、并不小于50% 的那年的被引累計百分比C2=51.11%,被引累計百分比為C1的那年到T年的間隔年數M=11,根據公式(1),圖書在2014年的被期刊引用半衰期HCited2014=11+50%-45.99%)/(51.11%-45.99%)=11.78。

同理可計算出來源圖書在1997 -2013年被期刊引用半衰期,計算結果如表9所示。

由表9可知,在1997年-2014年之間,語言學圖書最大被期刊引用半衰期出現在2013年,是11.84年;最小的出現在1997年,是4.31年;平均被期刊引用半衰期是7.28年。

表9 語言學圖書在1997-2014年被期刊引用半衰期

三、半衰期分析

(一)引用半衰期分析

1997—2014年,中文語言學圖書的引用圖書半衰期在10.49~19.14年之間,引用期刊半衰期在7.46~17.49之間,平均引用圖書半衰期13.67年大于平均引用期刊半衰期11.94年,其年度分布曲線如圖1所示。

圖1語言學圖書引用圖書和期刊半衰期

由圖1可知,引用圖書半衰期和引用期刊半衰期走勢相似,進一步分析易知,兩者的相關Pearson相關系數為0.90,表明圖書的引用圖書半衰期和引用期刊半衰期正相關。這給我們測量圖書半衰期提供新思路,在現有圖書引文數據庫不夠完善的條件下,當引用期刊文獻的引用圖書半衰期和引用期刊半衰期正相關時,可以利用期刊引用圖書的數據來表征圖書的半衰期變化。

Sangam[11]認為文獻數量增長越快,文獻老化速度越快、半衰期越短。由前表1可知,語言學學術圖書的數量越來越多。在1997-2014年之間,引用期刊半衰期和引用圖書半衰期的線性趨勢如圖1直線所示,圖書的引用半衰期在變短,圖書老化速度在加快,與Sangam的結論基本一致,文獻老化與文獻的數量有關。

進一步分析可知,引用圖書半衰期和引用期刊半衰期在2002年之后,其值大小穩步減小,直至2009年之后小幅上升。表明在2002—2009年,學者利用的文獻越來越新,可能的原因是技術影響著學術傳播和交流,即隨著信息技術的發展,學者獲取新文獻的方式越來越便捷,學者可以更快地獲取新文獻,并利用新文獻。值得注意的是,在2002—2009年之間,引用期刊半衰期比引用圖書半衰期下降得更快,反映學者更傾向于或者更快捷地利用相對較新的期刊論文。但在2009年以后,文獻的半衰期變高,這是否表明現在發表的文獻的價值逐漸減低,抑或信息技術的發展使得學者獲取老文獻越來越方便,值得進一步研究。

(二)被引半衰期分析

1997—2014年,中文語言學圖書的被圖書引用半衰期在10.96~4.36年之間,被期刊引用半衰期在4.31~11.84年之間,平均被圖書引用半衰期8.53年大于被期刊引用半衰期7.28年,其年度分布曲線如圖2所示。

圖2語言學圖書被圖書和期刊引用半衰期

由圖2可知,中文語言學圖書的被圖書引用半衰期和被期刊引用半衰期走勢相似,進一步分析易知,兩者的相關Pearson相關系數為0.79,表明圖書的被圖書引用半衰期和被期刊引用半衰期正相關。

黨亞茹等[12]認為期刊的被引半衰期可以反映研究成果的生命力。由圖2可知,中文語言學圖書的被圖書引用半衰期和被期刊引用半衰期曲線都呈上升趨勢,表明語言學學科圖書對圖書和期刊的利用價值越來越大,生命力越來越強。但是,被圖書引用半衰期到2010年開始呈下降趨勢,被期刊引用半衰期直至2013年才開始呈微弱下降。

如圖2,在1999-2011年之間,被圖書引用半衰期大于被期刊引用半衰期,在2012年以后語言學圖書的被圖書引用半衰期開始小于被期刊引用半衰期。

通過對比分析引用圖書半衰期、引用期刊半衰期和被圖書引用半衰期、被期刊引用半衰期,本文發現,引用半衰期和被引半衰期表征的半衰期的特征不一樣,存在明顯區別。

四、結論

本文通過對中文語言學圖書的半衰期的實證分析,彌補了中文圖書半衰期研究領域的不足。通過測量1997—2014年中文語言學圖書的引用圖書半衰期、引用期刊半衰期、被圖書引用半衰期、被期刊引用半衰期,發現引用圖書半衰期和引用期刊半衰期、被圖書引用半衰期和被期刊引用半衰期分別呈正相關;平均引用圖書半衰期13.67年大于平均引用期刊半衰期11.94年,平均被圖書引用半衰期8.53年大于被期刊引用半衰期7.28年。同時對它們的趨勢進行分析,了解到引用半衰期在整體呈下降趨勢,但近幾年呈上升趨勢;被引半衰期整體呈上升趨勢,近兩年趨于穩定。通過對比圖書引文半衰期和被引半衰期,表征的半衰期的特征不一樣,存在明顯區別。以上結論,對于研究文獻的老化規律具有重要價值,為提升圖書利用價值、優化館藏具有重要價值。

由于引用圖書的粒度不統一或者規范、圖書參考文獻著錄的不規范以及超星公司提供的參考和引證數據的不全面,致使本文測量的半衰期存在誤差,值得進一步采集更全面、準確的數據來對半衰期進行測量。

猜你喜歡
年數半衰期百分比
我國人口在校模式高質量發展研究
稻秸還田年數和氮肥運籌對小麥出苗和幼苗形態及生理特性的影響
普通照明用自鎮流LED燈閃爍百分比測量不確定度分析
基于引用半衰期的我國五官學期刊文獻老化研究
基于JCR?的國外臨床醫學學科半衰期
趨勢攻略之趨勢線:百分比線
雙倍余額遞減法與年數總和法的比較
基于文獻計量學的我國化學學科半衰期分析
環保車型最多的美國城市
學會當翻譯
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合