?

檔案學研究中計量法運用的計量分析

2014-06-11 12:26王新才文振興
檔案管理 2014年3期
關鍵詞:計量法檔案學

王新才++文振興

摘 要:計量學作為定量分析的重要部分,近年來在檔案學領域內日漸興盛。本文以CNKI期刊導航中的27本檔案學期刊為統計源,對運用計量法研究的學術論文進行統計,從年度分布、期刊分布、作者情況、研究機構、被引頻次、計量單元以及論文主題7個方面對運用計量法的研究論文進行了分析,以期為學科的發展與后來的研究者提供一定的參考價值。

關鍵詞:檔案學;計量法;文獻計量法.

Abstract: Based on the 27 archival science journals in CNKIs Journals navigation, this paper makes a statistics analysis of articles related to the metric methods. Combined with the methods of the bibliometric, this article reveals the characteristics of research from the point of annual distribution, journal distribution, high yield of the core units and core authors, citations, metering units as well as research subjects.

Keywords:Archival Science;Metric Methods;Bibliometricals.

定量研究與定性研究是社會科學領域內的兩種研究范式,前者以概率論、統計學為基礎,后者以歷史學、邏輯學為基礎,在檔案學領域內,定量研究遠不如定性研究取得的成果豐碩。但不可否認,定量研究對學科的完善是十分重要的,計量法就是其中的一種,廣義計量法的計量對象十分廣泛,狹義的計量法更多關注文獻情報的量化統計,本文采用狹義的計量法概念,就計量法的方法體系而言,目前在檔案學領域內運用較多的有統計分析、引文分析、詞頻分析、共現分析與聚類分析5種方法。本文以文獻計量法為研究方法,對計量法在檔案學領域的運用做了統計分析。

1 數據獲取與數據處理

本文選取CNKI“中國學術期刊網絡出版總庫”作為數據源,期刊涵蓋CNKI期刊導航中檔案學領域的27本期刊。由于運用計量法在檔案學領域所產生的研究成果不是很多,為獲得更全面的數據,從以下兩個方面進行數據檢索,一是關鍵詞全文檢索,檢索式為“全文=計量 or 全文=引文分析 or 全文=詞頻分析 or 全文=共現分析 or 全文=聚類分析 or 摘要=統計分析”,其中,關鍵詞“統計分析”不具專指性,因而進行摘要檢索;二是綜述性文章間接獲取,以“綜述”、“評析”、“述評”與“評述”四個詞語進行題名檢索,原因在于很多關于某一主題的綜述性文章較多地使用了計量法來進行定量分析。通過以上兩個步驟在盡量保證數據檢全率的基礎上,再結合論文的摘要剔除大量的不相關數據保證數據的檢準率,但對僅僅提及文獻數量的論文排除在數據篩選范圍之外,兩類檢索經過數據相加去重后得到論文286篇。

2 數據統計與分析

2.1 年度分布。論文年度分布可以反映主題研究的發展態勢,截至當前,2013年與計量法相關的論文有48篇,其余年度分布見圖1,可以看出,國內檔案學研究對計量法的運用可以追溯到1988年,有兩篇文章[1][2]。從曲線波動情況來看,2000年以前,論文數量總體不多,只有32篇,但在1994年前后出現了一個小波峰,這得力于四川涪陵地區檔案局羅力的研究貢獻,在1994年前后共發文9篇。2000年以來,發文量逐漸增加,合計254篇,占了總論文量的88.81%,特別是2009年以來,幾乎呈現直線增長,2009年至2013年的發文量就達到了208篇,占了72.73%,由此可見,目前,計量法在檔案學研究中的運用已逐漸成為一個熱態。

圖1 年度分布

表1 期刊分布

2.2 期刊分布。由于部分期刊的名稱有變動,例如,《檔案管理》的曾用刊名為《河南檔案》,為便于統計,筆者將曾用刊名一律統計于現用刊名,結果見表1。整體來看,排名前10的期刊占了論文總量的90%,其余的17本期刊則不到10%,且有5本期刊目前沒有計量論文,而頻次在20次以上的期刊論文占了論文總量的75%以上,說明計量類論文的期刊分布很集中。

2.3 作者情況。在1999年以前的32篇論文中,作者有22人,其中有16人發文1篇,發文量最高(9篇)的是四川涪陵地區檔案局的羅力。2000年以后,發文3篇以上的作者有19人,比上個世紀要多。整體來看(表2),論文作者共計304人,頻次共計427次,根據普賴斯定律,高產作者約為17人,由于3篇的有10人,因此3篇及以上的21位作者均列為檔案學領域計量研究的高產作者,此外,只發文1篇的有235位,占了作者總量的77.3%。

表2 作者情況

合作發文能充分開發集體智慧,利于研究進展。在286篇論文中,共有304位作者,其中合作論文有119篇,根據合作度與合作率的測算公式,得到合作度為1.06(作者總數/論文總數),合作率為41.61%(合作論文數/論文總數)。將該數據與已有研究的統計數據,比如綜述[3]、檔案法[4]等相比,合作率要高,原因之一在于計量研究需要利用跨學科的知識,其二,對大量數據的統計工作需要合作完成。

2.4 研究機構。研究機構按照一級名稱進行統計,比如,將武漢大學信息管理學院統一為武漢大學,對獨立作者附兩個單位的情形按第一單位統計,此外,同一機構內合作文章存在單位名稱1次或多次注明的情況,按1次統計。除了早期5篇論文的5位作者無法查找單位外,統計到的研究機構共有91個,頻次共計300次,其中排名前10 的單位占了總量的50%以上,見表3,其中,四川涪陵地區檔案局是20世紀90年代的高產單位。

表3 核心單位分布

另外,按照單位的性質對論文進行歸類,分為政府(含事業單位)、高校與企業,在附有研究機構的162篇非合作文章中,高校132篇,政府29篇,企業1篇。在119篇合作論文中,同一機構內合作的有98篇,其中高校96篇,政府與企業各1篇,跨機構研究論文有21篇,其中,跨高校的有12篇,高校與政府合作發文7篇,高校與企業合作發文2篇,可以看出,獨立發文是主流,合作論文中以同一機構內的合作為主,跨機構的合作暫時不多。

2.5 被引頻次。被引用頻次共計553次,其中2013年度的論文僅有1篇有1次被引,由于論文被引需要一定時間才能實現,因此2013年的48篇文章排除在分析之外。在余下的238篇論文中,被引頻次共計552次,平均被引頻次為2.32次,該數據表明計量論文的學術價值相對較高,由表4可知,有96篇文章的被引頻次為0,占了40.34%,表明檔案學領域內的計量文章約有2/3的論文能被引用,不小于10次的高被引用論文數量有15篇,其中,7篇分布在《檔案學通訊》上,5篇分布在《檔案管理》上,另外還有2篇《檔案學研究》的論文及1篇《檔案》上的論文。

表4 被引頻次分布

2.6 計量單元。計量法的特征之一是對文獻的特征進行分析,不同計量單元可以提供不同信息,在統計到的34個計量單元中,頻次在1次以上的有19個,見表5。從論文計量單元的數量來看,在286篇論文中,計量單元不小于6個的有22篇(7.7%),在4個~6個間的有101篇(35.31%),在2個~3個間的有113篇(39.51%),但還有50篇論文只有1個計量單元,占了17.48%,這部分文章多為綜述性文章與熱點分析論文,前者很多僅對年度做了統計與分析,后者多運用自動化軟件對關鍵詞進行分析。從表5也可以看出,排名前7的計量單元基本上屬于傳統的統計分析,除了關鍵詞,其余的計量單元大多屬于引文分析。值得一提的是,表中的“欄目”是期刊欄目的計量單元,包括欄目的設置及各欄目的載文量等。頻次為1次的計量單元主要有兩方面,一是期刊,包括摘要、目錄、封地排印等,二是網絡引文,包括域名、訪問性等。

表5 計量單元頻次統計

3 論文主題分析

劃分主題可以把握計量法在檔案學中的運用現狀,為后來的研究者提供參考價值。筆者參照《檔案學基礎》[5]的內容體系結構,將一級主題設置為檔案本體、檔案工作、檔案事業與檔案學科,但將電子文件、文獻遺產、政府信息、知識管理四類較為新穎的主題單列出來,此外,由于期刊統計也是計量熱點,將之獨立出來。值得說明的是,論文在主題劃分時可能存在主題交叉的情況,以“人事檔案”為例,既可以歸入不同類型的檔案中,又可以歸入檔案工作中,根據主要內容而定,結果見表6。

表6 主題劃分

3.1 期刊統計是計量法運用最早的主題。根據表6,關于期刊統計的論文有57篇,國內關于該主題的計量研究起步很早,早在20世紀八九十年代的32篇論文中,就有20篇是與該主題相關的。關于期刊統計主要有兩個方面,一是對期刊在一段時間內的載文、引文進行計量,有6本期刊有2篇及以上這樣的論文,并且基本上呈現分析時段不重疊且保持連續的特點。另外一個是對作者進行專門分析,分析活躍作者群與合著情況。

3.2 檔案事業是計量法運用最弱的主題。論文數量只有23篇,是計量法運用最弱的領域,但年度均集中分布在2007年以后,特別是在2012年,就有10篇文章,幾乎占了該主題論文數量的一半。從論文主題來看,有12篇與檔案館、文件中心等檔案機構相關,但對企業檔案館及其他的計量研究還是空白,另外,在檔案事業的人才培養上,關于檔案職業與教育已有計量研究,但檔案教育有3篇論文是從研究生的角度出發的。

3.3 檔案學科是計量法運用最活躍的主題。在57篇論文中,有31篇論文分布在2011年~2013年間,其中,對檔案研究現狀的計量研究是最活躍的,占了26篇,該主題的研究思路比較統一,基本上采取詞頻統計、聚類分析、主題劃分等方法或者直接利用可視化軟件構建知識圖譜等來對檔案學的研究進展以及研究熱點進行分析。但對國外檔案學與關聯學科的計量研究是薄弱環節,隨著近年來跨學科研究的興起,對關聯學科的研究將是未來本領域內的一個計量熱點。

3.4 檔案種類與檔案法規是計量法運用較多的二級主題。對不同類型檔案的計量研究有26篇論文,涉及15種檔案,該統計不考慮檔案種類的劃分標準,其中,聲像檔案、民族檔案與人事檔案數量最多。檔案法規的計量研究有13篇,除了1篇在《檔案學研究》中,其余的12篇均在《檔案管理》上,從主題來看,關于檔案法“操作性”有3篇,“軟法”說2篇,其余的大多與執法相關。

4 思考

計量學在圖書館學中的運用已經很成熟,在情報學中又在不斷地拓展加深,當前,在圖書、情報、檔案一體化與學科交叉發展的形勢下,檔案學通過對同族學科研究方法、研究理念的借鑒或移植,可以有力地推動本學科的發展。從圖1可以看出,計量法在檔案學研究中的運用有成為熱點的跡象,已呈現出“運用范圍廣、研究主題多”的特點。計量研究能為研究者把握學科的發展現狀,提供熱點、冷門領域信息,為后來研究者的研究選擇提供情報參考價值,這是計量論文高被引的原因之一。

但在相關論文急遽增長的形勢下,也不乏學術研究的跟風現象,這應當引起學術研究者的注意與思考。當下的學術研究強調科學、實證與數據,而理論與邏輯基礎均為實證主義的定量研究[6]很契合該理念,筆者認為這是計量法在檔案學術領域中逐漸盛行的原因之一。但計量法的運用應建立在已有研究的基礎之上,并不是所有的主題都適合進行計量分析,在運用計量法研究之前,至少應有三道論證程序,一是“Why”,即為什么要計量研究,主題是否適合運用計量法。二是“What”,即計量單元有哪些,計量分析的預期結果是什么。三是“How”,怎么運用計量法,現有的條件與能力是否能保證計量研究的科學性及學科代表性。這三道程序并不是孤立的,而是在前者的基礎上反復地論證研究的科學性、合理性。而當前,計量法在檔案學領域中的運用還存在著以下幾個值得思考的地方:

第一,統計分析之外的研究方法運用少。計量學的方法體系眾多,除了統計分析外,還有引文分析、聚類分析等,但檔案學領域中運用最多的還是傳統的統計分析。未來計量學的發展趨勢之一是信息化,即計量單元將會深入到內部知識單元和相關信息中,而最簡單的統計分析已無法滿足該要求。[7]此外,圖書館學、情報學中的計量研究已較多地使用可視化軟件、共詞分析等自動化工具,學習運用這些工具可能會費時費力,這是聚類分析、詞頻分析等方法體系在本領域運用較少的原因之一,也是未來檔案學研究者需要克服的困難之一。

第二,研究內容不關注理論貢獻,停留在數據羅列的層面??茖W的重要特征之一是客觀,定量研究旨在通過數據描述客觀事實,但正如磚頭非房子一樣,數據羅列也構不成理論,因而定量研究無法展現更為深層次的信息,但定性研究可以彌補這一缺陷,通過思辨、總結,挖掘出事物背后的深層次原因[8],這是理論貢獻最重要的組成部分,但當前檔案學內的計量研究在內容分析上有待加強。此外,如前所述,還存在計量單元少的問題,計量單元在3個以內的有163篇,占了56.99%,大多是年度、期刊與主題劃分的組合。

第三,研究過程有趨于流程化、公式化的傾向,給人以只在驗證某些已有結論的印象[9],文獻計量學有很多定律,比如布拉德福定律、洛特卡定律、普賴斯定律等,這些定律均是前人在對大量文獻研究的基礎上發現的,時間長、樣本多是其本質特征,但檔案學中的計量分析卻存在“數據少、時間跨度短”的現象,特別是期刊載文、引文分析,有的時間跨度僅為1年~2年,在此基礎上基于文獻計量學的定律所確定的核心作者、高被引論文,并不合理。

第四,研究主題上有避重就輕、趨易避難的跡象。從主題頻次分布來看,數據獲取渠道相對容易的中文期刊載文、引文分析與國內檔案學研究進展、研究熱點是計量法運用最活躍的領域,但是對于關聯學科、國外檔案學等不容易直接檢索數據或渠道受限的研究則很少,這需要引起檔案學領域內計量研究者的思考。

無可否認,定量研究對一個學科的發展完善是十分重要的,未來的檔案學研究在運用計量法時,需要逐漸擴大計量樣本與時間跨度,納入更多的方法體系,同時端正學術研究行為,更多地關注有價值的計量主題,進而推動檔案學科的發展。

參考文獻:

[1]吳劍梅.從《全國報刊索引》看文獻信息學科的發展[J].檔案與建設,1988(05):13~16.

[2]冬牧.《四川近代史》檔案引文分析[J].檔案工作,1988(10):25.

[3]張愷.2001年~2010年我國檔案學核心期刊綜述類文獻的計量分析[J]. 檔案學通訊,2011(05):17~22.

[4]王新才,文振興.我國檔案法研究綜述[J].檔案學研究,2013(03):21~25.

[5]朱玉媛.檔案學基礎[M].武漢:武漢大學出版社,2008.

[6]沃野.關于社會科學定量、定性研究的三個相關問題[J].學術研究,2005(04):41~47.

[7]范全青,郭維真,鳳元杰. 我國文獻計量學研究30年之發展[J].情報資料工作,2009(03):30~33+60.

[8]李強.完善社會學的定性研究與定量研究[N].中國社會科學報,2009-10-08.

[9]馬費成,H.R.西蒙. 文獻計量學的現狀與趨勢[J].情報科學,1992(05):7~17+79.

(作者單位:武漢大學 來稿日期:2014-02-18)

第一,統計分析之外的研究方法運用少。計量學的方法體系眾多,除了統計分析外,還有引文分析、聚類分析等,但檔案學領域中運用最多的還是傳統的統計分析。未來計量學的發展趨勢之一是信息化,即計量單元將會深入到內部知識單元和相關信息中,而最簡單的統計分析已無法滿足該要求。[7]此外,圖書館學、情報學中的計量研究已較多地使用可視化軟件、共詞分析等自動化工具,學習運用這些工具可能會費時費力,這是聚類分析、詞頻分析等方法體系在本領域運用較少的原因之一,也是未來檔案學研究者需要克服的困難之一。

第二,研究內容不關注理論貢獻,停留在數據羅列的層面??茖W的重要特征之一是客觀,定量研究旨在通過數據描述客觀事實,但正如磚頭非房子一樣,數據羅列也構不成理論,因而定量研究無法展現更為深層次的信息,但定性研究可以彌補這一缺陷,通過思辨、總結,挖掘出事物背后的深層次原因[8],這是理論貢獻最重要的組成部分,但當前檔案學內的計量研究在內容分析上有待加強。此外,如前所述,還存在計量單元少的問題,計量單元在3個以內的有163篇,占了56.99%,大多是年度、期刊與主題劃分的組合。

第三,研究過程有趨于流程化、公式化的傾向,給人以只在驗證某些已有結論的印象[9],文獻計量學有很多定律,比如布拉德福定律、洛特卡定律、普賴斯定律等,這些定律均是前人在對大量文獻研究的基礎上發現的,時間長、樣本多是其本質特征,但檔案學中的計量分析卻存在“數據少、時間跨度短”的現象,特別是期刊載文、引文分析,有的時間跨度僅為1年~2年,在此基礎上基于文獻計量學的定律所確定的核心作者、高被引論文,并不合理。

第四,研究主題上有避重就輕、趨易避難的跡象。從主題頻次分布來看,數據獲取渠道相對容易的中文期刊載文、引文分析與國內檔案學研究進展、研究熱點是計量法運用最活躍的領域,但是對于關聯學科、國外檔案學等不容易直接檢索數據或渠道受限的研究則很少,這需要引起檔案學領域內計量研究者的思考。

無可否認,定量研究對一個學科的發展完善是十分重要的,未來的檔案學研究在運用計量法時,需要逐漸擴大計量樣本與時間跨度,納入更多的方法體系,同時端正學術研究行為,更多地關注有價值的計量主題,進而推動檔案學科的發展。

參考文獻:

[1]吳劍梅.從《全國報刊索引》看文獻信息學科的發展[J].檔案與建設,1988(05):13~16.

[2]冬牧.《四川近代史》檔案引文分析[J].檔案工作,1988(10):25.

[3]張愷.2001年~2010年我國檔案學核心期刊綜述類文獻的計量分析[J]. 檔案學通訊,2011(05):17~22.

[4]王新才,文振興.我國檔案法研究綜述[J].檔案學研究,2013(03):21~25.

[5]朱玉媛.檔案學基礎[M].武漢:武漢大學出版社,2008.

[6]沃野.關于社會科學定量、定性研究的三個相關問題[J].學術研究,2005(04):41~47.

[7]范全青,郭維真,鳳元杰. 我國文獻計量學研究30年之發展[J].情報資料工作,2009(03):30~33+60.

[8]李強.完善社會學的定性研究與定量研究[N].中國社會科學報,2009-10-08.

[9]馬費成,H.R.西蒙. 文獻計量學的現狀與趨勢[J].情報科學,1992(05):7~17+79.

(作者單位:武漢大學 來稿日期:2014-02-18)

第一,統計分析之外的研究方法運用少。計量學的方法體系眾多,除了統計分析外,還有引文分析、聚類分析等,但檔案學領域中運用最多的還是傳統的統計分析。未來計量學的發展趨勢之一是信息化,即計量單元將會深入到內部知識單元和相關信息中,而最簡單的統計分析已無法滿足該要求。[7]此外,圖書館學、情報學中的計量研究已較多地使用可視化軟件、共詞分析等自動化工具,學習運用這些工具可能會費時費力,這是聚類分析、詞頻分析等方法體系在本領域運用較少的原因之一,也是未來檔案學研究者需要克服的困難之一。

第二,研究內容不關注理論貢獻,停留在數據羅列的層面??茖W的重要特征之一是客觀,定量研究旨在通過數據描述客觀事實,但正如磚頭非房子一樣,數據羅列也構不成理論,因而定量研究無法展現更為深層次的信息,但定性研究可以彌補這一缺陷,通過思辨、總結,挖掘出事物背后的深層次原因[8],這是理論貢獻最重要的組成部分,但當前檔案學內的計量研究在內容分析上有待加強。此外,如前所述,還存在計量單元少的問題,計量單元在3個以內的有163篇,占了56.99%,大多是年度、期刊與主題劃分的組合。

第三,研究過程有趨于流程化、公式化的傾向,給人以只在驗證某些已有結論的印象[9],文獻計量學有很多定律,比如布拉德福定律、洛特卡定律、普賴斯定律等,這些定律均是前人在對大量文獻研究的基礎上發現的,時間長、樣本多是其本質特征,但檔案學中的計量分析卻存在“數據少、時間跨度短”的現象,特別是期刊載文、引文分析,有的時間跨度僅為1年~2年,在此基礎上基于文獻計量學的定律所確定的核心作者、高被引論文,并不合理。

第四,研究主題上有避重就輕、趨易避難的跡象。從主題頻次分布來看,數據獲取渠道相對容易的中文期刊載文、引文分析與國內檔案學研究進展、研究熱點是計量法運用最活躍的領域,但是對于關聯學科、國外檔案學等不容易直接檢索數據或渠道受限的研究則很少,這需要引起檔案學領域內計量研究者的思考。

無可否認,定量研究對一個學科的發展完善是十分重要的,未來的檔案學研究在運用計量法時,需要逐漸擴大計量樣本與時間跨度,納入更多的方法體系,同時端正學術研究行為,更多地關注有價值的計量主題,進而推動檔案學科的發展。

參考文獻:

[1]吳劍梅.從《全國報刊索引》看文獻信息學科的發展[J].檔案與建設,1988(05):13~16.

[2]冬牧.《四川近代史》檔案引文分析[J].檔案工作,1988(10):25.

[3]張愷.2001年~2010年我國檔案學核心期刊綜述類文獻的計量分析[J]. 檔案學通訊,2011(05):17~22.

[4]王新才,文振興.我國檔案法研究綜述[J].檔案學研究,2013(03):21~25.

[5]朱玉媛.檔案學基礎[M].武漢:武漢大學出版社,2008.

[6]沃野.關于社會科學定量、定性研究的三個相關問題[J].學術研究,2005(04):41~47.

[7]范全青,郭維真,鳳元杰. 我國文獻計量學研究30年之發展[J].情報資料工作,2009(03):30~33+60.

[8]李強.完善社會學的定性研究與定量研究[N].中國社會科學報,2009-10-08.

[9]馬費成,H.R.西蒙. 文獻計量學的現狀與趨勢[J].情報科學,1992(05):7~17+79.

(作者單位:武漢大學 來稿日期:2014-02-18)

猜你喜歡
計量法檔案學
歷史追溯與革新路徑:中國檔案學基礎理論研究的特征闡釋
中華人民共和國計量法
計量檢測技術在質量技術監督工作中的探索實踐
關于檔案學會工作的幾點思考
歷史主義是檔案學不變的靈魂和宗旨
——《魂系歷史主義——西方檔案學支柱理論發展研究》述評
農村環境治理的研究綜述與發展態勢分析——基于文獻計量法
基于文獻計量法的名師工作室研究統計分析
省檔案學會六屆二次常務理事會議在南京召開
計量法修訂草案已報國務院
淺談檔案學的研究對象與任務
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合