?

從求實到求是:數字史學的價值與追求
——兼與成一農教授討論

2022-06-09 15:34李中清
關鍵詞:歷史學史學史料

梁 晨 李中清

近年來,大數據、數字人文等數字化教研工作越來越受重視,它們不僅被視為新時代人文研究升級進化的抓手和當下“新文科”建設的核心內容,也吸引了越來越多的年輕學人投身其中。學術熱情的激揚,在不斷激勵年輕學人砥礪前行的同時,也引起了一些學者的警惕和質疑。云南大學成一農長期從事歷史地理學研究,對技術化的歷史地理信息系統和歷史數據整理與研究等富有經驗,他撰寫的《拋棄人性的歷史學沒有存在價值——“大數據”“數字人文”以及歷史地理信息系統在歷史研究中的價值》①成一農:《拋棄人性的歷史學沒有存在價值——“大數據”“數字人文”以及歷史地理信息系統在歷史研究中的價值》,《清華大學學報》2021年第1期。(以下簡稱《成文》)一文是這類冷靜反思的代表?!冻晌摹芬环矫婢o盯數字技術的最新發展及其在歷史研究中的運用,認為“‘大數據’‘數字人文’等技術將會在史料的挖掘,甚至考訂‘史實’的研究層面帶來徹底的變革”,道出了數字史學研究者的共同感受;另一方面又認為歷史學的終極目標不是“求真”,而是有目的和有人性的“解釋”和“預測未來”。在這一層面,數字技術的影響有限,數字史學對歷史研究的價值只是基礎性的,對實現終極目標沒有多少幫助。同時,《成文》認為,相比較于強調推進數字化研究,我國史學研究中長期忽視主觀性和人性才是更嚴重的問題。

作為主要從事量化史學和社會科學化歷史研究的學者,對數字技術方法在史學研究中的效能與限度以及何以能做出有思想的數字史學研究等問題,我們也同樣有所關注和思考。我們認為《成文》再次重申了史學研究中人性追求的核心地位,有助于數字史學研究者不斷檢討研究方式、方法與研究目的辯證關系,在深入反思研究方法不斷數據化、科學化的同時,②科學概念具有相當的復雜性,這里更多是規范性認識。切不可一味追求技術的應用而忽視歷史研究所應具備的滲透力和思想性。但同時,《成文》認為史學研究的終極目標在于解釋和預測,數字史學只在史實考訂層面有作用,在解釋層面則無可作為,對歷史研究的價值不大的判斷,在分析邏輯和對數字史學功能的理解上都頗可商榷。解釋本身是歷史研究求真目標中不可分割的部分,將解釋從求真的目標中剝離出來,甚至對立起來,是從比較狹隘的角度理解歷史研究求真的內涵。盡管幾乎所有的學科都要做解釋工作,但歷史學必須以求真為標準,解釋不能僅建立在理論、價值觀和政治立場之上,必須基于客觀和廣泛的史料掌握、嚴格的史料考訂和規范的史料解讀。史學研究當然具有多維度“人”的屬性,具有主觀性,但“客觀先行”,先“求實”再“求是”,“主、客結合”才是歷史研究求真的真諦和正確的人性。

數字史學不僅在大規模利用史料、進行史實考訂上有優勢,在溝通求實和求是、形成更有穿透力的解釋上更具有不可替代的作用。在數字技術蔚然成風的當下,數字化研究是史學未來發展繞不開的方向之一。將主觀與客觀、科學與人文割裂甚至對立起來,將技術的引入和數字史學等異化為拋棄人性的“另一種”史學研究,不僅是對數字史學的誤讀,也不利于歷史學界積極迎接數字化生存時代的到來,努力走出學術研究的“舒適區”,①王濤認為數字化帶來了史料外延的擴展、研究方法的改進和思想觀念的轉變。數字人文不僅是學術范式的轉變,也是歷史知識生產的轉型。歷史學家應該跳出舒適區,去學習新的技術,歷史學的發展才具有更光明的未來。王跟上時代發展的步伐。為此,本文針對《成文》對歷史學目的的論述,以數字史學,特別是量化歷史數據庫的構建與量化分析為基礎,在檢討歷史學求真目標及其方式的同時,嘗試探究數字史學在實現歷史研究目標和學科發展方面的作用與價值。

一、求真:歷史學的唯一標準

從16世紀的“科學革命”到19世紀近代學科體系的形成,學科標準的明確和宣揚愈發重要,學科畛域亦不斷加深。1959年,英國化學家查爾斯·珀西·斯諾(Charles Percy Snow)在其著名的以《兩種文化》(The Two Cultures)為題的演講中就指出了人文與科學的學術分歧:“科學研究面對未來,而人文研究則是對于過去的回應?!雹贑.P.Snow,The Two Cultures,London:Cambridge University Press,1959,p.6.此后,人文研究重主觀、重感受,科學研究重規律、重客觀的標簽也不斷被強化,并影響到了各自學科自我標準的認定。不過,作為研究人類過往的歷史學,雖歸屬人文學科,但求真不僅是其最高原則,也是學科的唯一標準,先實事再求是的理路和科學研究有相通之處。前賢已指出歷史學是一門具有人文和社會科學多維面向的學科,不宜簡單地歸類為人文或科學。如何兆武認為,歷史學有兩個層次,一個是對史實的認知,另一個是對史實的理解和詮釋,前者是科學的,后者是人文的?!皻v史學是一種人文知識(geisteswissenschaft),而不是自然科學(naturwissenschaft)意義上的那種科學”,雖然性質有別,但兩者應該有共同的“科學規范、紀律或準則”。③何兆武:《對歷史學的若干反思》,《史學理論研究》1996年第2期。這類看法,不僅繼承與發揚了馬克思“唯一的歷史科學”說,也是李伯重觀察到歐美史學界越來越多歷史學家認可歷史學是一門科學的原因所在。④《成文》批評李伯重夸大歷史學科學化的定位和在歐美學界的發展情況,但沒有注意到這一看法自馬克思以來在西方學科中的發展。此外,僅就個人觀察,這種科學化或社會科學化歷史研究的傾向在歐美學界確實比較普遍,如北美的社會科學化歷史研究學會(SSHA)就是規模龐大、參與學者眾多的學術組織。此外,《歷史學宣言》一書也指出,20世紀70年代,歐美歷史學界已經開啟量化轉向,社會科學化的研究有長足發展。喬·古爾迪(Jo Guldi)、大衛·阿米蒂奇(David Armitage):《歷史學宣言》,孫岳譯,上海:格致出版社、上海人民出版社,2017年,第119頁。英國歷史學家卡爾對拒絕將歷史看作科學的觀點也堅決反對,認為“這樣就會證明所謂‘兩種文化’(Two Cultures)之間的鴻溝合法性,并使之長

濤:《歷史書寫的數字化轉向》,https://export.shobserver.com/baijiahao/html/336438.html,2022年1月20日。久存在下去。鴻溝本身是這種古老偏見的產物,這是以英國社會的階級結構為基礎的,而英國社會本身又屬于過去;我本人并不相信,使歷史學家與地質學家相分離的那個裂口比使地質學家與物理學家相分裂的那個裂口更深,也更加不可彌補”。①E.H.卡爾:《歷史是什么?》,陳恒譯,北京:商務印書館,2007年,第181頁??梢?,科學和人文不應該是對立關系。

求真是歷史學的學科標準和人性所在。歷史研究應以客觀事實而非價值觀為基礎,這是中西方史學家長久以來共同追求的核心守則,實事才能求是。理解或詮釋,當然是史學研究的魅力所在,但發現與考訂史實不僅是歷史理解的基礎,更是驗證歷史理解以及實現歷史理論更新演進的關鍵所在。當然不能簡單地認為歷史學的求真能夠完整還原歷史,真實是有限度的;但無論是扎實地歷史還原,還是借助學術想象力的歷史再現或認識,都必須在客觀的原則下,借由史料的分析來開展。因此,桑兵認為,歷史學雖然是自然科學和藝術的結合,但歷史研究的再現,必須是以嚴謹考證為基礎的“以實證虛”。②桑兵:《傅斯年“史學只是史料學”再析》,《近代史研究》2007年第5期。歷史學解釋的發展、進步,往往要從史料的新發現、新解讀起步,這也使得歷史研究須臾不可遠離史料?!冻晌摹氛J為通過史料并不能完全復原絕對的真實歷史,傅斯年提倡的“歷史學只是史料學”由此已經過時。但我們認為,歷史學始終是一門求真、求實的學科,尊重史料、重視史料,恰是歷史學能夠存在和發展的關鍵所在;因此,傅斯年的口號不僅沒有過時,也不會過時。

《成文》認為,歷史學的終極目的,除解釋之外,還有預測,即史學具有“鑒往知來”的功能?!昂箢櫱罢啊彪m然的確是歷史學的特點之一,但絕非歷史學所獨有,至少在社會科學中也頗普遍。德國政治理論家尤爾根·哈貝馬斯(Jürgen Habermas)就曾從長時段的歷史中積累證據,以充實、建構新生的民主理論。③喬·古爾迪、大衛·阿米蒂奇:《歷史學宣言》,第27頁。法國經濟學家托馬斯·皮凱蒂(Thomas Piketty)通過收集和分析18世紀工業革命以來近300年的工資、納稅和財富等數據,證明近幾十年來,不平等現象已經擴大,同時預測這種現象很快會變得更加嚴重。為此,他一方面建議發達國家應該通過推行征收資本稅、強迫銀行提高透明度、提高通貨膨脹等手段進行政策干預,另一方面,呼吁西方國家應該加強民主制度對資本主義的制約,進而有效率地降低財富不平等現象。④托馬斯·皮凱蒂(Thomas Piketty):《21世紀資本論》,巴曙松等譯,北京:中信出版社,2014年,第561、573、586—587頁。因此,歷史學“后顧前瞻”的學科特色或邊界,恰恰在于“前瞻”必須緊緊建立在“后顧”之上,“后顧”又必須須臾不離史料,在收集史料的同時,更要深入地考證史料和利用史料,即“一切以史料為中心”。

以求真為標準、尊重史料,也使得歷史學能夠接近科學。傅斯年本人學術思想的發展歷程對此就是很好的詮釋。新文化運動時,傅斯年已經認識到:“我們是人,我們有人性,用人性去觀察世界,所見的所得的自然免不了一層人性的采色,猶之乎戴上藍眼鏡看東西,沒有一件不是藍的。純粹的客觀是不可能的?!雹莞邓鼓辏骸秾τ谥袊袢照務軐W者之感念》,《新潮》1919年第1卷第5號。由人來開展,又以研究人或社會為目標的歷史學,自然是不可能脫離人性的,必然具有主觀性。但經過海外社會學科理論與方法的學習,歸國后的傅斯年不僅轉而聚焦史學研究,也從強調“人性”轉變為重視“史料”。傅斯年認為歷史學的求真必須以客觀性為基礎。雖然沒有純粹或絕對的客觀,但史學的客觀性是指立論不可僅以價值觀或推論為基礎,更不可以假設或錯誤的史實為基礎,歷史學的求真,基礎在于對史料,特別是一手史料進行精細的編纂和細致的考訂。⑥1923—1926年傅斯年留學德國時,深受蘭克學派影響。對于蘭克學派的風格和影響,美國歷史學家查爾斯·K.亞當斯(Charles K.Adams)在1889年曾總結指出:“目前,世界上沒有任何完備的歷史教學不是建立在……德國的研討班一開始設定的細致、準確和細微地檢查史料的基礎之上?!绷帧ず嗵兀骸稓v史學為什么重要》,李果譯,北京:北京大學出版社,2020年,第55頁。他指出:“近代的歷史學只是史料學,利用自然科學供給我們的一切工具,整理一切可逢著的史料?!薄安牧现畠仁顾l見無遺”。①傅斯年:《歷史語言研究所工作之旨趣》,《國立中央研究院歷史語言研究所集刊》1928年第1本第1分。如何無遺?技術的進步,帶來史料整理、分析方式的變化,也是向著無遺努力的重要方式。這也就是傅斯年在《史料與史學》發刊詞中所謂的“不以空論為學問,亦不以‘史觀’為急圖,乃純就史料以探史實也”。②傅斯年:《〈史料與史學〉發刊詞》,見國立中央研究院歷史語言研究所編:《史料與史學》第1本(上),重慶:獨立出版社,1944年,第2頁。余英時對此又做了進一步闡發:“史學論著必須論證(argument)和證據(evidence)兼而有之,此古今中外之所同。不過二者相較,證據顯然占有更基本的地位。證據充分而論證不足,其結果可能是比較粗糙的史學;論證滿紙而證據薄弱則并不能成其為史學?!雹塾嘤r:《關于韋伯、馬克思與中國史研究的幾點反省——〈中國近世宗教倫理與商人精神〉自序》,見何俊編:《余英時學術思想文選》,上海:上海古籍出版社,2010年,第523頁。

傅斯年主張“歷史學即史料學”,但并非狹隘地認為歷史學研究只是收集和整理材料的學問。在何兆武看來,歷史學應該,也必須由史料出發,但不等同于止步史料或者史料收集,這才是傅斯年“歷史學即史料學”口號的真諦。④何兆武:《回憶傅斯年先生二三事》,《社會科學論壇》2004年第9期。桑兵認為,傅斯年“史學即史料學”,在邏輯上是有豐富的理解空間的?!笆妨吓c史觀其實相互連通而非彼此沖突。在將史料與史觀對立的學人看來,史料不過是立說的基礎或憑借,只有史料,或者只強調整理史料,至多是文籍史實的考訂與編撰,何來史學?殊不知傅斯年的所謂史學便是史料學,史學的工作是整理史料,并非一般的考訂排比,或者說,考訂與排比遠非一般所以為的那樣簡單,尤其不是批判者眼中的瑣碎饾饤末學”。⑤桑兵:《傅斯年“史學只是史料學”再析》,《近代史研究》2007年第5期。因此,盡管今日的史學者已經不像19世紀經驗主義的客觀史學家們那樣,過分樂觀地認為掌握了史料,就能復原真實的歷史;而是普遍相信,受可掌握材料和研究者視野的限制,研究者無法簡單地復原全部歷史——研究者所展示的歷史,具有主觀性和片面性,以至于當代中國史學專業大學生的官方教材里都非常明確地指出“人類社會客觀存在的歷史”和“史家纂寫的歷史”是性質不同的兩個概念。⑥《史學概論》編寫組:《史學概論》,北京:高等教育出版社,2009年,第4—5頁。但史學家們同樣明白,這不僅不可以被理解為史料無用,或者史學研究可以放棄史料,僅依靠想象、價值觀或任何預設的規律進行研究;反而是進一步告誡歷史學家要更審慎、更謙卑地對待史料,更全面、更深入地掌握史料,更科學、更合理地利用史料——無論是建構新的歷史解說,還是打破舊有陳論,都必須從舊史料新解或新史料發現出發。

因此,盡管文史哲都是人文學科,彼此間也確實存在著密不可分的關系,但以求真為目的、為標準,才使得歷史學既不會是哲學,也不會是文學,反而在精神與方法上更接近科學。同樣以傅斯年為例:“九·一八”以后,面對日本對東北乃至中國的不斷侵占,傅斯年出于知識分子的責任感和愛國的價值觀,撰寫了《東北史綱》。盡管傅斯年“不可能不知道中國歷代王朝并沒有完全統治東北,以及東北一直與朝鮮和日本保持著廣泛的聯系”,但在“日本已經吞并了朝鮮并進而覬覦東北之時,他決定對有利于日方宣傳資料的證據不予重視”,在證明東北自古以來就是中國所有的同時,“駁斥日本學者中流行的滿洲、蒙古、西藏最初并非中國領土的觀點”。⑦王汎森:《傅斯年:中國近代歷史與政治中的個體生命》,王曉冰譯,北京:三聯書店,2012年,第168—169頁。盡管有著正確的價值觀,但這一著作在材料上的漏洞,不僅引發了繆鳳林等學者的強烈批評,甚至“五十年后傅斯年的同事編輯他的全集時,《東北史綱》仍被排除在外”。⑧王汎森:《傅斯年:中國近代歷史與政治中的個體生命》,第168頁。同樣,當史料不足時,借助想象或文學創作的方式進行歷史寫作也無法成為好的史學研究。史景遷(Jonathan D.Spence)是當代美國最著名的漢學家之一,他曾撰寫過一部研究清初山東農村基層婦女生活狀況的名著《王氏之死:大歷史背后的小人物命運》。盡管這是一部非常前沿且有趣的新文化史、微觀史著作,但由于地方志等史料中缺乏基層女性的生活材料,史氏一方面使用了《聊齋志異》等純文學材料,另一方面又發揮文學想象,對王氏這位具體女性的日常生活進行了諸多細致的細節聯想。顯然,這部作品“不是婦人王氏的‘信史’”,①史景遷:《王氏之死:大歷史背后的小人物命運》,李孝愷譯,桂林:廣西師范大學出版社,2011年(2019年重?。?,總序第v—vi頁。它或可代表一種歷史書寫的方式,但不宜被看成歷史研究的范本。正如周振鶴指出的,兼具科學和人文兩重屬性的歷史學,“往前進一步是哲學,往后退一步是演義(即文學)”。②周振鶴:《歷史學:在人文與科學之間?》,《復旦學報》2002年第5期。也就是說,如果歷史學不強調客觀性,不以求真為標準,不堅持歷史解釋、理論或背后所代表的價值觀、意識形態等都必須建立在以史料考訂、史料分析為基礎的“真實”之上,那么,歷史學在人文領域的學科屬性就會被消解,失去存在的必要。所以,“史學即史料學”,既是融合主客觀,充滿彈性和張力的睿智之見,更是歷史學成為獨立學科的立足點,不僅不會過時,而且絲毫不可動搖。

求真是史學的標準,先實事再求是是歷史研究的基本規范與邏輯。從“實”到“識”再到“是”,研究過程的遞進伴隨著主觀性的增強,但客觀性基礎并不能動搖。章學誠認為“古人未嘗離事而言理”,“即器以明道”,③章學誠著,葉瑛校注:《文史通義校注》上,北京:中華書局,2014年,第1、4—5頁。道不離器,如影不離形,這就是歷史學先求實再求是的過程。同時,他還說:“蓋欲為良史者,當慎辨于天人之際,盡其天而不益以人也。盡其天而不益以人,雖未能至,茍允知之,亦足以稱著述者之心術矣?!雹苷聦W誠著,葉瑛校注:《文史通義校注》上,第258頁。天,可理解為客觀性;人,則為主觀性。歷史學的人性,就是以求真來說理的人性,沒有了求真,就沒有了歷史學的人性,這也就是促使科學、規范地考訂史料和分析史料成為史學研究工作的核心并獨立于人文學科的關鍵所在。

歷史研究要求事實盡可能準確,但闡釋與理解卻可以多維多樣。⑤王奇生認為:“我們做歷史研究老是強調求真,其實求解也同樣重要?!妗俏ㄒ坏?,‘解’可能是多元的?!秉S道炫認為:“首先是求真,不能因為無法復原完全的真就放棄努力,就像我們不會因為絕對準確的度量無法做到就不使用斤、兩一樣。求真還要求解,如果不去求解,那求真的意義在哪兒?”王奇生、黃道炫:《六零后歷史學者對談:求真求解對粗疏學風的反駁》,《北京青年報》2015年3月20日。很多歷史現象或者人類社會的現象確實難以用科學原理來解釋,比如智商分布應該是隨機的,可是人才分布卻似乎并不隨機,那是因為背后有各種文化和經濟的影響存在。但對人類現象的分析,是可以也應當使用科學化或規范性的方法進行研究的。沒有規范性的研究就無從開展學術討論。歷史學在研究規范、操作程序上可以說是一門更接近科學的“樸學”,因為先收集事實、再解釋成因的研究路徑,既是歷史歸納法,也是科學研究方法。有人認為歷史研究特殊,科學則研究一般,其實也不全然。由于“一般”所涉及的范圍廣,史料不易得,也不易分析,因此,研究難度大,使得史學研究或傾向于選擇特殊對象,或者如阿米蒂奇所說當研究的材料不夠,“習慣性地求助于理論,而非事實”,⑥喬·古爾迪、大衛·阿米蒂奇:《歷史學宣言》,第3頁。但這只是技術或材料不夠之下的選擇,并非史學研究邏輯本身的追求。同時,任何特殊都要以一般為基礎,否則就沒有特殊,歷史研究不能將獨特與普遍截然分開。所以,歷史事實是多層面、多維度的,盡管可以有不同的理解與解釋,但事實依然是事實,是有科學性的。

二、從求實到求是:數字史學的價值

如果認可歷史學當以求真為標準和目標,那么更廣泛的史料收集、更深入史料內部進行比較與分析研究,就不是對史學發展無足輕重之事,而是推動史學發展的關鍵所在。因此,《成文》一方面認為數字技術對史學研究無用,或者有用性很??;但另一方面,又花了較多筆墨,指出數字技術在組織史料和分析史料上,已經越來越鮮明地呈現出人力所不及的效率和優勢。僅此一點,恰恰已經說明不斷發展的數字技術和數字史學,對推進歷史研究具有重要價值,絕非無足輕重。更為重要的是,我們認為數字史學的能力和目標,也絕非僅僅局限于直接的史料處理上,而是能夠通過更高效和更有深度的史料勾連,形成長時段或多代際、大規模甚至整體性的群體信息集,在幫助歷史學家更直接觀察中觀研究對象長時段變遷的同時,發現新的中觀史實,進而對話舊有的宏觀認識,建立新的宏觀解釋,形成更有基礎和穿透力的解釋,并溝通求實和求是,更好地實踐歷史求真的研究要求并實現史學研究模式的演進。

很多學者都已意識到,數字化時代的到來能幫助歷史學者“廣”而“全”地掌握史料,部分滿足《成文》指出的歷史學者“窮盡所有材料”的心理;但實際上,數字技術還能更為“智慧”地幫助歷史學者“?!鼻摇吧睢钡貥嫿ù笕后w、長時段甚至多代際的數據集合,為中觀層面的研究提供有效的分析平臺。數字史學的作用,遠不止更方便、廣泛地獲取史料,還在于能幫助研究者更有效率地發現史料信息,并更深入地將相關史料信息連接起來,從而幫助研究者發現史料中隱藏的諸多史實?!盎ヂ摗薄盎印笔腔ヂ摼W的重要特點,在從事數字史學研究時,一樣要非常重視數據庫自身信息的“內連接”和數據庫之間信息的“外連接”,從而盡可能實現“數據追蹤”。這既能體現出電子數據庫相對傳統紙質史料的重要優勢,更能推動史學研究的深化與發展。

比如,當前各類文獻型電子史料數據庫中蘊藏著大量各級各類歷史人物的信息。過往研究中,資料庫主要起到類似詞典的作用,幫助學者發掘一兩個人或十來個人的個人信息;而當研究對象規模較大時,如民國留美學生這樣以千、萬為單位的群體——很多大規模文獻數據庫中所收藏的任命公文、訃告、個人傳記、回憶錄甚至社會新聞,都可能含有某位留美生的信息——如果僅靠個人純手工進行史料挖掘,收集信息,是非常艱難和緩慢的。筆者最初開展民國清華留美生研究時,采用純人工方式,在有限的幾個數據庫中對1 600多位清華留美生逐一檢索,①這些數據庫主要包括上海圖書館建設的晚清民國報刊數據庫、中國歷史研究院近代史研究所建設的抗日戰爭與近代中日關系文獻數據平臺、愛如生公司建設的申報數據庫以及讀秀學術搜索、CNKI工具書館等。完成一個年度留美生信息的收集就需要3個月左右,全部完成可能要5年。通過與技術專家合作,使用Python軟件的Selenium包——一個低速、無害的小型爬蟲,通過正則表達式(regular expression)對不禁止抓取的數據庫的文獻進行解析,能夠24小時不間斷抓取指定的人物信息,并將信息呈現為便于查閱的形式。前后只花了一年左右的時間,便完成了信息收集和整理工作。后續史學家只需要進一步考訂、梳理抓取的信息,再進行分析即可,使得過往個人、小團隊都無法開展的研究,特別是一些基礎性研究得以實現。

借助技術手段,歷史學家不僅提升了發現史料信息的效率,實現群體研究,還能在海量的史料中進行信息連接,勾連不同史料中的相關信息,從而實現長時段研究。②梁晨:《推動數據連接 促進史學研究》,《中國社會科學報》2019年7月29日,第5版。收集與考證史料總是歷史學家研究工作的起步與基礎,③何炳松:《歷史研究法》,《民鐸雜志》1929年第10卷第1號。之所以形成“窮盡史料”的心態,主要是因為史料本就是過往發生的殘余,依靠史料也僅能部分還原歷史,只有盡可能地將所能收集的各類相關史料整合、勾連與編排,學者才能盡可能發現和呈現多面向的歷史,不至于過于局限。隨著史料不斷電子化和可檢索化,依靠數字技術,歷史學者能夠對海量的資料進行自動、半自動的信息連接。大規模群體歷史人物的研究是傳統研究中的一個難點,而現有的檢索工具和統計軟件等完全可以對姓名、籍貫等人物信息進行查找與匹配,為實現史料信息的連接提供了可能。比如,李中清—康文林研究團隊建設有清代《縉紳錄》數據庫。④有關縉紳錄數據庫的情況,參見香港科技大學李中清—康文林研究團隊主頁上的相關介紹:https://www.shss.ust.hk/lee-campbell-group/projects/china-government-employee-database-qing-cged-q/,2022年1月20日??N紳錄是記錄清朝職官姓名、出身、籍貫等的專書,包含了從乾隆到宣統時期幾乎全部的官員信息,其中宣統年間的數據可以與“民國大學生信息數據庫”早期學生家長的數據進行匹配,以幫助我們更好地研究這一時期大學生的家庭來源?!懊駠髮W生信息數據庫”還可以和袁同禮所編《中國留美同學博士論文目錄,1905—1960》(A Guide to Doctoral Dissertations by Chinese Students in America,1905-1960)進行匹配。該書包括有1905—1960年間近3千名在美國獲得博士學位的中國學生記錄,信息包括學生姓名、生卒年、在美所獲博士學位學校名稱、獲得博士學位時間、博士論文題目等。①Tung Li Yuan,A Guide to Doctoral Dissertations by Chinese Students in America,1905-1960,Washington D.C.:Sino-American Cultural Society,Inc.1961.通過學生姓名將兩個資料庫的信息進行匹配,能夠在“民國大學生信息數據庫”中追蹤到549名留美博士。這一方面可以幫助理解留美博士的本科學校分布,另一方面也可部分理解民國大學生的畢業去向和職業軌跡。

史料的連接,不僅能夠使得研究對象的規模大為增加,更能引入時間軸,形成多代際的數據,在實現“追蹤數據”“智慧數據”的同時,更形成了包含個體對象某項特征和時間維度的三維數據,能更好地、動態地觀察研究對象的特征變遷,而這恰恰能更直接、更扎實地復原歷史,特別是中觀層面的歷史。電子化史料經過信息挖掘和連接等工作,最終呈現出的往往是結構化和可量化的二維數據表格,時間軸介入后,二維表就會在時間序列上形成連貫、系列的三維數據。比如我們正在研究的民國清華留美生歸國后的職業發展——借助軟件,從海量數據庫中自動抓取了所有約1 500位歸國留美生的多個職業信息,在技術的幫助下,目前總計從8 286種材料中發現了清華留美生的個人信息,平均每個留美生使用了近8種材料,職業信息從最初依靠某個單一材料、平均每人0.6個職業,增長到目前約8個職業。同時,這樣就形成了三維矩陣式的數據,不僅能夠分析總體職業獲得的特征、職業生涯的發展情況,還能交叉研究同事關系、上下級關系甚至同鄉、親屬關系等,從而大大豐富和深化我們對留學生群體職業發展的認識。

技術方法的介入和數字史學的不斷發展,能切實有效地從巨量史料中勾連起長時段或多代際的歷史信息并構建成可量化的群體數據集,以實現真正有史料基礎的扎實的群體或中觀研究。數字技術幫助構建規模性群體的信息,其價值在于能夠構成社會體系中的某個中觀群體,而時間軸的獲得,又進一步給研究者提供了發現規律或趨勢,進而求是的可能。歷史資料中行政系統的各類登記、企事業單位的賬目和人事資料等數據信息往往是連續的,延續幾十年甚至上百年的都不罕見。這樣的數據被提取和建庫之后,量化分析工具完全能夠展現出各變量在時間軸上的變化。具有時間跨度的微觀數據集合,可以幫助歷史學家觀察到中觀研究對象在時間軸上變化的過程和結果,進而為量化發現中觀對象長時段的特征和變化規律提供基礎。變化、變異等常常是歷史研究的起點。一般來說,傳統史學陳述歷史變遷的手段是敘事,史學家將解釋與理解結合起來,把對個案、細節和獨特之處的探究與對格局、架構和規律的理解加以歸并。②如鄒讜先生就曾經提倡在政治史研究中,將微觀機制的探討與宏觀結構的認識相結合,以求溝通微觀與宏觀,這但在社會科學家看來,“變異是人類社會的本質。沒有一種定量的方法,我們就無法表述這種變異性”。盡管“思辨、內省、個人體驗、觀察和直覺”,也是可選擇的理解變遷的方法,“能夠起到補充作用”,但“不應取代定量方法”。③謝宇:《社會學方法與定量研究》,北京:社會科學文獻出版社,2006年,第7—8頁。對于理解變化或變異,量化分析當是核心方法,其他方法只能是補充。中觀的歷史數據集合或數據庫恰恰契合了這樣的研究邏輯,使得研究在獲得更多史實的同時,比較自然地呈現變化規律或趨勢。

這樣的數字史學工作,不僅具有技術性,更具有人性與智慧。數字技術或方法在今天已經從技術變成了生存的環境,是時代的最重要標志,歷史學沒有理由拒絕,也不會因此而不再人性。傅斯年認

一研究方法被稱為整合式歷史研究法。Tang Tsou,Interpreting the Revolution in China:Macrohistory and Micromechanisms,Modern China,Vol.26,No.2,2000.為史學工作的核心有兩個:一曰到處找新材料,二曰用新方法(科學付給之工具)來整理材料,以努力達成“聰明的考證”。①傅斯年:《歷史語言研究所工作之旨趣》。數字史學的“聰明”或“智慧”,除了上述連接和中觀之外,也能夠很好地兼顧特殊與一般,融合上層與下層,相較于傳統研究能夠更人性。數字史學以大規模群體為研究基礎,就是要眼光向下,在開展服務群體研究和長時段研究的同時,將大規模群體的特征呈現出來,這可能比僅僅分析一兩個資料易得的精英、帝王更有人性。②數字史學因為能夠較好地分析大規模史料數據,因此也更擅長研究社會群體,這也被很多人看成是“無人的歷史”,缺少人性。但王晴佳認為:社會史家常常注重社會階層的互動及其經濟活動,但如此一來,也會讓其論著充斥許多數據,而缺少對具體個人行為的描述。因此社會史的論著,往往枯燥無味,被人譏為“沒有人的歷史”(history without people)。其實更好的說法也許是“沒有個人的歷史”,因為以前的歷史著作,往往以個別精英人物的活動為主要考察對象,而社會史的寫作側重研究的是社會團體的行為。王晴佳:《歷史研究的碎片化與現代史學思潮》,《近代史研究》2012年第5期。德國社會科學哲學家威廉·文德爾班(Wilhelm Windelband)提出:“歷史學家善于把個殊式(idiographic)研究與通則式(nomothetic)研究結合在一起”,他“把前者歸于人文學科的強項,而后者則屬于社會科學的強項”。③轉引自喬·古爾迪、大衛·阿米蒂奇:《歷史學宣言》,第16頁。數字史學則能將兩者有機結合。以個人(individual-level)或單元級(unit-level)微觀史料數據(信息)為基礎構建量化數據庫,開展多變量描述性統計分析的數字史學研究,能更有效地集合大規模、長時段微觀史料,形成扎實的中觀研究,從而將微觀個體和宏觀認識有機結合起來,為構建宏觀史論提供寬廣且堅實的基礎,在溝通微觀與宏觀的同時,亦為更好地平衡求實與求是提供新路徑。

可見,數字史學絕非只能在“數字”或“數據”上有能動性,在研究史學,回應史學問題上同樣也大有可為。這也促使數字史學在最近幾年初步形成的同時,不斷進化、升級自己的研究理路——逐步明確不僅必須進行數據處理(考訂)和數據公開,④經濟史學家梁方仲先生曾指出,經濟史統計工作的基本原則之一,就是要“重視定量的實證研究,重視對數據的??鼻笳?,重視對數據產生機制的考察”,這應該為所有經濟史工作者所遵循。陳爭平、常旭:《梁方仲對經濟史統計工作的貢獻——兼評經濟史研究中的統計方法與計量經濟學方法》,《清華大學學報》2011年第2期。我們認為數字史學研究也應該遵循同樣的原則。重視史料使用的去偽存真和同行檢驗、資料共享,在研究過程中也必須將發現與解釋相統一(見圖1),如此才能構成完整的數字史學研究。這樣的研究范式,一方面經由技術的介入,有趨向于科學的趨勢——現代科學在方法上的核心特點是可觀測或可重復試驗,量化數據庫的建立,為可觀測和有基礎的討論提供了可能,也就向著科學主義的要求邁進了一步;另一方面,這種研究模式重視技術,但絕非盲目崇拜技術或唯技術,而是強調方法的使用與人性的理解相結合。由經濟學出身而轉入歷史研究的吳承明認為“統計分析很重要,計量學分析則有很大局限性”,⑤吳承明:《研究經濟史的一些體會》,《近代史研究》2005年第3期?!坝嬃繉W方法應該主要用于檢驗已有的定性分析,而不宜用它建立新的理論”。⑥吳承明:《經濟史:歷史觀與方法論》,《中國經濟史研究》2001年第3期。依靠量化數據庫開展的量化史學研究,并不強調高明的計量分析方法——后者是過去計量史學走進死胡同的癥結。只需要依靠描述性統計,⑦本文作者認為,在獲取史實方面,依靠簡單的變量描述統計,如頻數、平均值、標準差、比例和列聯表等,量化數據庫就能夠提供許多集合數據或個案研究無法提供的信息和視角,同時當結合長時段數據,這種作用尤其明顯。梁晨、董浩、李中清:《量化數據庫與歷史研究》,《歷史研究》2015年第2期。就可以對變量的變遷以及可能存在的相關性進行觀察,強調的是通過連續的數據呈現,讓時間變量清晰起來,從而便于理解歷史的過程。借用西方學者對今日量化分析的定位,數字史學研究不應只是單純地對數據簡單描述統計和相關分析,而應以理論為導向從大規模數據中發現“已知”和“未知”規律并回應、補充或升華已有理論的有效工具。⑧Onno Boonstra,Leen Breure and Peter Doorn,Past,Present and Future of Historical Information Science,Historical Social Research/Historische Sozialforschung,Vol.29,No.2,2004.可見,大規模數據是非常重要的學術工具(big data is a big deal),能提升包括歷史學在內的眾多學科的研究模式與深度。①Jonathan Shaw,Why“Big Data”Is a Big Deal:Information Science Promises to Change the World,Harvard Magazine,March-April,2014.

圖1 數字史學數據庫構建與研究基本流程

總的來說,技術手段能有效幫助歷史學者極大地拓展史料利用范圍、掌握信息的規模與時間跨度,為長時段、大群體研究提供基礎。過去學界多認為利用數據庫進行史學研究,最重要的優點是對史料的大規模使用,能夠“廣”而“全”地使用史料?,F在,隨著越來越多數據庫的構建和向學界開放,數據庫數據在技術支持下,實現各種“連接”的可能大為增加,“數據追蹤”越來越成為數據庫研究的重要方法。這使得存儲于數據庫中的相關信息逐步從靜態走向“追蹤”,使得歷史上的人與事能夠豐富和連續地呈現出來。同時也說明數字史學的優勢在于,不僅能夠“廣”而“全”,也越來越能夠“?!鼻摇吧睢?。因此,當我們在說數字史學的研究可以更客觀更有效的時候,并非是說這是一個技術的“無人”的研究,而是說它能夠超越視野和個人能力的局限,綜合更大規模史料和更長時段觀察。

總之,數字史學的價值,絕非簡單化的技術介入或更多更廣的材料占有,而是能夠依靠歷史信息的數據化重組,更客觀、深入地發現歷史,形成新的歷史解釋,從而在發現和解釋之間搭起更為直接的橋梁。用古爾迪和阿米蒂奇的話來說,就是“數據有能力改造理論”,②喬·古爾迪、大衛·阿米蒂奇:《歷史學宣言》,第92頁。理論則是解釋的提升??斔梗ˋ.W.Carus)等人認為近些年國際學術界的很多研究之所以能取得重要進展,是因為從過去追求定性的歷史證據轉變為了追求定量的歷史證據,強調歷史研究要“量化使用定性證據”(using qualitative evidence quantitatively)。③A.W.Carus and Sheilagh Ogilvie,Turning Qualitative into Quantitative Evidence:A Well-used Method Made Explicit,The Economic History Review,Vol.64,No.4,2009.其中影響最大的一項研究進展,是19世紀60年代,馬克思在《資本論》中提出了資本剝削勞動的理論觀點,差不多150年后,2014年法國經濟學家托馬斯·皮凱蒂(Thomas Piketty)依靠各國長期歷史數據結合收入分配理論,給出了定量檢驗并進一步揭示了資本收入遠超勞動收入的歷史趨勢。④Thomas Piketty,Capital in the Twenty-First Century,Cambridge:The Belknap Press of Harvard University Press,2014.李中清和王豐《人類的四分之一:馬爾薩斯的神話與中國的現實》一書依靠對中國人口數據的整理、分析,指出馬爾薩斯理論中對中國人口行為的認識有與實際不相符合的地方,對其理論的適用性提出了重要質疑。⑤李中清、王豐:《人類的四分之一:馬爾薩斯的神話與中國的現實》,陳衛、姚遠譯,北京:三聯書店,2000年,第12—14頁。李伯重在《江南的早期工業化(1550—1850年)》一書中,基于地方志書中眾多江南手工業信息的收集、整理和分析,對曾一度籠罩中國史研究的“資本主義萌芽論”理論,進行了反思和修正,指出既往學界過于重視生產關系的研究,忽略了對生產力的探討,繼而提出了“早期工業化”的理論。⑥李伯重:《江南的早期工業化(1550—1850年)》,北京:社會科學文獻出版社,2000年。

無論是重視人文屬性,還是強調科學性面向,數字史學對歷史研究都具有重要價值。歷史研究的目的總是力求真實地追溯和還原人類社會的過往,以此為基礎來理解個人或群體的行為并判斷趨勢與規律。而連接今天與過往的橋梁,是各類史料。只有對史料深入地辨析,才能知道橋梁那頭是怎樣的過往;只有對史料深入地挖掘,才能對橋梁那頭的過往觀察得更遠更多。無論是辨析還是挖掘,都需要方法的嚴謹與規范,作為科學方法的邏輯和數學就是這樣的代表。邏輯分析,史學家已經熟悉,但對數學方法的認可,更多還是局限于經濟史內部。實際上,以強調數據分析和量化發現為重要特征的數學,同樣反映了人們積極進取的意志、縝密周詳的邏輯推理,將其適當地用在史料分析和歷史研究上,既是可能,更是必要。

余論:融合技術,發展學科

20世紀初的新史學前賢就已指出:“歷史無固定的范圍,全賴他種科學的幫助?!雹儆诒椋骸蹲x新史學(New History)》,《史地叢刊》1923年第2卷第2/3期。在堅持求真標準的前提下,吸收其他學科的理論與方法,某種程度上也是歷史學科的生存之道和魅力所在。技術作為方法,雖然是非人格化的,但一旦為人所用,無論是運用于生活,還是運用于人文社科的研究領域,它本身就會被賦予人格化的因素,也會使得技術越來越具有人性化的傾向?!笆穼W之樹常青”,學術研究的方法與理論總在不停演進,歷史學必須和時代同呼吸共命運。

歷史學的人性關懷,從來不是抽象的,也絕非僅僅依靠體驗或感悟來開展,技術手段和量化分析等都大有用武之地。如果說人性是神性的對照物,那么人性與人的行為不僅不能分割,而且很多探討和理解都應有“量”的介入。比如,對人性之下所體現出的行為,對群體的綜合分析和個人的長時段研究,是否應該通過量來展示其基本特征和變遷、變化?這種量的研究難道不是同樣充滿人性價值嗎?又比如,對人物思想的理解,雖可能更需要參透的能力,但思想形成過程中的變遷以及思想影響的對象、傳播的方式,也應是同樣重要的基礎問題。這些研究是不是也應該引入量的觀察與判斷?如果是,歷史學作為研究人性的學科,是不是也應該有多樣化的手段和分析方法?數字史學無論在群體的量,還是時間的量上,都對人性的史學研究有著直接的作用。

數字史學研究對史學的意義應該是研究方法的創新,而不僅是技術的創新。觀察技術介入后的研究,我們對待史料的態度和史學功能的理解,看似沒有超越傅斯年的思想,而是沿著他的邏輯,在收集和整理史料的辦法上有所增進而已,但這種增進的意義,并非點滴,而是能對史料起到“扭轉乾坤”的效果,以得到更多扎實與不同的認識。長期致力于中國古代科學技術史研究的德國馬克斯·普朗克科學史研究所所長薛鳳(Dagmar Sch?fer)就認為,“把歷史數據轉到一個新的結構或做成一個新的數據庫時,我們也同時會對該歷史事件有一個新的了解,發掘出新的意義”,“像從文本中提取數據,以新的方法排列并重組數據,這些重組和展示工具定義了整個時代,就是new database construction的時代”。②此處所引內容為2020年6月北京論壇云端國際論壇系列之“數字人文視角下的中國歷史研究”中薛鳳教授所做的《新方法開辟新領域,歷史研究中的數字人文》主題演講。此論壇由北京大學數字人文研究中心組織,筆者為此次論壇的主持人。https://news.pku.edu.cn/xwzh/28b8868a55e7407a9dce38b95134059d.htm,2020年6月9日。

有研究者將數字技術比喻成顯微鏡,因為它能幫助學者觀察到更多微觀史實,其實數字技術或數據庫平臺還可以是微觀信息的加速器或對撞機。1976年,美國華裔物理學家丁肇中獲得諾貝爾獎。評獎委員會形容他發現微小粒子的工作成就,就如同在一架巨型噴氣飛機發動機的轟鳴聲中,聽到了不同尋常的細微之聲(like hearing a cricket near a jumbo jet)。③News Feature:Sam Ting’s Last Fling,Nature,Vol.455,16 October,2008.而大規模歷史數據庫的構建,正如同搭建了一個大型儀器平臺——數據庫運轉(計算分析)后,在各種數據的交叉和對撞過程中,會產生很多大大小小的聲音(現象),研究者需要從其中挑選出能分析理解、能顛覆固有認識甚至多個現象串聯后,能推動認識更新和理論演進的部分,以實現新的數據驅動研究方式的價值。因此,數字技術的介入,對史學研究的發展可以起到非常積極和深層次的推動作用,且這種作用不是背離,而是更深化史學研究的根本目的,所以不宜將技術與人文簡單對立,將技術使用視為人性的喪失。

數字史學雖然強調數字技術的利用,研究的程序甚或范式亦與傳統史學有所不同,但其根本研究邏輯,仍與傳統史學一致,即強調歷史求真,要求從實事出發,以達求是,進而實事求是。技術的借用或進入,還是為了更有效和深入地挖掘史料,特別是大規模的史料信息,并不代表人性的弱化。評價一項歷史研究是否具有人性,不在于采用的是哪種方法,而在于研究者對材料是否尊重以及研究的問題是否有人本或社會性的價值。

同樣需要注意的是,作為中國數字史學的“先行者”,成一農對數字史學的看法,雖有將人文與科技對立之偏向,但其所提出的警示又是數字史學者不能不重視的。新潮初起的數字人文學界,有一些研究,特別是跨學科學者主導下的研究,存在著兩種趨勢或問題:一是不加考訂,望文生義,隨意使用史料或歷史數據,沒有注意到歷史數據的內涵和不同時段、不同地區數據背后的復雜差異,粗放和草率的統計與“聳人聽聞”的新發現,已完全背離了歷史本真;二是過度強調數據呈現,忽視或無力將數據反映的現象放置于歷史的背景中去解釋其形成的機制,沒有與既有理論對話,沒有真正發揮出數字史學應有的價值。①除《成文》之外,2019年《澳門理工學報》曾組織一期數字史學專欄,多位學者都指出了數字人文研究中存在的類似問題。張耀銘認為:“某些數字人文倡導者重數據輕思想、重圖像輕文字、重印證輕發現,推崇數據中心論,從而使人文研究失去人文意義,削弱甚至消解了研究者的主體性?!币姀堃懀骸稊底秩宋牡膬r值與悖論》,《澳門理工學報》2019年第4期。王濤指出很多所謂數字人文研究,只是“(表面上)使用了數字人文的方法”,“數字人文依然需要關注傳統人文學科的價值觀,討論和分析人文學科(歷史、文學、哲學等)試圖解決的問題”。王濤:《什么不是數字人文》,《澳門理工學報》2019年第4期。邱偉云認為數字人文研究“算法必須密切結合人文理論(由人的思考而成的理論),而對數據的解讀也必須要有人文價值”。邱偉云:《判別數字人文的兩個準則》,《澳門理工學報》2019年第4期。

成功的數字史學研究,不僅能幫助史學家發現更多隱藏于巨量史料中,無法通過傳統閱讀發現的史實,在史實認知層面提供新知識,更能促使史學家通過新知,形成新的歷史理解、解釋或理論,這也是數字史學具有學術人性和生命力的體現。雖然數字史學在一定程度上是數理分析規范、信息技術方法和社會分析相結合的交叉,但目標仍舊在于發現或呈現歷史和解釋歷史??茖W方法的使用,當然并不意味著絕對真理或真實的出現,而是可探討性和可證明性的增加。鄧小南的看法則更為深入,她認為:“數字人文”不僅是一種技術,不僅是人文學者使用漸多的查詢檢索方法,也體現著傳統治學方式與數字技術關聯融通的開放態度;它開啟了新的研究窗口,改變著我們慣用的工作方式,也不同程度地影響著我們組織學術議題的思維方式。我們不宜將其與人文學科的終極價值、人文學者的學術想象力對立看待,而應當意識到,“數字人文”的應用為我們提升研究水準、回應多面向問題提供了新的可能。②鄧小南:《數字人文與中國歷史研究》,《中國文化》第53期,2021年春季號。

猜你喜歡
歷史學史學史料
五代墓志所見遼代史料考
史料二則
例談數據史料的辨偽與解讀
高中歷史學法指導
史料教學,史從何來
歷史學
史學漫畫館
史學漫畫館
當代史學的轉向
史學研究縱橫談(上)
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合