?

開源基礎設施、“影人個體數據庫”與數字人文知識生產
——基于中國電影知識體系平臺的考察

2024-04-03 04:35檀秋文
山東社會科學 2024年1期
關鍵詞:影人年譜開源

檀秋文

自2019年起,關于編纂中國電影人年譜的呼聲在學術界漸漸興起。以北京大學李道新教授為首的團隊在此領域進行了大量的先行探索。(1)相關成果有李道新:《影人年譜與中國電影史研究》,《當代電影》2019年第1期;普澤南:《從數字人文的起源看影人年譜與其關系》,《電影藝術》2020年第4期;李道新:《數字人文、影人年譜與電影研究新路徑》,《電影藝術》2020年第5期;李鶴伊:《數字人文、文化分析與中國影人年譜的可視化》,《鄭州大學學報(哲學社會科學版)》2021年第5期;喬寧:《數字人文時代基于社會網絡分析法的影人年譜研究初探》,《電影評介》2022年第2期;徐之波:《擬形化歷史與結構化知識:數字人文視野下影人年譜研究》,《電影評介》2023年第1期;譚文鑫:《以費穆為例談影人年譜的編纂策略》,《當代電影》2023年第6期。編纂影人年譜對于電影學界來說尚顯新鮮,但是“中國的年譜和年譜學,從宋代初興,到清代極盛,再從近現代梁啟超、胡適的大力倡導,到當下文史學界部分學者的身體力行,均為人物研究及其歷史書寫奠定了較為堅實的基礎”(2)李道新:《影人年譜與中國電影史研究》,《當代電影》2019年第1期。。應該說,中國傳統史學深厚的年譜傳統和豐富的實踐經驗,使得中國影人年譜的編纂及相關研究從一開始就能從中汲取豐富的滋養,少走很多彎路。

在此前關于中國影人年譜的研究中,多探討年譜編纂的意義、對中國電影史研究的啟發,并嘗試將影人年譜編纂與數字人文方法相結合,以期為中國電影史研究開拓新的視野。然而,前述研究還都是在電影史學乃至電影學的范疇內討論影人年譜編纂的意義,且忽視了一個根本前提——數字時代影人年譜編纂所具有的不同特點,以及相關數字基礎設施建設的重要性。同時,由于缺乏具體的影人年譜文本和編纂實踐(雖然有一些影人橫跨電影、文學及其他多個領域,例如夏衍等,他們的相關年譜已有多個版本,但由于譜主的活動不局限于電影界,因此本文不予討論),這些研究只能停留在理論層面。

隨著社會的高速發展,大數據、云計算、人工智能、區塊鏈、移動互聯網、5G等迅猛發展,數字技術以前所未有的勢頭改變著我們工作和生活的方方面面。各種數字化基礎設施建設被提上日程,其重要性不言而喻。由于一切信息、數據在互聯網上的生產、存儲和流動都需要相應的設備和技術結構,因此,互聯網平臺也可被視為數字時代的基礎設施,有學者將其稱為“物質基底”(3)束開榮:《互聯網基礎設施:技術實踐與話語建構的雙重向度——以媒介物質性為視角的個案研究》,《新聞記者》2021年第2期。。數字時代的信息獲取,除了如往常一樣要求信息的準確性,還對所獲信息的豐富性和信息獲取的便捷性提出了更高的要求。這一數字時代信息傳播的新特征也要求影人年譜的編纂探索新的存在形態,實現數字化轉型。而實現這一轉型的前提,就是構建新型數字基礎設施。

近年來,北京大學藝術學院和中國傳媒大學文化大數據實驗室聯合開發的中國電影知識體系平臺(Chinese Cinema Knowledge System,以下簡稱“CCKS平臺”)上線,影人年譜終于有了可供展示的窗口。目前,在CCKS平臺上,諸如費穆年譜、史東山年譜等都已初具雛形。后續研究也終于可以有的放矢,學者們能夠結合其在數字平臺上進行編纂和展示的具體實踐,對數字時代影人年譜的功能、特點、影響等展開進一步討論,避免了凌空蹈虛的尷尬?;诖?本文嘗試從數字平臺開源基礎設施、“影人個體數據庫”、數字人文知識生產等角度來探討依托數字平臺進行影人年譜編纂和開展數字人文研究的可能性和可行性。(4)需要指出的是,CCKS平臺上還有“電影計量”“知識生成”“電影百科”“文獻索引”等版塊,但是“影人年譜”是其中最特殊的一項,因此本文將集中探討數字平臺與影人年譜的關系。

一、開源數字基礎設施與“影人個體數據庫”

在《中國電影史學述要(1978—2019)》一書中,筆者曾經倡議建構中國電影史料數據庫。(5)參見檀秋文:《中國電影史學述要(1978—2019)》,人民出版社2020年版,第214頁。這是因為,在大數據和信息化時代,各種數據庫的出現使史料搜集的困難情況大大改觀。如此一來,如何在海量資料當中迅速找到自己所需的內容,就成了當下學者們面對的幸福的煩惱。因此,樹立以資料集成與數據庫建設為重點的新史料觀,并以此為基礎建設中國電影史料數據庫,是一條可行的路徑。

需要注意的是,在文學、歷史學等領域,相關數據庫基礎設施的搭建已經非常成熟,諸如“中國歷史地理信息系統”“絲綢之路歷史地理信息開放平臺”“中國歷代人物傳記資料庫”“學術地圖發布平臺”“中國基本古籍庫”“中國歷代典籍總目分析系統”“智慧古籍平臺”“抗日戰爭與近代中日關系文獻數據平臺”等數據庫的出現,極大地促進了各自學科以及相鄰學科的研究,并發揮著越來越重要的基礎作用。在電影學科,國內外目前也已經出現了若干類似的數據庫,CCKS平臺上就提供了47家國內外相關電影數字平臺的鏈接。然而,在中國內地電影學界,尚未出現對學術研究具有基礎性作用的數據庫。曾經被寄予厚望的“中國電影學術網”“中國電影人口述歷史數據庫”等,都因為種種原因,尚未達到此前的期待目標。

有研究者指出:“在媒介基礎設施視域下,如何祛蔽除魅、破除封閉化、固態化和私有化的‘蠶繭’?其理想藍圖是以‘開源’方式所帶來的‘超級共享’?!?6)黃穎、申國敏:《單景繭房、液態環境與開源未來——媒介基礎設施視域下的影像傳播特征初探》,《當代電影》2021年第11期。CCKS平臺的介紹中稱該平臺是“在知識論與知識管理學的框架里搭建的一個眾包群智、開源共享的,具有思辨性、成長性的中國電影數字基礎設施”(7)李道新:《“中國電影知識體系平臺”簡介》,https://movie.yingshinet.com/#/introduction,訪問日期:2022年7月9日。。其中,“眾包群智、開源共享”體現了該平臺的特點。在全球化時代,“如果說收集數據是一種意識,使用數據是一種文化、一種習慣,那是否開放數據則是一種態度”(8)涂子沛:《大數據》,廣西師范大學出版社2013年版,第332頁。。在這種背景下,CCKS平臺上的數據面向所有人免費開放,無需注冊賬號就可以瀏覽網站的所有內容(9)當然,如果想上傳包括影人年譜在內的相關數據,那么就需要注冊賬號,管理員通過后即可錄入。,無疑順應了信息、資料和數據開放共享的潮流。更為重要的是,“開源,不僅意味著以開放的姿態進行知識共享,還代表著自由、平等、協作、責任和樂趣等等理念”(10)涂子沛:《大數據》,廣西師范大學出版社2013年版,第189頁。。平臺的開源將會使這些理念逐步深入人心,成為學界共識,從而促進學術民主,營造良好的學術生態。

依托開源數字平臺的影人年譜,具有與傳統編纂形式不同的形態。傳統年譜只能以單一的紙質版本(文字加圖片)呈現,即便有錄音、錄像文本,其與紙質版本也處于相互割裂的狀態,難以產生聯系,“但數字存儲接近于零的低成本、數字設備的小型化和個性化、帶寬和網絡基礎設施的擴展,加上一種強烈的復原和再現的欲望,已經為各種檔案的復活創造了前所未有的有利條件”(11)[美]約翰·杜海姆·彼得斯:《奇云:媒介即存有》,鄧建國譯,復旦大學出版社2020年版,第346頁。。在數字平臺上,完全可以將與影人相關的文字、圖片、錄音、錄像等各種文本統一集成,以多媒體的方式呈現。傳統形式的年譜編纂完成之后,如果發現錯誤或者遺漏想要進行改動,那么就需要投入大量的時間、經費,一時難以完成。數字平臺則不同,只需要在后臺對信息進行增刪、修改即可,成本幾乎可以忽略不計。并且,數字平臺上的信息在理論上可以無限期補充、隨時更新,其便利性是傳統年譜完全無法比擬的。

作為一種數字基礎設施,CCKS平臺之于影人年譜的作用,是將以往有形的、物質的傳統呈現方式,轉變成網絡上無形的、虛擬的展示,這樣就可以跨越時空和物理的障礙,保存盡可能多的信息和資料。每個人的生命都有窮盡之時,但是其生命經歷在數字平臺上可以永久存儲和展現。因此,影人年譜的最終發展方向,可以是依托CCKS這一平臺建立起“影人個體數據庫”。

“影人個體數據庫”的建構需要立足于前人所做的工作,并與其他相關數據庫密切聯系。數字技術的發展,使得各種史料能夠以數字化形式呈現,給學術研究帶來了極大的便捷。時至今日,通過數據庫檢索來輔助研究已是普遍行為。以史東山研究為例,前人對史東山的研究多依賴《史東山影存》(中國電影出版社2003年版),該書是當時條件下能夠編纂出的最高水平的相關文獻。然而,筆者經過在“民國時期期刊全文數據庫(1911—1949)”“《申報》數據庫”“《大公報》數據庫”等不同數據庫中反復檢索,查找到的相關文獻數量之多、內容之豐富,遠遠超出《史東山影存》所涵蓋的范圍。在這些新檢索出來的文獻中,除了常規的影片評介、影人采訪,還有關于史東山生活經歷、愛情婚姻、興趣愛好等方方面面的信息,這些內容使得常規電影史述中德高望重、令人敬而遠之的史東山形象鮮活生動起來。如果沒有相關數據庫的開發,依然靠傳統方法一頭埋進故紙堆中求索,效率低不說,也難以獲取如此翔實的資料。因此,在“影人個體數據庫”的建構中,需要充分利用相關數據庫在資料層面提供的強有力支撐。

在某種程度上,譜主的確定和資料的選擇反映著編纂者的史觀。傳統意義上的年譜編纂依然秉持的是精英史觀,多集中關注著名人物、精英人士。這是因為著名人物更受關注,學者投入的研究精力更多,出版機構更愿意出版,涉及從學術生產到出版的整個鏈條。在這種情況下,那些不那么有名的人物就難以受到關注,也就更談不上年譜的編纂了?;陂_源數字平臺的影人年譜,將編纂權力開放給大眾,打破了學術體系的封閉性和神秘性,使得更多人能夠參與進來,只要是自己感興趣的影人,都可以在CCKS平臺上為其建立年譜條目,構建專屬的“影人個體數據庫”,因而能夠將大眾關注的重點從精英人物逐漸轉向電影史上的“無名者”和“沉默的大多數”。這樣一來,就可能搜尋到更多被電影史忽略或遺忘的影人,豐富中國電影史的面貌。這是一種對傳統的精英史觀的變革,反映的是“從下到上”(from below to above)的史觀,能夠從不同的角度豐富電影史的構成,就客觀影響而言,就是在拯救歷史。

更重要的是,在“影人個體數據庫”中,所有入庫影人的生平都是數據,沒有高下之分,都能夠在數據和信息資源意義上發揮其更大的價值。身處計算機時代,列夫·馬諾維奇(Lev Manovich)把數據庫稱為“一個新的符號形式,一種構建自身體驗和世界體驗的全新方式”(12)[俄]列夫·馬諾維奇:《新媒體的語言》,車琳譯,貴州人民出版社2020年版,第223頁。。CCKS平臺通過將信息“分類”,使得用戶擺脫了傳統媒體形式所采取的線性文本的控制,能夠以不同的“索引”方式,隨意在平臺上各個信息模塊之間跳轉;并且,在CCKS平臺上呈現出來的影人年譜,每條數據都會標明原始出處,有助于后來者按圖索驥。這些都體現了數據庫的索引和導航功能?!皵底置襟w復活的是古老的導航功能:為我們指明時間和空間,給我們的數據建立索引,確定我們的坐標?!?13)[美]約翰·杜海姆·彼得斯:《奇云:媒介即存有》,鄧建國譯,復旦大學出版社2020年版,“緒論”第8頁。正是這種索引和導航功能,使得依托CCKS平臺以開源眾包方式打造的“影人個體數據庫”并非封閉的存在,而是始終處于動態的生成過程中,能夠為未來的人們保留下屬于譜主生活年代的信息,也能保留下年譜編纂時代的痕跡。因此,作為開展影人年譜編纂的“物質基底”和基礎設施,CCKS平臺必將在“影人個體數據庫”的構建中發揮更大的作用。

二、基于數字平臺的“心靈考古”

自20世紀80年代末起“重寫電影史”的大潮席卷而來,經過幾代學者多年孜孜不倦的鉆研,中國電影史研究在整體上已經取得了長足的進步。然而,在“重寫電影史”的熱鬧與喧囂之中,對影人的研究卻相對滯后,也遠不是熱點,對非著名影人則更少關注。(14)電影學的相關期刊上刊登過多篇關于影人研究的論文,但大部分也都只是對某個影人的初步研究,尚有很多地方需要進一步深入。影人年譜的編纂或許可以推動影人研究的進一步深入。

編纂影人年譜重在對資料的收集、整理,在此基礎上發掘譜主的心路歷程,對人的心靈、個性與時代之關系進行勘探、發掘和重建。李道新在論證影人年譜的功能和目的時指出:“以更加勤苦、謹嚴的姿態和客觀、翔實的方式進入中國電影的歷史現場和本土語境,在最大限度還原社會歷史面貌和體認影人生命軌跡的過程中,為中國的電影史研究提供必要的知識積累和價值導向?!?15)李道新:《影人年譜與中國電影史研究》,《當代電影》2019年第1期。因此,影人年譜除了“還原社會歷史面貌”,還應當能夠“體認影人生命軌跡”。這也就意味著,數字時代影人年譜的編纂,依然要以“人”為中心、以“人”為主體。所謂以“人”為中心、以“人”為主體,就是要考慮到譜主的從業經歷、社會經歷、個人生活三個層次,即從“專業史”“社會史”“心靈史”三個維度(16)陳墨在《中國電影人口述歷史:實踐與理論》(《當代電影》2010年第3期)一文中提出,“要在口述歷史采訪中探索并建立專業史、社會史、心靈史的三維空間”,本文在此借鑒之。,盡可能完整地呈現譜主的生命歷程和專業工作,進而能夠得窺其所處時代之一斑。

多年來,公開出版的個人回憶錄、日記、自傳、傳記和影人的口述歷史,都可被視為一種年譜或類年譜的形式。(17)李道新在《影人年譜與中國電影史研究》(《當代電影》2019年第1期)一文中詳細列舉了此前可被視為影人年譜的各類出版物和相關成果,這些成果都為影人年譜的后續研究奠定了基礎。然而,個人的回憶錄是個體記憶,準確與否受到個體記憶能力、資料的可獲得性和主動求證的能動性等多種因素的制約。譜主個人回憶難稱精確,口述歷史采訪者雖然可以在與譜主的互動中進行記憶的鉤沉,但是因為自身學識有限或者所受學術訓練程度的高低不同,依然難免出現各種錯誤和不足。影人年譜的編纂看似只是對影人的具體活動按日期加以編排,從而勾勒影人生平,但實際上是嚴肅的學術研究。編纂影人年譜需要對譜主相關史料仔細甄別,編纂者往往需要考察大量資料,除常規的報刊信息,還要盡可能窮盡相關的著作、手稿、回憶錄、采訪、日記、錄音、錄像等,并對這些資料進行比對、分析、辨別,才能篩選出盡可能準確的資料。在CCKS平臺上編纂“胡金銓年譜”的過程中,胡金銓的出生日期引發了爭論。香港電影資料館官方網站,胡金銓侄女胡維堯所編《胡金銓電影傳奇》(明報出版社2008年版)、《胡金銓隨筆》(復旦大學出版社2013年版)以及胡金銓口述、日本電影學者山田宏一和宇田川幸洋所著《胡金銓武俠電影作法》(北京聯合出版公司2015年版),對胡金銓出生日期的說法都有所差別,這就需要編纂者進行詳細考辨。

傳統年譜需要某個或幾個學者窮盡若干年甚至一生的精力,對各種史料進行搜集,才能編纂完成,還難免存在疏漏。數字平臺的開源特性,將年譜的編纂權力下放,將史料的搜集整理、條目的添加功能開放給大眾,每個人都可以為此做出貢獻,因此年譜編纂的整體效率會成倍增加。參與者相互之間通過平臺形成的網狀勾連,能夠對年譜條目進行交叉審核、校對,可以最大限度避免錯誤的產生,也為影人研究提供了更多便利。

隨著數字時代的到來,研究者開始尋求研究人文與技術相結合的新方法與新思路。如果將“影人個體數據庫”中影人的活動軌跡整合起來,會產生海量的數據。隨著數據的豐富,譜主和編纂者之間、不同的編纂者之間、不同的“影人個體數據庫”之間必然會發生聯系。那么,在面對海量的史料數據時,研究者該如何篩選并呈現出影人的生活及職業發展路線?影人的思想、觀念、情感等屬于精神層面的內容,是否能夠通過數字化手段將其可視化呈現?處在某一坐標系中的影人個體與自身、與他人、與環境的關系如何?回答這些問題,需要在實踐中穿透數字的表象,施以人文關懷。

正如陳墨所言:“所謂心靈考古,就是要在人類心靈深?;蛉四X神經宇宙的廣袤星空中探尋、打撈、發掘并激活某些重要的個體生命記憶信息”(18)陳墨:《中國電影人口述歷史:實踐與理論》,《當代電影》2010年第3期。,“心靈考古工作目的在知人,這也正是學者論世或論史的前提”(19)陳墨:《再論口述歷史與心靈考古》,載陳墨:《口述史學與心靈考古——論文與演講集》,人民出版社2019年版,第86頁。。雖然他所言的“心靈考古”是基于口述歷史工作的特性及其相關功能的闡釋,但在數字時代的影人年譜編纂中,“心靈考古”可以為我們更好地深入理解譜主及其所處時代環境提供啟發。從“心靈考古”的角度出發,基于數字平臺上的影人年譜打造“影人個體數據庫”時,應該超越傳統意義上只關注譜主生活和工作經歷的編年式、資料歸攏式的編纂模式,充分利用數字平臺在數據整合和集成上的潛力,探究更廣闊的社會變遷對譜主工作、家庭、生活的影響,以及給其生命體驗帶來的變化。唯其如此,方符合影人年譜之以“人”為中心的編纂取向。在這個意義上,影人年譜的編纂同時也是一種對譜主的“心靈考古”。

在考古學界,有人認為“考古學‘研究工作的全部目的是重建已逝生活(彼特里)’”(20)張忠培:《中國考古學:實踐·理論·方法》,中州古籍出版社1994年版,第144頁。。對“影人個體數據庫”海量數字檔案資料的挖掘和分析也可看成一種考古行為,其所得可為各學科提供海量資源,重建過去的信息,加深對人、社會、時代的理解。依托CCKS平臺上詳細的影人年譜數據,在相應數字工具的加持下,對這些數據進行挖掘和可視化分析,就能夠呈現出某一個影人的生活狀況和成長脈絡。更重要的是,一個人從出生到死亡,無時無刻不處在與周圍人的交往之中,同時受到所處時代背景的影響。隨著影人年譜數據的增加,CCKS平臺還能夠構建出眾多影人之間復雜的交往網絡,進而呈現出其與大時代背景之間的關聯。這就突破了對單一影人的靜態研究,CCKS平臺通過將人與人之間的交往網絡與時代背景相關聯,能夠進一步為我們更好地理解某個影人和某一類影人群體提供堅實支撐。

在海量的數據面前,我們仍然需要警惕,不能沉浸在數據中并成為簡單的數據搬運工?!爸挥袑⒛骋滑F象放入個體的整個生命歷程中進行評估,我們才能真正理解它的本質作用。只有在確保個體的每一種外在表現都是他們總體行為模式的某一層面之后,我們才能深入考察人類的思考方式?!?21)[奧]阿爾弗雷德·阿德勒:《理解人性》,羅鴻幸、王心語譯,新世界出版社2016年版,第78頁?;凇坝叭藗€體數據庫”進行“心靈考古”,就是這種人文性的體現。

與常規的考古作業不同的是,“心靈考古”的對象是人,其目的是知人論世?!靶撵`考古”需要從數據和信息入手,借助一定的計量工具對“影人個體數據庫”中收錄的數據和信息進行挖掘,將數據信息作為發掘人類精神活動的資料?!懊總€個人的成長心路、社會經歷、工作經歷、情感經歷、歷史見聞、生活感受和生命思考,都有其不可替代的個體獨特性?!?22)陳墨:《再論口述歷史與心靈考古》,載陳墨:《口述史學與心靈考古——論文與演講集》,人民出版社2019年版,第75—76頁。與此同時,每個人都在社會中成長,是社會化的產物?;凇坝叭藗€體數據庫”進行的“心靈考古”,就是通過數字手段重建個人的生命歷程、生活場景,兼及其所處社會風貌和時代特征。在科學手段的加持下,通過對人的“心靈考古”,能夠與不同學科產生鏈接,為相關學科的發展提供充足的資源。因此,借助“心靈考古”的方法,可以將“影人個體數據庫”打造成社會變遷的信息庫、學術研究的資料庫、個體生命的體驗庫。

三、大數據、數字人文與知識生產

開源眾包的目的是更好地促進知識生產和創新?!伴_源模式實際上是一種依托互聯網平臺,通過大規模群體智慧共同參與和協作,不斷累積智慧,實現持續創新的方法?!?23)中國開源軟件推進聯盟:《中國開源發展概述、機遇與挑戰》,《軟件和集成電路》2022年第2、3期合刊。開源平臺的參與者可以充分利用前人提供的學術資源,在很大程度上避免重復勞動,大幅降低了獲取知識的難度和成本,因而更加有利于知識的更新和迭代,能更好地促進知識生產。目前,CCKS平臺還處在資料歸集、信息和數據開源的階段,如何最大限度發揮影人年譜在知識生產中的作用,是平臺建設好之后需要著重考慮的問題。

在大數據時代,數據成為一種不可或缺的生產要素?!叭祟惪梢浴治龊褪褂谩臄祿诖罅吭黾?通過這些數據的交換、整合和分析,人類可以發現新的知識,創造新的價值,帶來‘大知識’、‘大科技’、‘大利潤’和‘大發展’?!?24)涂子沛:《大數據》,廣西師范大學出版社2013年版,第57頁。大數據革命是人類歷史上所進行的一場力度之大、范圍之廣、程度之深皆前所未有的變革,“而文本也可以‘溶化’成無形的、隨時可以變革和重新塑造的大量數據”(25)馮亞琳、[德]阿斯特莉特·埃爾主編:《文化記憶理論讀本》,北京大學出版社2012年版,第18頁。。當一個個“影人個體數據庫”匯集在CCKS平臺上時,其所包含的各種類型的海量數據無疑是一筆巨大的財富。(26)截至本文寫作時,CCKS平臺上費穆年譜和史東山年譜的數據均超過了600條,且還在不斷豐富中。試想,如果有100個、1000個甚至更多影人的年譜在CCKS平臺上線,其中包含的文字、圖片、錄音、錄像等各種類型數據的數量無疑是極為可觀的。面對這些數量龐大的數據,傳統研究方式當然會從中獲益。筆者自身就有深刻體會,在對中國電影史上的著名導演史東山進行研究時,由于搜集到的資料有限,一開始無法得出史東山與早期美術團體晨光美術會發生聯系的準確時間,只能推測出一個粗略的時間框架,但是得益于CCKS平臺上的史東山年譜,筆者得以彌補資料搜集上的不足,能夠將史東山加入晨光美術會的可能時間范圍大幅度壓縮,從而提高了研究的精確性。不過,要想充分發揮這些數據的潛能,還需要更深入的數據挖掘,這勢必要求我們在研究方法上進行革新。近年來興起的數字人文研究,或許就是一個可能的方向。

作為一種研究方法,數字人文在國內外逐漸盛行,席卷人文社會科學的各個領域。數字人文研究其實就是具有專業知識的學者,以相應的定量研究工具,對海量數據進行挖掘、整理、分析的一種研究方法?!案咚郊夹g設施能夠促進高質量的、創新的、兼具理論性和試驗性的數字人文工作?!?27)[英]大衛·M. 貝里、[挪]安德斯·費格約德:《數字人文:數字時代的知識與批判》,王曉光等譯,東北財經大學出版社2019年版,第110頁。應該說,作為數字基礎設施的CCKS平臺以及依托其開展的“影人個體數據庫”的建設,使得中國電影學界以大數據為基礎開展數字人文研究具備了可行性。

前文論述了對影人進行“心靈考古”的可能性,這是依托于“影人個體數據庫”向內進行的挖掘,而“數字人文則是有關整合和生成性的實踐:用專家知識的方塊建立更大的圖景”(28)Todd Presner、Jeffrey Schnapp等:《數字人文宣言2.0》,桂文瑄、葉梓濤譯,葉梓濤校,“落日間”微信公眾號2022年7月7日推送。。影人的活動勾連著大到時代、社會,小到職場、家庭等不同圈層,通過“影人個體數據庫”向外,還能夠連接起相關影片和影事,進而可窺影史之一斑。普澤南、李鶴伊、喬寧、孫婧等學者對可能的研究方向進行了初步探討(29)參見普澤南:《從數字人文的起源看影人年譜與其關系》,《電影藝術》2020年第4期;李鶴伊:《數字人文、文化分析與中國影人年譜的可視化》,《鄭州大學學報(哲學社會科學版)》2021年第5期;喬寧:《數字人文時代基于社會網絡分析法的影人年譜研究初探》,《電影評介》2022年第2期;孫婧:《數字人文與電影史研究的“顯宏鏡”》,《電影藝術》2022年第4期。,但這些研究均有一個大的前提,即需要以海量且易獲得的數據為依托。楊世真、陳剛、范倍、范志忠、喬潔瓊、唐媛媛、李春芳、朱子彤等多位學者的計量電影學研究成果(30)參見楊世真:《計量電影學的理論、方法與應用》,《當代電影》2019年第11期;陳剛:《計量電影學與費穆電影結構的可視化路徑》,《電影藝術》2020年第4期;范倍、郭柳蹊:《風格的代際轉移:中國第五代、第六代導演的計量學研究》,《貴州大學學報(藝術版)》2021年第3期;范志忠、于欣平:《計量電影學視閾下新主流電影工業集體創作的可視化路徑》,《藝術百家》2021年第6期;喬潔瓊:《中國早期電影風格管窺(1922—1937)——基于計量電影學視角》,《電影評介》2021年第22期;唐媛媛、師志豪:《計量電影學視域下的紅色電影研究——可視化路徑與美學內涵》,《電影文學》2022年第10期;李春芳:《〈阮玲玉〉計量分析與中國早期影人圖譜》,《電影藝術》2022年第4期;喬潔瓊:《重寫電影史視域下史東山電影風格的計量學考察》,《當代電影》2023年第4期;朱子彤:《數字人文視域下的呂班電影研究——以CiteSpace、Darwin、微詞云、Voyant為主要工具》,《當代電影》2023年第4期;唐媛媛:《“十七年”國產彩色電影的色彩計量研究》,《當代電影》2023年第4期。,都是個人或帶著學生組成的小團隊進行的定量分析,需要處理的數據量相對較小,尚缺少對大規模數據的統計、量化與論證。

因應大數據時代的特征,美國斯坦福大學教授弗蘭克·莫萊蒂(Franco Moretti)提出的“遠讀”理論或許可以提供一些借鑒?!斑h讀”是建立在大量文本數據的基礎上,“借助于社會科學的定量分析和圖表示意、地理學的地圖、進化論中的系譜樹,構建出一系列抽象模型”(31)宋炳輝:《新文科時代如何文學?——兼及莫萊蒂的“遠讀”理論》,《燕山大學學報(哲學社會科學版)》2022年第2期。。大數據分析方法可以處理與某個論題相關的全部數據,重在探討數據之間的相關性。要想更好地挖掘“影人個體數據庫”中海量數據之間的關聯,“遠讀”無疑是一種可行的方式。使用定量分析方法從中發現規律,從而能夠達到一種宏觀視野的整體觀照。在計算機數據挖掘技術的加持下,以“遠讀”為方法,能夠為尋找不同影人、影片、影事在同一時空或者不同時空之中的相互關聯提供便捷,可視化、地理信息系統、影人關系圖譜等也都具有了實現的可能,進而能激發出新的研究生長點。

數字人文的研究方法引入人文學科之后,多學科團隊協作的知識生產方式將越來越普遍,因而能夠促使新的研究工具的開發和學術生產方式的蛻變。為了適應這一趨勢,未來或許可以參考一些開源科研平臺的模式。有學者將開源平臺分為三種模式:一是開源社區,網絡大眾完全憑興趣和愛好不計報酬地參與平臺事務,諸如維基百科、百度詞條;二是事務眾包,網絡大眾完成平臺上發布的事務并獲取一定的物質報酬;三是科研眾包,網絡大眾群策群力為平臺上發布的科研任務提供解決方案并能獲取豐厚報酬。(32)參見龐建剛、劉志迎:《科研眾包參與主體及流程的特殊性》,《中國科技論壇》2015年第12期。當前,CCKS平臺的參與者不計報酬、完全憑一腔熱忱和專業追求參與其中,因此它目前還屬于第一類“開源社區”。接下來可以考慮設立一些獎勵措施,以鼓勵更多人參與其中,將平臺從單純的“開源社區”發展到“事務眾包”乃至“科研眾包”,進而將單一線性的電影史進行豐富拓展,展現特定歷史節點中的人物和事件,以透視其所在的時空切面乃至整體,為電影史乃至整個電影學研究帶來更多的知識生長點。更進一步,CCKS平臺通過開放接口與其他數據庫相連,能夠參與到更廣闊的人文社會科學的研究當中,或許能夠產生出我們完全無法預料的更大規模的應用以及學術成果。這樣一來,依托于CCKS平臺編纂的影人年譜,其意義就能夠大大超出電影史乃至電影學的學科范疇,在更大范圍內發揮作用,成為學科之間融會貫通的一個中介。

需要注意的是,在數字人文學者憑借各學科的集團作戰優勢掀起了一場聲勢浩大的學科范式、研究方法變革的同時,我們在這股熱潮中始終需要清醒地思考:“數字”與“人文”二者何為重點?“數字”并不是萬能的,更不能替代人文學科的內在精神品格。通過簡單數據檢索和數字化修飾即產出一篇論文的快餐式做法,是學術研究的大忌。唯有如此,才能回歸數字人文和知識生產的初心。

四、結語

CCKS平臺橫空出世并確立開源眾包的方式,呼應了數字時代信息和數據開放的大趨勢?;谄浯蛟斓闹袊叭四曜V,當以構建“影人個體數據庫”為目標,以海量數據和資料為基礎,借助新的數字技術嘗試進行“心靈考古”,促使其從現階段僅作為知識開放的平臺升級成一個全新的知識生產平臺,如此這般,“將在很大程度上更新中國電影的知識結構,影響中國電影的研究格局,進而重組中國電影的學科體系”(33)李道新:《影人年譜與中國電影史研究》,《當代電影》2019年第1期。。當然,如何建立一個有效的、確保信息準確性的審核機制,平臺的開源眾包和審核機制之間的關系如何平衡,CCKS平臺應該如何將自身與維基百科、百度百科等區別開來,這些都是在實踐中需要進一步探討和解決的問題。

猜你喜歡
影人年譜開源
證肇經先生年譜(續8)
讀《郭沫若年譜長編》的幾點思考
五毛錢能買多少頭牛
影人姚晨
朱彝尊年譜新考
詭異的屋內“怪影人”
大家說:開源、人工智能及創新
開源中國開源世界高峰論壇圓桌會議縱論開源與互聯網+創新2.0
《清錢編年譜》(英文原版)訂購方法
開源計算機輔助翻譯工具研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合