?

數碼物、數字人文與電影研究

2024-02-26 09:40喬潔瓊
山東社會科學 2024年1期
關鍵詞:數碼人文數字

喬潔瓊

隨著數字技術的發展,自然語言處理、機器學習、數據挖掘等技術已經深度參與到人文學科研究之中。數字人文研究以數據為核心驅動力,強調一切對象必須被數據化后才能進行計算和處理。被數據化的影片、圖片、文獻、數據庫成為數碼物。數碼物既是數字技術發展的產物,同時也將物的討論帶入一個全新的哲學領域。對于電影研究而言,計量電影學、計算機視覺、知識圖譜、社交網絡等數字人文方法的應用,不僅帶來了方法論上的創新,而且引起了電影研究的思維轉換和范式轉型。本文試圖從數碼物的產生及其本體特性出發,探討電影及數據庫的數碼化存在方式,以及在電影研究中數字人文闡釋框架的變化。

一、什么是數碼物

數碼物的出現讓人重新審視“物”的本質。學界從實體物到數碼物的討論體現了從“主體—實體”到“關系—實體”再到“關系—存在”的一種本體論哲學思想的變化。從亞里士多德到笛卡爾、休謨、康德、黑格爾、胡塞爾等,西方哲學家多以“主體—實體”認識物的存在?!爸黧w—實體”討論的是物作為一種實體性存在,“可以理解為自然物哲學概念的核心問題”(1)許煜:《論數碼物的存在》,李婉楠譯,上海人民出版社2019年版,第6頁。。如亞里士多德《范疇篇》(Categories)中提出物是質料與形式的結合,主體通過感知形式認識物;康德提出“物自體”的概念,認為我們只能通過先驗統覺來認識物的現象,而無法認識物的本身;胡塞爾將一切看作“意向性客體”,認為主體的意向性行為指向客體從而使客體理念顯現。在這些論述中,物作為一種客體,是主體經驗的客體,主體的任務是通過意識達成對客體的認知?!瓣P系—實體”論則從關系或者環境出發認識物的本質,吉爾伯特·西蒙棟(Gilbert Simondon)的《論技術物的存在》(OntheModeofExistenceofTechnicalObjects)摒棄了從質料和形式的結合來認識物的思維,提出了“技術物”的概念,認為技術物是關系的統一體,關系是在技術成分到技術個體再到技術組合這一進程中建立的。(2)參見公維敏:《吉爾伯特·西蒙棟:技術物的發明與關鍵點網絡》,《自然辯證法通訊》2023年第6期。海德格爾指出,物的意義只有在關系中才能呈現。比如,當一把錘子砸向釘子的時候,其意義才能顯現。(3)參見[德]海德格爾:《技術的追問》,載吳國盛編:《技術哲學經典文本》,清華大學出版社2022年版,第289頁。

20世紀,隨著量子力學、計算機技術、信息技術的發展,人們重新思考所謂“實體”。事物存在于不同的現實級,物并不必然以可見實體的形式存在。電子、粒子、比特等是看不見的,但它們同樣構成了物。人們對物的認識從“關系—實體”轉向“關系—存在”。比如,以比特為單位的計算機信息出現。盧恰諾·弗洛里迪(Luciano Floridi)認為信息是一種遵循數學傳播理論的數學存在物,他將數碼化的世界稱為“信息圈”(infosphere),認為真實的終極性質是信息,信息是由數字創造的新實體,正以前人無法想象的方式與世界互動并操縱世界。(4)參見Luciano Floridi, “Against Digital Ontology,” in Synthese, Vol.168, No.1 (2009), p.151.加斯東·巴什拉(Gaston Bachelard)提出用存在代替實體。關系是中心,它依靠技術或觀察工具而實現,而基于計算和網絡的數碼物是“由已形成的關系構成的技術系統,在此之中任何事物都有與其他事物連接的可能”(5)許煜:《論數碼物的存在》,李婉楠譯,上海人民出版社2019年版,第22頁。。許煜認為,計算機的出現與其被廣泛應用于處理大型數據標志著基于關系存在論的信息系統的出現。(6)參見許煜:《論數碼物的存在》,李婉楠譯,上海人民出版社 2019 年版,第23頁。今天,人們已經身處數字化環境中,受算法控制。正如尼古拉·尼葛洛龐帝(Nicholas Negroponte)所言:“計算不再只和計算有關,它決定我們的生存?!?7)[美]尼古拉·尼葛洛龐帝:《數字化生存》,胡泳、范海燕譯,海南出版社1997年版,封面。

在此邏輯基礎上,許煜提出“數碼物”的概念:“數碼物”是一種“關系—存在”物,它不是實體,也不僅僅是信息,它是“一種新型的工業產物,遍布我們這個無處不在的媒體時代生活的方方面面——例如網絡視頻、圖片、文字……它們既存在于屏幕上(我們可與之互動),也存在于電腦程序的后端或內部”(8)許煜:《論數碼物的存在》,李婉楠譯,上海人民出版社2019年版,第2頁。。從基本的計算層(包含編程、協議、處理),到組織層(數據的處理方案),再到輸出層(界面、網絡)等,都是數碼物。從物所涵蓋的量來看,數碼物足以與自然物、人造物相比。我們必須從關系的角度來認識數碼物,比如,下載、編輯、上傳電影片段在膠片時代是不可能的,這些行為必須在網絡環境下進行,因此這些片段就不再是電影膠片而是數碼物。

數據成為“物”有三層含義:第一,從1946年計算機發明后,信息以計算機數據的方式存儲與傳播。尼葛洛龐帝在其《數字化生存》(BeingDigital)中用“比特和原子”代表兩種不同的“物”:“原子”是物理世界中物的最小構成單位;“比特”是信息的基本單位,沒有重量、尺寸、顏色。(9)參見[美]尼古拉·尼葛洛龐帝:《數字化生存》,胡泳、范海燕譯,海南出版社1997年版,第21—27頁。與原子物不同,比特物非物理性存在,但也不是虛擬性存在或意識性存在,而是一種新的物的存在。數碼物由數據、元數據以及數據方案(算法)組成,具有可計算、可編程、可編輯、模塊化、自動化等特征。第二,這是一種物質形式的轉化,如出版物、膠片、圖片、聲音的數字化。戴維·杰勒恩特(David Gelernter)在1991年提出“鏡像世界”(10)參見上海社會科學院信息研究所編著:《智慧城市辭典》,上海辭書出版社2011年版,第141頁。,他認為隨著計算能力的提升和無所不在的鏈接,人類將用數據流和算法構建出一個反映真實世界的模型,這個模型可以被理解、被操縱、被重新安排,形成物理現實在網絡中的“鏡像世界”。進入數碼物的時代,是人類從過去單一的物質化生存向“物質化+鏡像化(虛擬化)生存”(11)賈利軍、許鑫:《談“大數據”的本質及其營銷意蘊》,《南京社會科學》2013年第7期。的復合生存的轉變,這一過程就是數碼物化的過程。簡言之,數碼物肇始于計算機技術,形成于互聯網技術,與物理現實有著對應的關聯性,計算機和網絡構成了數碼物存在的基礎。第三,數碼物是一種空間性和關系性存在。數碼物存在于計算機信息空間,存儲數據也需要空間(通常指本地空間和網絡空間),其依賴于通用標記語言(GML)、超文本標記語言(HTML)、可擴展標記語言(XML)等語言和規則構建的數碼環境,即弗洛里迪所謂的“信息圈”。數碼物依賴于技術基礎設施建設,如區塊鏈技術、數字技術、計算機技術、網絡技術等。

數碼物不僅僅是數據或者信息,我們該如何全面地理解它?許煜認為,理解數碼物需要經過兩個運動過程:一是“數據的物化”,指將數據處理為映射或模仿系統,如用數據構成可理解的圖像、數字電影等;二是“物的數據化”,指將標簽附加到對象上,并將它們編碼到數碼環境中,如將一部影片或小說輸入某個特定算法編碼的系統中,系統再將其分解為可分析的數據。許煜認為,這兩個運動過程有著非常重要的作用:“(1)它脫離了基于超鏈接的萬維網而成為物的萬維網;(2)它代表了機器更重要的角色,不僅僅是輸入輸出設備,也可以部分地作為‘思維機器’?!?12)許煜:《論數碼物的存在》,李婉楠譯,上海人民出版社2019年版,第44頁?!皵祿奈锘焙汀拔锏臄祿?最終指向的都是現實的存在。因此,數碼物作為物的形式呈現了人類的經驗,表達了一種整體存在的觀念。

今天,數碼物為我們提供了一個理解數字人文的新視角。數字人文已經以一種不可阻擋的趨勢進入了人文藝術研究領域,目前學界對數字人文的認識呈現出兩種極端:一是認為數字人文的內核是計算性,對數字高度熱情,言必稱數據;二是認為數字人文仍是人文學科,因為數字無法呈現真理和意義,計算“抽象或簡化原本復雜的文學現象,使得文學作品失去了其豐富性和獨特性”(13)Heather Love,“Close but not Dep: Literary, Ethics and the Descriptive Turn,”轉引自李天:《數字人文方法論反思》,《中國文學批評》2022年第2期。,因此應對數字抱有必要的警惕。應該說,這些討論仍然在認識論的視角下將數字視為一種工具,本質上仍將研究對象視為一個傳統意義上的客體。將數碼物引入數字人文的討論,是在本體論觀照下對研究對象的重新審視。正是基于數碼物的“雙重運動”特性,一切文本、影像、印刷物、圖片等,必須成為數碼物,才能成為數字人文的研究對象。同時,人們通過特定的算法,將其數據化、圖譜化、可視化,成為可闡釋的數據經驗,這些生成的數據不僅是特定數碼物的意義闡釋,也是數碼物的存在形式,意義產生于對象的存在結構中。這就為數字人文的闡釋打開了新維度:計算機網絡構建了一整套語義網絡和話語系統,這個系統以算法為語言,發展出一種不同于傳統人文學科的闡釋方式,這種闡釋方式不僅僅是數字的,而且是關于存在、意義和價值的,是數據經驗與人類主體經驗的統一。

由此,“‘數據界’與‘自然界’和‘社會界’一樣可以成為一個獨立的研究對象”(14)賈利軍、許鑫:《談“大數據”的本質及其營銷意蘊》,《南京社會科學》2013年第7期。?!把芯繉ο蟮淖兓钦麄€變化鏈條的基石”(15)李天:《數字人文方法論反思》,《中國文學批評》2022年第2期。,當電影從膠片形式轉變為數字形式并在數據庫中保存時,知識生產的方式就發生了根本性的變化。

二、作為數碼物的電影與數據庫

海德格爾認為,“物性只能根據與其環境相關的關系來考慮”,“物(Ding)的秘密在于它不能被認為是對立的關系——對象——而應被理解為存在物的集合,存在(Being)在其中自我解釋”。(16)轉引自許煜:《論數碼物的存在》,李婉楠譯,上海人民出版社2019年版,第150頁。電影的拍攝方式、存儲介質、放映方式、傳播與接受方式等規定著電影的物性,作為數碼物的電影和數據庫規定了數字時代電影研究對象的基本特性。

膠片時代的電影生產流程為:膠片拍攝—拷貝洗印—拷貝物流—拷貝放映。膠片拷貝需要較高成本,而且每進行一次拷貝和放映,都會對膠片造成一定的損耗,原初的膠片電影就具有了“此時此地性”和“原真性”。瓦爾特·本雅明(Walter Benjamin)認為,藝術品正是由于有“此時此地性”和“原真性”,才能使其保有“靈光”。(17)參見[德]瓦爾特·本雅明:《機械復制時代的藝術作品》,王才勇譯,中國城市出版社2001年版,第8頁。隨著膠片的破損和消逝,“靈光”也消逝不見。錄像帶和DVD等新載體的出現使經典電影得以“復活”。但DVD仍需借助特定的設備存儲與放映,傳播范圍也較為有限。老電影的“靈光”仍有隨著載體的損壞而消逝的風險。同時,傳統環境下電影編輯與分析的難度仍然較大。電影的存儲介質、存在環境、傳播環境以及編輯環境決定了傳統電影研究的基本范式,即主體(觀眾)通過感性經驗認識和闡釋文本(電影)。也正因如此,傳統電影研究多聚焦于敘事研究、文化研究,闡釋多依賴于感性經驗,對電影本體的分析受限。

膠片數字化是將圖像和聲音構成的電影場景轉化為一套計算機代碼,以原子為單位的膠片被以比特為單位的數據所取代。經典電影的數字化包含三種情況:一是針對膠片局部污損、褪色、丟幀、抖動等問題,通過算法來檢測損傷并進行修復,盡量恢復老電影的原貌;二是通過深度學習技術將黑白電影轉換為彩色電影,或進行重新編輯;三是對經典電影進行3D再創造,如對老電影《大鬧天宮》原片進行重新剪輯并進行3D制作,《天書奇譚》經過4K高清修復后,3D轉制也在計劃之中。膠片的基本原理是復制,強調影像與現實的索引關系。而數字影像以像素的形式呈現,損耗膠片數字化后,由像素進行填補、修復、亮度調整、轉彩等。從本質上說,修復電影是由比特組成的混合物,其基本特點就是普通用戶可編輯、可存儲、可傳播?!氨忍貨]有重量,易于復制,可以以極快的速度傳播。在它傳播時,時空障礙完全消失。原子只能由有限的人使用,使用的人越多,其價值越低;比特可以由無限的人使用,使用的人越多,其價值越高?!?18)[美]尼古拉·尼葛洛龐帝:《數字化生存》,胡泳、范海燕譯,電子工業出版社2017年版,“前言”第51頁。當在線電影片庫取代了線下的物質存儲,電影進入計算機“輸入(物的數據化)—輸出(數據的物化)”系統,用戶成為影像的生產者和傳播者。膠片的數字修復、再剪輯以及在此基礎上的3D制作,都變為數碼物。

作為數碼物的老電影不再依賴于原作的“此時此地性”和“原真性”,而是通過網絡存儲與傳播,吸引新生代觀眾觀看,從而促進電影觀眾的迭代。經典電影在數字環境下繼續被討論和闡釋,形成了新的意義和解讀,增強和延長了作品的意義鏈,延續了經典電影的“靈光”。同時,作為數碼物的電影進入計算系統可以反復被編碼、編輯、重組、計算、評論,形成數據的數據。電影文本與生成數據都成為研究的對象,計算機工具、網絡工具和研究主體共同生成主體經驗。進入計算機系統的電影文本經過計算,呈現為一系列數值,這將我們引向電影的內部結構、文本風格特征和電影的發展趨勢分析。數據經驗參與到主體對文本的閱讀中,彌補了電影闡釋的感覺化和模糊性。數字時代的電影與電影研究正實現著從微觀到宏觀層面的“從價值論到本體論的思維轉向”(19)李道新:《數字時代中國電影研究的主要趨勢與拓展路徑》,《電影藝術》2020年第1期。。

再來看作為電影研究資料的數據庫,在線數據庫典型地體現了數碼物“關系—存在”的本體屬性,從電影資源到電影研究,各類網站以鏈接的方式形成一個龐大的網絡世界。以電影史料為例,除影片本身外,它還包括與電影相關的學術文獻、報刊資料、口述史與回憶錄、書信、日記、公司記錄、音頻、圖片、視頻、圖書、海報、劇本,等等,這些內容正加速數據庫化。第一類是文獻數據庫,如中國知網、《申報》全文數據庫、香港舊報紙、中國電影學術網等。這類數據庫主要是將紙質資料或者整理后的文獻信息輸入計算機中,能夠實現對文獻信息的檢索。第二類是量化數據庫,如巴瑞·索特(Barry Salt)的Starword平臺、戈內斯·塞維揚(Gunars Civjans)與尤里·齊維安(Yuri Tsivian)等創建的Cinemetrics平臺、杰里米·巴特勒(Jeremy Bulter)開發的Shotlogger平臺、中國學者田豐創建的電影數據分析平臺等。此外,貓眼、燈塔等以票房為主要數據的在線數據庫也屬此類。這類數據庫以數據統計和分析為特征,可在線形成各類數據和可視化圖表。第三類是綜合類數據庫,如加州大學伯克利分校太平洋電影資料館電影研究中心網站、中國電影知識體系平臺等。這類數據庫呈現出一種互聯性強、開放性高、參與性廣的“泛在學術”特征。平臺為數據庫提供了管理框架,實現了數據的可交互、可編輯以及學術的再生產。此外,基于鏈接的ChatGPT、百度百科、維基百科等實現了大數據的即時編輯與整理,海量大數據的指數級增長和信息地理等空間數據庫進入電影史研究,圖片、視頻、文字等都參與到數據庫的構成中,電影與數據庫的存在越來越空間化。數據庫不再是一種研究的工具和對象,而是一種以“鏡像”的方式呈現的“擬形化歷史”(20)徐之波:《擬形化歷史與結構化知識:數字人文視野下影人年譜研究》,《電影評介》2023年第1期。,是一種與我們的存在融為一體的數碼物。作為數碼物的數據庫不僅僅是數據庫,還可以生成數據的數據,并以一種結構化、關系化的方式呈現數據,如知識圖譜、社交網絡、地理信息系統等。

知識圖譜的概念2005年由大連理工大學陳悅等人引入中國并命名:“科學知識圖譜是以知識域(knowledge domain)為對象,顯示科學知識的發展進程與結構關系的一種圖像?!?21)陳悅等:《CiteSpace知識圖譜的方法論功能》,《科學學研究》2015年第2期。以CiteSpace為代表的文獻分析軟件,成為繪制知識圖譜的流行軟件。該軟件能夠快速在海量文獻中對關鍵詞等信息進行提取,還可以將提取信息進行統計分析,將學科結構、規律和分布用可視化的方式呈現出來,具有“圖”和“譜”的雙重性質。該軟件的開發者陳超美認為:軟件的目的是讓使用者通過知識圖譜的繪制,看到知識圖譜將會如何改變人們看世界的方式。(22)參見劉則淵、陳悅、侯海燕等:《科學知識圖譜:方法與應用》,人民出版社2008年版,“序言二”第5頁。

影人年譜是電影史研究的核心內容之一。李道新認為,影人年譜應“在最大限度還原社會歷史面貌和體認影人生命軌跡的過程中,為中國的電影史研究提供必要的知識積累和價值導向,并為重述中國電影史以及構建‘中國電影學派’奠定不可或缺的學術基礎”(23)李道新:《影人年譜與中國電影史研究》,《當代電影》2019年第1期。。大數據可視化語言方式可通過信息地理和社交網絡等方式“還原”影人生命軌跡和社會歷史面貌。社交網絡理論的核心概念是結點(node),即網絡中的行動者。結點可以是人、組織、地點等,這些結點通過邊緣聯系起來,形成一個復雜的社交網絡。(24)參見林聚任:《社會網絡分析:理論、方法與應用》,北京師范大學出版社2009年版,第50頁。社交網絡理論在電影人物關系和歷史檔案人物關系方面應用廣泛,如檀秋文通過對20世紀20年代史東山的交際網絡進行考察,發現史東山與晨光美術會藝術家和鴛鴦蝴蝶派文人交往密切,影響了史東山20世紀20年代的電影創作風格。(25)參見檀秋文:《晨光美術會和鴛鴦蝴蝶派——從交際圈看史東山20世紀20年代的電影創作》,《南京師范大學文學院學報》2023年第1期。中國電影知識體系平臺專設“社交網絡”二級系統,在這個界面可以直觀地看到影人的創作及其社交圈(見圖1)。

圖1 中國電影知識體系平臺社交網絡圖例

地理信息系統(GIS)是一種以計算機技術為基礎的處理地理數據的理論和系統,現在已經普遍應用于社會的各個領域。目前,地理信息系統已經普遍應用于歷史研究,其最大優勢在于可以追蹤歷史上的動態事件。將其應用于影人年譜的編撰中,能夠動態追蹤影人、影事的社會影響因素,能夠更好地“體認”影人的生活軌跡和情感變化。以此作為基點,研究者可以更為客觀地討論影人創作思想和創作風格的變化。

通過特定的算法,電影數據庫正深刻影響著電影的創作和傳播。如根據特定電影數據庫提供的數據,電影制作公司和發行商利用算法提取相關信息,分析電影市場和觀眾,以預測電影的票房和口碑。算法可以用于電影推薦系統,通過分析觀眾的瀏覽和觀影記錄,給用戶推薦符合其喜好的電影。電影公司還可以根據算法提供的結果選擇演員、推廣策略以及營銷方式。從電影制作上來說,在技術的加持下,算法可以用于制作電影特效和豐富視覺效果,通過計算機生成圖像和合成技術,創造出各種虛擬場景和特效,甚至可以生成新的“算法電影”。由“記錄”“復制”為核心詞的電影制作正在被“生成”“合成”所取代,這也帶來了一系列美學上的變革。

大數據的本質不是數據,而是“人類的社會生存方式從單一的物質實體生存向物質實體生存及其鏡像化生存融合的社會綜合生存方式轉變”(26)鮑宗豪、宋貴倫:《重視大數據時代的社會治理創新》,《紅旗文稿》2014年第11期。。因圖像技術的出現,海德格爾指出世界以圖像的方式顯現自身。(27)參見陸揚主編:《文化研究概論》,復旦大學出版社2008年版,第120頁。在不久的未來,當數據量足夠大,數據內容足夠多樣(文檔、照片、視頻等),歷史就會以“鏡像”的方式存在于界面上。因此,無論是基于知識圖譜的文獻分析,還是基于社交網絡、地理信息系統的影人年譜編撰,體現的都是一種面向未來的整體化和關系性思維。它們都是為歷史構建“鏡像”的方法和工具,通過不同層級的數據,將碎片化歷史記錄描述為一個結構化的“譜系”和“鏡像世界”。我們不僅能夠從自身“經驗”出發去體驗影人的生命軌跡,還能夠抽身出來,站在一個“巔峰視角”,從歷史視野洞察其規律與真相。

三、電影數碼物的數字人文闡釋路徑

本體論的“它是什么”和認識論的“如何表示”密切關聯。數字人文為描述和解釋數碼物提供了一種系統的語言和方法。數碼物“存在于以算法運行的遞歸函數構成的自動化環境中。算法隸屬于語法化(grammatization)進程的歷史:完全網絡化的數碼環境乃是語法化的最高階段”(28)許煜:《論數碼物的存在》,李婉楠譯,上海人民出版社2019年版,“前言”第4—5頁。。算法是數碼物的基礎語言,通過算法,計算機能夠進行數據的分析、圖像的識別、語義網絡的構建乃至情感的表達。列夫·馬諾維奇(Lev Manovich)認為,人文學者在論證文化圖像時,會從內容、視覺風格、作者意圖、觀眾接受、意義、情感效果等方面對圖像的創作傳播進行分析和解讀。他們所使用的語言主要是自然語言,自然語言并不能代表模擬維度上的微小差異,如顏色、紋理、時間節奏、運動等,而恰恰是模擬維度定義了藝術的審美和體驗。(29)參見[俄]列夫·馬諾維奇:《計算機視覺、人類感官與藝術的語言》,李鶴伊譯,《當代電影》2021年第10期。數字人文描述與分析電影數碼物的語言歸納而言,一是影像的數值化呈現,二是計算機視覺。

電影計量包含一個“物的數據化”和“數據的物化”的過程。數字影像進入計算機輸入系統,表現為一系列數據,數據具有可編程性、可編輯性與可計算性,再經由算法設計進行輸出,形成一系列代表著特定含義的可分析數值。如通過Cinemetrics視頻捕獲軟件輸出一系列有關鏡頭描述的數值——ASL(平均鏡頭時長)、MSL(中位數時長)、SLs(影片鏡頭分布曲線)、LEN(影片時長)、MAX(最大值)、MIN(最小值)、NoS(鏡頭數)、CS(剪輯擺幅)等,這些數值可以被看作描述文本的數據或者影像的數值化表示。將這些數值輸入EXCEL、SPSS等軟件或R語言程序中,即可生成關于電影結構、剪輯、節奏的可視化圖表。

電影計量可以被比作一個透鏡,既可以是“顯宏鏡”,也可以是“顯微鏡”。所謂“顯宏鏡”,是通過對電影長時段數據的可視化,呈現電影節奏的發展趨勢,如范倍、郭柳蹊通過對第五代、第六代導演共計267部影片的鏡頭數據進行計算,發現第五代電影的平均鏡頭長度約為 7.11秒,剪切擺幅為9.80,第六代電影的平均鏡頭長度為9.66秒,剪切擺幅為16.50,從而得出第六代的影片節奏要慢于第五代的結論。(30)參見范倍、郭柳蹊:《風格的代際轉移:中國第五代、第六代導演的計量學研究》,《貴州大學學報(藝術版)》2021年第3期。所謂“顯微鏡”,是通過對某一位導演或者某部影片內部結構進行數據分析,考察導演的個人風格。如陳剛通過對費穆電影相關數據的分析,探討了計量電影學視角下費穆電影結構的可視化路徑;(31)參見陳剛:《計量電影學與費穆電影結構的可視化路徑》,《電影藝術》2020年第4期。李春芳通過計量分析了電影《阮玲玉》的敘事結構、剪輯特征和人物關系;(32)參見李春芳:《〈阮玲玉〉計量分析與中國早期影人圖譜》,《電影藝術》2022年第4期。筆者通過對史東山從1926到1951年6部電影的ASL/MSL、景別分配、運動鏡頭占比、長鏡頭分布等數據進行分析,考察了史東山電影的主流民族風格;(33)參見喬潔瓊:《重寫電影史視閾下史東山電影風格的計量學考察》,《當代電影》2023年第4期。此外,筆者還運用計量電影學方法對中國早期武俠電影的類型風格進行了探討,試圖探尋中國武俠類型風格生成的“元數據”(34)參見喬潔瓊、王凌霄:《計量電影學視角下1920年代中國武俠電影類型風格初探》,《電影新作》2023年第6期。,等等。

計算機視覺是理解電影數碼物的另一種語言,它包含獲取、處理、分析和理解圖像以及更高維度的數據處理方法。計算機視覺在21世紀初應用于藝術研究領域,大衛·斯托克(David G. Stork)等人利用圖像處理、計算機視覺和計算機圖形學的方法對藝術圖像的特征(如筆畫、燈光和構圖)進行數字描述。列夫·馬諾維奇在2007年創建文化分析實驗室,將計算機視覺應用于幾十個文化數據集。(35)參見[俄]列夫·馬諾維奇:《計算機視覺、人類感官與藝術的語言》,李鶴伊譯,《當代電影》2021年第10期。計算機視覺在電影領域最開始主要應用于對老電影進行無損智能化修復。對于電影風格研究來說,通過計算機視覺技術,使用JAVA、Python等編程語言,由代碼進行邏輯語言架構,進而對電影中的特定影像進行識別,經過自動化處理,以圖像序列來呈現影片,這樣就“創造了一種對整個電影或對我們感興趣的電影語料庫的視覺指紋,僅僅從影像的蒙太奇就能獲得至少是表面上的視覺洞見”(36)[德]阿德萊德·赫夫伯格:《物質性和蒙太奇:電影研究、數字人文與運動影像的可視化》,張斌譯,《北京電影學院學報》2020年第12期。。這對于傳統的只能用自然語言來描述電影風格的研究產生了革命性影響。同時,通過計算機自動識別,可將運動的鏡頭分解為離散的圖像進行分析,也可以抽取影片中的特定信息進行分析,研究者既可由此獲得對整部影片的宏觀視覺印象,也可從微觀層面對影片進行研究。計算機視覺意味著影像的圖像化呈現,是一種用圖像描述影像的新語言。2016年,德國學者阿德萊德·赫夫伯格(Adelheid Heftberger)出版了《數字人文與電影研究:吉加·維爾托夫作品的可視化》(DigitalHumanitiesandFilmStudies:VisualisingDzigaVertov’sWork),該書是最早系統使用計算機視覺進行電影研究的著作,對計算機視覺語言的探索具有奠基作用。如運用計算機視覺識別早期蘇聯電影《第11年》(TheEleventhYear)每一個鏡頭的第一幀,然后把鏡頭進行排列,從而獲得整部影片的視覺印象。有意思的是,觀看電影是一個時間行為,而通過抽取每個鏡頭的第一幀進行排列,以語料庫的方式觀看電影,時間行為轉變為空間行為。觀看方式的改變也影響著電影研究的方式,如果說電影計量善于描述電影的時間特征,那么計算機視覺則擅長處理空間問題。對于研究者來說,這種方式能夠從整體視角對文本的景別、空間、景深、人物、構圖等進行全面的“細讀”,進而揭秘導演如何獨特地使用各類鏡頭。同時,研究者還可以通過影像來探討導演的電影觀念與電影理論之間的關系,從而使文本解讀進入電影史維度。

計算機視覺在國內電影研究中剛剛起步,目前還處于軟件研發階段。中國傳媒大學李春芳團隊研發出“場景邊界檢測算法框架”,該算法能夠自動對鏡頭進行分割,可以通過物體識別、場景識別對鏡頭特征進行提取。上海大學田豐團隊開發了電影數據分析平臺,平臺包括電影色彩全局量化和可視化兩大模塊,包含幀分割、基礎圖像特征、增強圖像特征、紋理數據、邊緣數據、音頻特征數據、人臉熟練檢測、主角人臉識別、景別識別、鏡頭分割、運動識別等功能,可按電影時間序列展示整部影片受關注的色彩、運動、信息、主角、景別、鏡頭、音樂、音效等。(37)參見田豐、華旻磊:《當代知名電影色彩模式研究》,《電影文學》2020年第10期。此外,北京郵電大學呂金娜等人用人臉識別和字幕實現了一個故事角色網絡,可以自動構建影視劇的人物關系;北京工業大學毋立芳等提出一種基于特征融合的漸進鏡頭邊界檢測。(38)參見李春芳:《〈阮玲玉〉計量分析與中國早期影人圖譜》,《電影藝術》2022年第4期。電影計量和計算機視覺連接了數碼物的客體存在與主體感知,它們不是自然語言的符號和語義系統。對于電影研究來說,電影計量和計算機視覺更容易體現研究的動態過程,在此過程中,數據不僅僅是一種工具,也是一種可理解和可闡釋的語言。

作為數碼物的電影至少包含著兩種特質:一是作為數碼物,電影物質構成單位由原子變成比特,按照現代數學編碼而運作;二是作為藝術,其形式、情感的內涵規定了電影藝術的邊界。電影數碼物的數字人文闡釋路徑也發端于兩種經驗,一種是由數碼物自身的計算性和網絡性所產生的數據經驗,一種是由電影作為藝術所產生的人類主體經驗。前者是計算機闡釋,后者是人文闡釋,這兩種闡釋構成了一個螺旋結構。數字人文將電影研究導向何處,取決于我們采用何種闡釋框架。

在人文藝術學科的解釋傳統中,人類主體經驗占據核心地位。闡釋學(hermeneutics,又稱解釋學)一詞從詞源上看來自希臘神話中為諸神傳遞信息的神使赫耳墨斯(Hermes)。赫耳墨斯往返于人神之間,向人間傳遞著神諭,他說的話模棱兩可,需要經過辨析才能理解。因此,“闡釋學的一個基本前提就是對語言抱審慎的態度,認為語言雖有傳達意義之功能,但語言表述和意義之間,往往無可避免有不同程度的差距”(39)張隆溪:《闡釋學與跨文化研究》,生活·讀書·新知三聯書店2014年版,第5頁。。德國思想家弗里德里?!な┤R爾馬赫(Friedrich Schleiermacher)認為,讀者之所以能夠理解一篇文章,不僅是因為讀者和作者之間使用了相同的語言,而且因為他們擁有共同的人性。在此基礎上,施萊爾馬赫建立了闡釋學的普遍性原則,也建立了闡釋學與生命體驗的聯系。(40)參見張隆溪:《闡釋學與跨文化研究》,生活·讀書·新知三聯書店2014年版,第20頁。從生命體驗來認識闡釋活動影響到了海德格爾,他認為存在的事實是一切意識活動的前提,而解釋和理解在很大程度上依賴于直覺的作用,因此闡釋具有主觀性。伽達默爾(Hans-Georg Gadamer)從語言的本體意義來證明闡釋的本體論和現象學,將“人類經驗”區分為科學經驗和非科學經驗,而藝術經驗是一種非科學經驗,他認為,科學并不能通達真理,只有人的精神活動才能通達真理。(41)參見[德]H-G·伽達默爾:《真理與方法——哲學解釋學的基本特征》,王才勇譯,遼寧人民出版社1987年版,第86—100頁。由此可見,人文科學闡釋學關心個體感受的主觀性,強調語言的模糊性和語言與語義之間的不對等關系等問題。

人文學科強調人類主體經驗的優先性,潛在地將技術塑造為文化的對抗物,并在此基礎上發展出一套闡釋學的理論框架。經典闡釋以文本、作者、讀者為中心,以作品和實踐為基礎,構建了經典的闡釋理論與方法。但如果過于強調脫離本體的主觀闡釋,甚至主張“作者已死”,則容易使電影研究走向歧途。20世紀60年代以來,流派龐雜的當代西方文化批評進入電影研究領域,產生了所謂“宏大理論”。蘇珊·桑塔格(Susan Sontag)就曾明確提出“反對闡釋”,她反對的并不是闡釋本身,而是脫離文本的過度闡釋。80年代以來,中國電影學術界大規模地以西方文藝理論為思想資源闡釋本土電影,雖拓展了電影研究的深度和廣度,但也導致電影研究與電影實踐脫節,出現了“概念解說”“場外征用”“主觀預設”“非邏輯證明”等“強制闡釋”現象。(42)參見張江:《作者能不能死:當代西方文論考辨》,中國社會科學出版社2017年版,目錄。尤其是在面對中國電影的經典文本時,借用西方理論的討論更多的是從概念和范疇出發,而不是從文藝經驗和實踐出發,這造成了理論與創作、理論與本土電影實際脫節的情況?!啊畯娭脐U釋’真正惡劣的影響,不只是對文本或作者的誤讀,或者不良的文學生態或學科發展,而是在‘闡釋形成認識’的關系結構中,我們不再具備理解力,不再擁有認識能力,甚至不再產生追求真理的興趣?!?43)趙坤:《“喚醒現象世界的此在經驗”——基于闡釋學普遍原則的文學批評觀察》,《文藝爭鳴》2021年第6期。我們需要新的方法、新的材料和新的范式,將電影研究從“概念出發”的“強制闡釋”拉回到電影本體研究。

到了計算機大數據時代,數字人文闡釋學應運而生。由算法生成的數據具有“去人類中心”的特點,強調以“科學經驗”為中心。數字人文中的“信息可視化”不僅為人文學科提供了一種清晰的解釋支撐,而且催生了一種與傳統人文研究截然不同的意義闡釋和知識生產方式。計量電影學、計算機視覺、知識圖譜、社交網絡等形成的語言系統呈現了意義的生成過程,“這些意義生成過程是構建在其結構中的”(44)[美]蘇珊·施萊布曼、[加]雷·西門子、[美]約翰·安斯沃斯編:《新數字人文導論》,尹倩、肖爽譯,北京大學出版社2023年版,第309頁。。圖2是根據《二對一》的所有鏡頭時長繪制的電影鏡頭長度分布圖(SLs)。

圖2 《二對一》鏡頭長度分布圖

從圖2中可以看出聲音進入電影后導演對電影節奏的考量:對話鏡頭時間長、峰值高,導演將其安排在影片前6分鐘和故事的前半段,隨著故事情節的推進,影片節奏逐漸加快。如果沒有這樣的可視化呈現,影片節奏很難得以清晰表達,早期電影中聲音對電影節奏的影響可能由于技術所限而被遮蔽。同樣,可視化的散點圖、樹狀圖、網絡圖、氣泡圖以及知識圖譜、社交網絡、地理信息系統都可以看作呈現意義的修辭方法。由圖表所呈現的“并列、層次、順序、接近、連續、斷裂、位置、比例、方向等基本特征對已經確定意義如何產生的指令進行編碼,而這些基本的圖形原則構成了意義”(45)[美]蘇珊·施萊布曼、[加]雷·西門子、[美]約翰·安斯沃斯編:《新數字人文導論》,尹倩、肖爽譯,北京大學出版社2023年版,第310頁。。因此,計算機闡釋雖在一定程度上對傳統的基于人類主體經驗的人文闡釋產生了“驗證、修正”的作用,但其闡釋的目的并不是為了驗證某種人文預設,也不是為了修正某個錯誤的觀點,而是構建一種新的闡釋框架。如果說人文闡釋追求的是對語言模糊性和意義多義性的深入解讀,最終追求通向人類真理和價值之路,計算機闡釋追求的則是意義生成過程的精確性以及內容的細微性和關系性。同時,計算機闡釋仍需結合人文闡釋才能形成意義表達,如需要借助特定語境才能理解《二對一》鏡頭長度分布圖對于電影研究的意義,由知識圖譜來表達的特定數據庫的語義結構也需要進行人文解讀。同時,計算機闡釋并不必然準確與客觀,認為“自動化分析比傳統研究方法更為客觀或更少偏見”(46)[美]蘇珊·施萊布曼、[加]雷·西門子、[美]約翰·安斯沃斯編:《新數字人文導論》,尹倩、肖爽譯,北京大學出版社2023年版,第434頁。是一種錯覺,因為計算機識別的算法也是人工設定的,而且有一些統計數據是錯誤和無效數據,數據有效性的前提依然需要某種假設。計算機闡釋與人文闡釋只是闡釋框架不同,但它們都服務于人類特定的研究目標。

史蒂芬·拉姆齊(Stephen Ramsay)提出了“螺旋解釋學”,他認為,“更多數字數據的可獲得性在本質上并沒有改變人文學科的解釋學假設……現在的解釋學和以往一樣,仍然需要在過多的信息中找到一條明確目的的、有選擇的以及主觀的路徑”(47)[美]蘇珊·施萊布曼、[加]雷·西門子、[美]約翰·安斯沃斯編:《新數字人文導論》,尹倩、肖爽譯,北京大學出版社2023年版,第430頁。。對于電影研究來說,數字人文闡釋把電影研究的重心重新拉回了電影本體。在文本解讀的具體實踐層面上,“量化研究”“計算機視覺”“數據細讀”等方法揭示了文本的特征,“還原電影原初的生存狀態,區分大眾/個人、社會心理/精神實體、非藝術/藝術,等等?!诖罅康奈谋粳F象及其實踐中發現真正的學術問題”(48)陳林俠、林邦:《中國電影學派的學理性:從方法、電影史經驗到觀念性實體》,《民族藝術研究》2023年第1期。。在史料梳理上,“知識圖譜”“關系網絡”“地理信息系統”等“數據的數據”從整體性和關系性視角形成了關于中國電影史的敘述,能夠有效解決史料雜亂無序的問題,從“原子化”“離散化”的各類材料中找出它們之間的聯系,形成一種知識性表達。在中國電影研究的語境下,數據經驗與人類主體經驗構成了文本闡釋的螺旋結構,共同服務于建構中國電影知識體系這一明確的目標。

四、結語

從“關系—存在”本體論出發審視當前數字人文的研究對象,可以發現作為數碼物的電影及數據庫與傳統的電影研究存在著巨大的差異,計算機自動化生成的數據與電影文本都已成為電影研究的對象。同時,這些工具又是電影文本的閱讀者,數據經驗進入研究主體的分析中,成為人類主體經驗的一部分。數字人文不僅是一種研究人文藝術的工具和方法,也提供了一種具有范式意義的闡釋框架。計算機闡釋并不會改變人類主體經驗對真理和價值的追求,而是在人類主體經驗未能通達的地方以數據經驗為依據呈現意義。隨著計算機大數據技術的飛速發展,計算機視覺識別能夠完全根據人的意志完成各類“細讀”,基于關系的數據庫處理能夠生成各種可視化分析。那么,計算機闡釋將導向何處?對于中國電影研究來講,應在構建中國電影知識體系的主軸下進行數字人文的有效闡釋,為“建立電影語言的認知系統”“電影意義的闡釋系統”“電影歷史的鑒別系統”和“電影批評的評價系統”(49)賈磊磊:《電影學的漸進計劃》,《藝術學研究》2022年第5期。提供方法論支持,并在此基礎上彰顯電影的中國價值。

猜你喜歡
數碼人文數字
人文
Naim Audio Uniti Nova數碼播放/放大器一體機
答數字
人文紹興
數字看G20
數碼暗房
人文社科
讓人文光輝照耀未來
成雙成對
數字變變變
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合