司法大數據證據運用中律師有效辯護的困境及其化解路徑

2024-05-09 23:24付靜宇

太原理工大學學報（社會科學版） 2024年1期

付靜宇

(中國政法大學刑事司法學院,北京 100088)

隨著人工智能技術和大數據偵查模式的不斷推進,大數據證據在刑事訴訟中的運用方興未艾。理論探討及司法實踐都認可了大數據證據對于證明案件事實的重要作用[1]。然而,目前與大數據證據相關的研究多集中在大數據證據的取證和運用及其證據屬性的界定等方面,關于大數據證據運用對刑事辯護影響的研究則處于起步狀態。盡管有學者已經注意到大數據這一技術對傳統辯護制度的沖擊,但對大數據證據運用中的辯護權保障并未深入細致研究。此外,在司法實踐中,大數據證據運用也進一步加劇控辯雙方對抗能力的不平衡,對辯護律師閱卷權、取證權、質證權等傳統權利產生明顯挑戰。

為此,本文深入分析大數據證據運用對律師辯護權有效行使產生的影響,從而揭示大數據證據運用中律師有效辯護的缺失和困境,進一步探討如何在大數據證據運用背景下回應有效辯護的制度要求。同時,本文討論的有效辯護,是一種狹義的有效辯護,是以辯護律師“行為導向”為研究背景的,僅從辯護律師角度出發,強調辯護律師應當盡職、盡責、盡力提供充分有效的法律幫助。

一、大數據證據的內涵及其特點

當前,大數據證據已經出現在刑事案件中,并在相關判決書中表述為“大數據檢測技術”(1)參見《安徽省宿州市埇橋區人民法院一審刑事判決書》(2017) 皖1302刑初218號?！按髷祿治觥?2)參見《浙江省寧波市江北區人民法院一審刑事判決書》(2017) 浙0205刑初357號。等。大數據證據在刑事案件中的應用必然會呈現不斷增多的趨勢,其原因可歸為以下方面。一是隨著信息技術的發展,人類社會開始向數字社會轉型,“在數字世界里,我們都會留下電子腳印或電子指紋”[2]。犯罪嫌疑人智能化、隱蔽化的犯罪行為必然會留下相應的犯罪信息,控方可以利用大數據證據對犯罪嫌疑人留下的犯罪要素或犯罪片段進行分析、比對,從而偵破犯罪。二是網絡時代的快速發展導致電信詐騙、非法侵入計算機系統等網絡犯罪不斷涌入人們的生活,犯罪逐漸呈現出犯罪時空的復雜性、犯罪手段的多樣性、犯罪對象不確定性等特點。在此背景下,越來越多的大數據材料作為這類新型犯罪的相關證據涌入庭審之中,有必要對大數據證據的內涵及證據屬性等進一步討論和分析。

需要明確的是,并非所有與大數據相關的證據就是大數據證據,必須將大數據證據與通過信息技術獲得的信息區分開來,如偵查機關利用大數據平臺所獲取的被追訴人個人信息可以作為電子證據使用,而非大數據證據。此外,大數據證據也并不等同于電子數據。大數據證據突出強調對數據的加工、對比等分析過程,其兼具證明案件事實和分析思維、方法、技術的綜合體[3]。

縱觀之,大數據證據的內涵應包括以下內容。一是以大數據為基礎?！按髷祿睆娬{數據體量之大、數據類型和格式多樣化,存在復雜化、非結構化等特點?！皩嵺`證明,大數據的簡單算法比小數據的復雜算法更有效?！盵4]因此,通過利用在規模上、內容上足夠大的數據,能夠最大化地挖掘出證明案件事實的有效信息。二是以算法決策為核心。這是大數據證據與其他證據區別的關鍵所在。算法作為一種數據處理路徑,具有智能化、自動化等特點,算法通過對海量數據進行自動識別、篩選、對比,實現對數據的深度學習[5]。大數據證據利用算法將相關主體和案件事實之間的關系還原出來,這一算法決策是隱蔽的、晦澀的,難以被其他主體所理解。具體而言,大數據證據在刑事訴訟過程中的運用呈現以下特點。

第一,專業性。大數據證據的專業性主要表現在兩方面:一是大數據證據本身是智能化算法決策的結果,具有專業性;二是大數據證據的獲取、分析需要一定專業能力。大數據證據是以電子數據為外在物質載體的,由于網絡空間和現實空間存在間隔,再加上數據體量巨大,大數據證據的獲取往往需要憑借專業人員的技術協助[6]。同時,由于大數據證據最終呈現為智能化的算法結論,其對海量數據進行提取、對比、篩選等過程并不具有可知性,需要專業人員協助相應主體進行審查。

第二,衍生性。大數據證據屬于間接證據,具有衍生性。根據證明來源的不同,證據可以分為原始證據和傳來證據。前者強調證據未經復制、轉述,具有較強證明力,例如,刑事案件中被追訴人的供述。一般認為,原始證據是最佳證據。后者強調證據來源于間接途徑,包括他人轉述等,其證明力弱于原始證據。大數據證據是算法對與案件事實相關的海量數據進行二次挖掘和對比分析所得出的數據,本質上是算法二次加工后的數據。例如,在解某某組織、領導傳銷活動案中,控方提供的被追訴人管理的網絡層級、賬戶收支情況的證明,正是運用大數據分析方式從而實現了對被追訴人海量數據的篩選。

第三,相關性。大數據證據的相關性是指其相關性證明邏輯。算法通過收集、提取、篩選與犯罪案件事實相關的數據,形成相應的分析報告以發揮其證明作用。這其中凡是與算法模型相關的數據都會被提取。在傳統司法證明中,控訴方提供的證據與案件事實之間是一種邏輯意義上的嚴密推理和論證。與傳統因果性證明邏輯的強相關性相比,大數據證據具有弱相關性。由此看來,大數據證據的相關性證明邏輯與傳統司法因果性證明邏輯存在明顯差異。例如,在“彭某某侵犯個人信息案”中,控方從公司官方的 70臺數據庫中調出的200 條個人信息,與被告人私人 U 盤中的 50 條個人信息重合率高達 76%,這僅能說明兩者存在相關性,但并不能證明這 50 條信息就是從公司數據庫中拷貝出來的,并不能得出其具有因果性(3)參見四川省成都高新技術產業開發區人民法院(2018)川0191刑初94號刑事判決書。。

大數據證據的上述屬性和特點決定了辯方不能對其采用和傳統證據一樣的辯護策略,同時,現有的辯護制度設計難以適應新型的大數據證據,導致有效辯護的實現遭遇重重障礙。具體而言,其衍生性強調算法對大數據的二次加工,這就導致其決策過程易產生“算法黑箱”和“算法歧視”,即辯方在不知情的情況下難以行使辯護權,增大了有效辯護難度;其專業性造成辯方在缺乏專業知識的情況下難以有效閱卷,辯護空間大大壓縮;其相關性的證明邏輯加大了辯方的質證難度,降低了有效辯護的可能性。

二、大數據證據運用中律師有效辯護困境

有效辯護理論在1932年美國鮑威爾訴阿拉巴馬州的案件中被確認,即辯護律師的有效幫助是正當程序的必要條件。此后,美國經過一系列判例將不符合有效辯護的情形予以排除,并確立無效辯護及其判斷標準,豐富了有效辯護的內涵和概念[7],既要求律師達到形式意義上的參與辯護,又要求律師做到實質辯護。目前我國理論界抑或實務界對“有效辯護”的內涵和概念存在諸多爭議,對“有效辯護”的準確含義并沒有明確規定,這就導致律師辯護是否有效難以準確判斷,這背后隱含著有效辯護究竟是行為導向抑或結果導向的討論,即有效辯護是強調律師進行了有效辯護還是被追訴人獲得了有效辯護。本文從辯護律師的行為導向而非結果導向為切入點進行有效辯護困境的探討,即辯護律師應當充分行使辯護權,盡職、盡責、盡力地履行其辯護職責。但是,大數據證據的專業性、衍生性、相關性等特點,令律師的閱卷權、取證權、質證權等訴訟權利難以發揮作用,因而很難實現律師的有效辯護。

(一)閱卷不能大大壓縮有效辯護空間

閱卷權是律師有效辯護權的核心內容。其基本邏輯是庭審質證時間受限,辯方難以在控方舉證后立刻予以反駁,需要充足的時間和機會進行訴訟準備,完成對控方案卷事實和證據材料的閱卷[8]。因此,在閱卷權難以有效行使的情況下,辯方無從行使辯護權。我國《刑事訴訟法》第40條規定:“辯護律師自人民檢察院對案件審判起訴之日起,可以查閱、摘抄、復制本案的案卷材料?！币环矫?閱卷權是辯護律師進行有效辯護的前提和基礎。通過查閱相關案卷,辯方可以知悉司法機關掌握的被追訴人所涉的犯罪事實及相關證據材料等。另一方面,閱卷權符合平等武裝原則的要求。平等武裝原則強調被追訴人面臨司法機關指控時,具有與之相對抗的力量[9],辯方通過閱卷可以改變控辯雙方“信息不對等”的局面。然而,隨著大數據證據不斷被應用于案件事實證明,傳統閱卷權無論是其閱卷范圍還是實際效果都難以應對司法信息化改革的挑戰[10],主要有以下表現。

第一,大數據證據運用造成辯方閱卷范圍狹窄。一是辯方對大數據證據的閱卷范圍僅限于算法對碎片化數據運作后的最終結論,無法查閱大數據證據的數據源、算法等,難以針對其程序不足或者證據瑕疵等展開辯護。大數據證據包含顯性信息量和隱性信息量。前者是指對海量數據運用算法得出的最終結論,后者則包括數據存在的軟件環境,以及海量數據生成、存儲等過程中形成的附屬信息和相關痕跡等標識與算法運作過程等。然而,辯方查閱案卷相關材料難以獲取其隱性信息量?？胤皆诓豢紤]控辯雙方實際數據分析能力差異的情況下只提供最終證據的做法,構成“數據傾倒”,是一種實質上的不平等[11], 辯方難以在全面閱卷、充分掌握信息的基礎上進行有效辯護。二是數據和算法會成為“有罪推定”的幫兇,控方對案件事實的價值判斷會影響大數據的合理利用[12],造成辯方對大數據證據的閱卷范圍受限。大數據證據不僅可以證明被追訴人有罪或罪重,也可以發揮其有利于被追訴人的證明作用。由于辦案機關提供大數據證據的主要目的是證明被追訴人有罪,因此,司法實踐中的大數據證據多是以有罪證據的形式出現,其證明被追訴人無罪或罪輕作用被忽略,這實質上已經構成了控辯雙方的不對等,阻礙了有效辯護的開展。再加上辯方受制于技術劣勢,難以自行收集大數據證據證明被追訴人無罪或罪輕,其辯護效果大打折扣。三是辯方對大數據證據的閱卷范圍受商業秘密、個人隱私保護等限制。大數據證據的數據源、算法往往是由網絡信息服務提供者及商業主體等第三方平臺提供,考慮到大數據證據所依據的算法屬于商業主體的專利技術、大數據證據的數據源有可能經過重組轉為涉及個人隱私的信息等情況,出于保護商業秘密和個人隱私等目的,辯方難以閱卷。

第二,大數據證據運用影響辯方實際閱卷效果。辯方行使閱卷權主要有兩個目的,且目的是否完成、完成效果如何直接決定了辯方閱卷效果的好壞。具體為:一是發現對被追訴人有利、不利的證據,為之后庭審對不利證據進行反駁、對有利證據進行利用打下基礎;二是識別刑事案件中的重點及難點部分,為辯護律師的辯護策略和辯護突破點提供線索。然而,大數據證據的應用嚴重影響了閱卷效果的正常發揮。一方面,控方受“有罪思路”影響,出于發現犯罪、懲罰犯罪的目的,往往是運用大數據以查獲被追訴人犯罪事實,這就導致大數據證據多是以有罪證據的形式出現,辯護律師難以獲取對被追訴人有利的證據。另一方面,由于缺乏相應的專業知識和技術水平,即使案卷筆錄出現有關大數據證據的相關材料,辯方也難以知悉大數據證據的證明鏈條對其進行證據資格的質證,也難以對此制定針對性辯護策略。因此,與傳統證據相比,大數據證據無論是數據體量還是技術復雜性都決定辯方單方面的閱卷行為難以滿足其辯護需求,需要控方為其提供相應技術協助義務?？胤匠讼蜣q方出示相關案件材料外,更要求其應當以辯方可以理解的程度向其出示,避免辯方有閱卷之形而無閱卷之實。

(二)反駁性檢驗機制受阻降低有效辯護的可能性

反駁性檢驗機制強調形成判決基礎的信息能夠得到控辯雙方的相互檢驗[13]。該機制的實現不僅依賴于有效辯護的存在,而且反過來促進有效辯護的發揮。其包括兩項內容:質證權和取證權。質證權包括控辯雙方面對面質證和交叉詢問兩部分。取證權包括調查并提交有利于被指控主體的證據。在法庭庭審中,質證一直以來作為司法證明的重要環節而存在。例如,最高人民法院在司法解釋中明確規定證據未經當庭出示、辨認、質證等法庭調查程序查證屬實,不得作為定案的根據。然而,質證的權利屬性長期以來并無相應的規范性法律文件進行規定,導致辯方在申請證人作證等方面存在困難。直至2021年《新刑訴法解釋》頒布,質證權才作為一項明確的訴訟權利存在。取證權和質證權相互依存,共同保障有效辯護的順利進行。大數據證據的運用對傳統意義上的反駁性檢驗機制產生了重大沖擊。在質證權方面,主要有以下表現。

第一,大數據證據交叉詢問規則的缺失。事實上,交叉詢問作為質證的基本方式之一,主要目的是控辯雙方按照相應順序對證人進行發問或對證人證言的真實性進行質疑,以發現其漏洞或瑕疵,從而降低證人證言的證明力。大數據證據遵循與專家證人意見證據相同的證明機理[14]。一方面,大數據證據是算法在海量數據基礎上對其進行分析、對比等深度加工而形成的證據,無論是數據的獲取、固定還是算法模型都需借助專業知識完成,其類似于專家證人證言。換句話說,大數據證據可以看作是程序代碼生成的新型專家證據[15]。另一方面,在司法實踐中,大數據證據也通常以大數據分析報告的形式出現,可以看作是大數據的鑒定意見,明顯具有專家證人證言的特征。根據我國相關法律規定,辯護人可以對證人、鑒定人發問,可以申請法庭通知有專門知識的人出庭,就鑒定人做出的鑒定意見提出意見。由此可見,大數據證據也應當接受交叉詢問。但我國法律對交叉詢問規則規定得過于原則和簡單,且控辯雙方采用交叉詢問方法調查證人證言的情形并不多見[16],交叉詢問規則不夠完善。此外,針對大數據證據存在專業性、復雜性等特點,辯方缺乏相應有針對性的詢問技巧,大多采取直接詢問而非間接詢問的方法,導致對大數據證據的詢問更多關注其形式合法性,欠缺對其實質內容的詢問,包括數據源、算法運作的合理性等,難以發現其瑕疵或缺陷。

第二,大數據證據的證明邏輯導致辯方質證不能。與傳統證明側重邏輯上的因果關系不同,大數據證據的運用強調相關性,其將因果關系數據化,因果關系演變為變量之間的數理關系[17],主要體現為數據之間的相關,是一種概率意義上的推斷。需要明確的是,相關性不等于因果性。相關性是統計學上的概念,側重兩個或多個變量的關聯程度。因果關系是邏輯學上的概念,指原因引發結果,強調邏輯上的先后性。不可否認,大數據證據對待證事實有證明作用,其相關性符合證據的基本屬性要求,可以作為證據在庭審中運用。需要考慮的是,一方面,大數據證據中的相關關系是建立在海量數據基礎上的概率分析,并非所有數據都與待證事實存在相關關系,可能存在“偽相關”關系,表現為兩個相關變量出于巧合或者第三個變量的影響而沒有直接因果關系。正如上述所提及的,這一模糊性與“事實清楚,證據確實充分”的證明標準相沖突。在因果性證明邏輯中,辯方只需推翻行為與結果不具備直接性的前后關系即可,這一時序性和確定性通常是辯方推翻某一證據的質證重點,然而,相關性證明邏輯造成辯方難以發現并否定大數據證據對待證事實的相關性,引起實質上的質證不能。

第三,“證據轉化”現象剝奪了辯方抗辯的權利?！白C據轉化”規則是在當前司法實務中處理證據能力的規則,指的是偵查機關采取不符合法律規定的手段獲取的證據轉換為合法證據而使用的規則[18]。目前法律規范并未對大數據證據的審查判斷規則予以明確規定,可能存在相應機關將大數據證據轉換為其他證據種類以逃避審判對大數據證據的合法性審查。例如,偵查機關通過大數據分析手段,挖掘、對比相關信息數據從而發現犯罪嫌疑人從事網絡犯罪的證據,為避免其取證行為是否合法的爭議,偵查人員往往向犯罪嫌疑人出示證據以獲取其有罪口供,從而實現證據轉化[19]?！白C據轉化”規則是對非法取證行為的掩蓋,大大增加了冤假錯案發生的可能性。更為重要的是,辯方無從得知證據轉化前所存在的證據來源、取證手段是否合法,等同于直接剝奪其質證的權利。

在取證權方面的主要表現有以下兩點。第一,第三方協助義務缺位導致辯方自行取證不能。與傳統證據相比,大數據證據具有數據體量大、技術性強等特點,需要偵查機關調取、處理大量數據信息,這其中除了偵查機關內部的數據庫之外,大量數據由網絡平臺等第三方占有或控制,因此,相關法律規定第三方平臺有為相應國家機關提供技術協助的義務。例如,根據《網絡安全法》第28條的規定:“網絡運營者應當為公安機關、國家安全機關依法維護國家安全和偵查犯罪的活動提供技術支持和協助”。實際上,辯護律師受制于大數據證據復雜性、專業性等特點,自行調查取證往往需要借助第三方平臺的信息協助。與此相對的是,相關法律條文盡管規定辯護律師有自行調查取證的權利,但并無明確規定第三方具有為辯護律師提供技術協助的義務。這就導致第三方存在以保護通信秘密、個人隱私等為由拒絕向辯護律師提供相關數據等情況,導致辯方自行取證不能。

第二,取證必要性的審查導致辯方申請代為取證不能。辯護律師除了可以自行調查取證之外,更多依靠申請相應機關代為取證的方法。根據《刑事訴訟法》第43條:“辯護律師可以申請人民檢察院、人民法院收集、調取證據?！钡?最終仍然要由人民檢察院、人民法院決定是否有取證必要,實踐中存在辦案機關以辦案時間緊張、與本案無關等理由拒絕代為取證的情況,對于相應機關拒絕取證的情形,辯護律師并無相應的救濟權,導致辯方取證權利受阻。此外,辦案機關對于取證必要性的考察可能引起程序延遲,造成數據難以及時提取和保存,客觀上阻礙了辯方取證。

(三)大數據證據的技術障礙增加了有效辯護難度

與其他證據類型不同,算法的科學性和準確性事關大數據證據本身的證據能力。通常觀念認為算法決策的準確性遠遠大于人類的決策,大數據證據具有天然的可靠性。然而,事實并非如此,大數據證據的算法運作引發“算法黑箱”是不可知的,“算法黑箱”所具有的不透明性為“算法歧視”披上了合理的技術外衣,導致歧視行為難以被辯方發現,而“算法失靈”所帶來的數據誤差更是加劇了大數據證據的事實認定錯誤風險?？傊?“算法黑箱”“算法歧視”和“算法失靈”這一系列問題直接影響控辯平衡,導致辯方在算法誤差和模糊性的前提下,難以對大數據證據的真實性和合法性進行質證,增大了辯方進行有效辯護的難度。主要表現為以下三個方面。

第一,算法黑箱。算法黑箱包括技術層面的“算法黑箱”及程序層面的“算法黑箱”[20]。具體而言,在技術層面上,大數據證據包括原始數據、算法運作、結論輸入這三個環節。但其所依據的海量數據庫本身并不存在“黑箱”,存在“黑箱”的是在算法對海量數據進行分析、對比、碰撞的這一過程。例如,在“李某等非法吸收公眾存款案”中,辯方并不清楚算法是如何對數據庫中的原始數據進行分析進而得出“e租寶”的實際控制者及非法獲利情況。算法透明是保障辯方知情權和正當程序權利的必要前提,算法如果不透明,辯方往往容易對大數據證據本身的合理性和正當性產生懷疑,然而“算法黑箱”的存在又導致辯方質證不能,這一惡性循環嚴重壓縮有效辯護空間。在程序層面表現為辯方申請算法公開與保護商業秘密之間的沖突,這一程序“黑箱”反過來加重了算法的隱蔽性。例如,在“人民訴查布斯(People v. Chubbs)”這一案件中,法院駁回被告的算法開示請求以保護商業秘密,該案件也成為美國刑事案件中法官肯定商業秘密特免權的首例[21]。盡管我國刑事司法實踐并沒有保護商業秘密的規定,但是控方通過將大數據證據轉化為證人證言、電子證據等,或是通過出示鑒定意見的方式,直接剝奪了辯方請求算法公示的權利。因此,無論是算法技術本身還是算法決策程序所存在的“黑箱”問題,其實質都是對公開透明程序的違反。

第二,算法歧視。算法決策是建立在原始數據基礎上的核心運作機制。算法歧視大致分為三類:一是算法設計者有意或無意將個人偏見植入算法系統所引起的;二是算法學習過程中的數據偏差多引起的;三是外部因素干擾算法運行所引起的[22]。首先,算法系統是由商業公司等第三方主體所研發的,由于設計者文化背景、接受教育程度、思維模式和觀念等存在不同,其研發的算法系統不可避免地帶有個人偏見色彩。其次,算法本身是可以學習的,包括自主式學習或半自主式學習。然而,無論是自主式學習或半自主式學習,如果算法所依據的數據不準確,會造成算法決策出現偏差,產生“算法歧視”。最后,算法的外部干預包括程序不規范、外部隱形權力等導致“算法歧視”產生。

第三,算法失真。主要表現為算法具有自主學習性,其會對數據進行再加工,引發原始數據、圖像等失真的現象[23]。例如,AI軟件對照片進行加工導致其準確性降低[24],這一現象造成大數據證據本身的穩定性和準確性不足,也加劇了辯護困境。

三、大數據證據運用中有效辯護困境的化解路徑

(一)有效辯護的前提:增加控方數據開示義務

與傳統證據不同,大數據證據專業性、衍生性等特點加大了辯方閱卷權行使的難度,如閱卷范圍狹窄、閱卷效果不受保障等。為此,有必要在閱卷權基礎上增加控方的大數據證據開示義務,以保障辯方充分享有大數據證據的知情權,使有效辯護落在實處。需要指出的是,證據開示義務的重點體現在兩方面:一是擴大閱卷范圍,妥善處理閱卷權與保護商業秘密、個人隱私的關系,實現辯方全面閱卷;二是保障閱卷效果,控方應積極履行協助義務,實現辯方有效閱卷。

第一,針對閱卷范圍這一問題,一是對大數據證據涉及被追訴人人身權、財產權等權利的,控方應當承擔相應的公示義務,公示內容包括大數據證據所依據的原始數據和算法決策。對于其中存在的辯方閱卷受到商業秘密、個人隱私保護限制這一問題,應當妥善處理好不同主體的利益,要求控方在搜集海量數據時應當遵守正當程序,明確收集手段和方式并詳細記載在相關材料中,盡可能避免造成個人隱私泄露,為辯方閱卷提供便利。必要時可以通過簽署協議等方式,要求辯方履行保密義務,對于辯方利用商業秘密、個人隱私進行非法活動的行為,予以刑事處罰。二是應當確立“數字無罪”理念,其主要目的在于發掘數據和算法有利于被追訴人的證明作用[25]。明確大數據證據所具有的雙重證明作用,需要控方針對可能有利于辯方的數據設計相應的判斷指標和規則[26],從而助力算法識別并生成有利于被追訴人的證據。相應地,網絡信息服務者等第三方平臺應當為有效辯護提供必要的協助,不能簡單以保護商業秘密、個人隱私為由拒絕辯護人行使權利。

第二,針對閱卷權難以保障閱卷效果的問題,需要控方積極協助辯方獲取、分析、運用相關證據。與閱卷權不同,履行證據開示義務的主體是控方,控方需積極、主動協助辯方完成有效閱卷。閱卷權的主體則是辯方,辯方有權查閱相關案卷和證據材料,但是控方并沒有協助的義務。因此,證據開示義務并不等同于閱卷權,證據開示義務是確保辯方精準、全面閱卷進而實現有效辯護的重要途徑之一。此外,控方應當為辯方提供相應的技術協助。面對專業性極強的大數據證據,辯方的知識和技能存在局限,控方應當負責為辯方申請專業人員輔助,幫助辯方準確全面地分析、解決相關證據運用問題。

(二)有效辯護的重點:合理改造辯方對大數據證據的質證和取證思路

傳統意義上辯護律師通過書面審查案卷筆錄和證據材料即可發現證據之間的矛盾和疑點。然而,傳統的辯護策略難以對大數據證據進行有效質證,交叉詢問的缺失和相關性的證明邏輯都表明對大數據證據的質證應當在傳統三性基礎上凸顯大數據證據的不同屬性,才能更好發揮其辯護效果。

第一,辯方對大數據證據的質證可以從真實性入手。一方面是完整性,即電子數據載體、基礎數據、算法、結論這四方面的內容全面、完整、準確,不存在惡意篡改或偽造情形。具體而言,辯方對其完整性質證可以從以下方面入手。其一是電子數據載體是否確保數據完整、準確,包括保管鏈條是否完整、是否出現破損或更換等情形;其二是輸出結論是否全面、完整、準確地揭示其與基礎數據的關系,根據基礎數據能否合理推導出結論等;其三是算法是否通過符合性校驗等;其四是基礎數據在收集、對比過程中是否存在偽造、誤差等情形,大數據與全數據的偏差是否屬于合理范圍等。此外,辯方還可以對基礎數據運行所產生的附屬信息進行質證,以判斷其完整性?；A數據生成的同時會產生關于該數據收集、存儲等行為相對應的時間、地點、設備名稱等,這些信息一般不受人的主觀因素影響[27],具有穩定性和可靠性,在辯方審查大數據證據的完整性和同一性中發揮積極作用。同時,辯方可以應用哈希值來進行電子數據和證據的電子簽名、文件一致性檢驗等以判斷其完整性。另一方面是科學性。大數據證據的科學性是決定其是否真實可靠的必要前提。辯方可以圍繞基礎數據分析是否具有可復現性進行質證。事實上,計算機對基礎數據進行的篩選、比對、加工等過程,本質上是按一定標準邏輯歸納數據的過程,其最終結果具有穩定性和可重復性[28]。因此,以大數據分析的整體過程是否可復現作為檢驗大數據分析結果的標準為辯方質證提供合理依據。此外,辯方還可以進行算法目的符合性校驗以判斷其科學性,無法通過該校驗的算法,表明其算法內部決策存在錯誤,即運用該算法的大數據證據不具有證據資格。

第二,辯方對大數據證據的質證還可從相關邏輯出發,論證其只能作為補強證據而存在。大數據證據中數據格式和標準多樣,沒有預定義的數據模型,這一非結構化特征決定了其難以按照傳統的關聯性標準對數據信息進行明確劃分,也就是說,大數據證據是建立在基礎數據之上的“二次加工”,根據關聯性原則,所有的基礎數據都是證據,都應當移送法庭,這一相關性證明邏輯與刑事訴訟的精確性等原則存在沖突,“可能產生以概率推斷替代事實推斷的隱憂”[29]。因此,大數據證據并不能獨立證明案件事實,可以通過其相關性補強其他證據的證明力,即通過大數據證據與待證事實的高概率性,強化其他證據的證明力。此外,辯方可以利用大數據證據的相關性證明邏輯轉變其辯護策略,即辯方僅需證明其存在合理懷疑,即可否認對被追訴人有罪或罪重的指控。

第三,有必要適用專家輔助人制度保障辯方有效質證。大數據證據以算法決策為核心,其專業性、復雜性是辯護律師有效辯護的實質障礙,這一技術上的不對等加劇了控辯雙方的不對等?！蹲罡叻ń忉尅返?00條規定:“因無鑒定機構,或者根據法律、司法解釋的規定,指派、聘請有專門知識的人就案件的專門性問題出具的報告,可以作為證據使用?！边@一規定為大數據證據質證引入專家輔助人制度提供了規范依據。其主要作用是補強辯方對大數據證據相關專業知識的欠缺,提高其有效辯護水平。其主要工作內容包括:輔助辯方對控方提出的大數據證據的算法決策進行相應說明和解釋,圍繞基礎數據、算法原理、相關結論的真實性、完整性、科學性與控方大數據證據的鑒定人員進行討論和辯論。需要明確的是,專家輔助人在法庭審理中不享有獨立的訴訟地位,其服務于申請主體一方。其參與法庭庭審所獲知的大數據證據涉及商業秘密、個人隱私的,應當履行保密義務。

此外,對于辦案機關存在的“證據轉化”問題,應當加強規范取證監督,保證辯方有效質證。一方面,應當加強對辦案機關大數據證據取證程序的合法性審查,包括證據來源、取證程序是否合法等。域外已經設立的技術偵查司法審查制度值得借鑒,即由中立的第三方主體對是否進行技術偵查進行事先審批[30]。同樣地,辦案機關對大數據證據的運用也可以適用第三方司法審查制度,保證其取證程序的合法。另一方面,辯方應當對辦案機關所提交的案卷筆錄和證據材料進行實質檢驗并綜合判斷,存在疑問的,可以申請有關的偵查人員出庭說明大數據證據收集的情況并做出相應解釋。

在保障辯方取證權方面,應當賦予控方調取有利于被追訴人的大數據證據的義務。一方面,控方如果獲得有利于被追訴人的大數據證據,應當立即調取并舉證。這一義務本質上是對控辯雙方取證能力差異的彌補和平衡,要求控方不得隱匿證據,也是訴訟真實和實體真實的體現。另一方面,控方應當為辯方獲取大數據證據提供必要的技術協助,對存在有利于被追訴人的證據,應當及時告知被追訴人的辯護律師,并為其證據提取、分析等提供幫助。辯方申請辦案機關調取大數據證據,控方無正當理由不應拒絕,必要時,可以申請法院調取相關證據。

(三)有效辯護的保障:賦予控方有限度的算法公開和算法解釋義務

需要明確的是,無論是“算法黑箱”“算法歧視”抑或是“算法失靈”,本質上都是算法監管的缺失,規制這一系列算法問題的關鍵是保持算法運作封閉性的同時,加強其與外部的相互溝通[31]。因此,算法公開是有效監管和規制算法的重要途徑。一方面,算法公開是保障大數據證據真實性、合法性的必要前提。另一方面,算法公開對確保辯方知情權并進行有效辯護具有重要意義。

第一,關于算法公開的內容。一是對于運用大數據證據證明被追訴人犯罪事實的,控方應當履行必要的告知義務。司法實踐中存在控方為逃避辯方對大數據證據的質證,將大數據證據轉化為書證、案件經過材料等進行應用,這一行為既違反了正當程序,也剝奪了辯方的知情權。二是算法公開包括算法所依據的數據庫、算法原理的公開,但是算法公開是有限度的,源代碼反映的是算法的技術水平,公開源代碼并不會增加辯方對算法的可信度,反而可能會引發黑客惡意攻擊系統等危險。例如,美國紐約市通過“1696法案”,規定了算法的源代碼應當予以公開并據此成立“算法問責特別工作組”。然而,商業公司強烈反對公開算法源代碼的行為,認為此舉嚴重損害其競爭優勢。最終立法者進行妥協,在法案中取消了對算法披露的要求[32]。因此,有學者主張公開源代碼并非唯一選擇,可以將參數權重、公式及理由解釋、結果告知等內容進行相應公開,以提高算法的透明度[33]。

第二,關于申請算法公示的主體。在控方履行告知義務的前提下,應當賦予辯方申請算法公開的權利。在刑事訴訟中,由于控方享有技術優勢和政策層面的支持,大數據證據多是以有罪證據的形式由控方出示以證明被追訴人有罪或罪重。因此,對于大數據證據可能涉及被追訴人定罪量刑的犯罪事實或者重大權利的,應當保障辯方對大數據證據內部算法決策的知情權。

第三,關于算法公示的保障。對于辯方申請算法公開而不予公開的,應當說明必要的不公開理由,如大數據證據對定罪量刑有重大影響、被追訴人及其辯護人有異議,而控方無正當理由拒絕公開的,一般應當排除相關的大數據證據。

除此之外,為確保算法公開,提高算法決策透明性,有必要在大數據證據應用中引入算法解釋權,由算法使用者即提供證據的控方承擔對大數據證據與犯罪事實之間的相關性證明邏輯進行解釋的義務,以達到緩和甚至克服算法自身技術局限所引發的黑箱和歧視風險的目的。具體而言,一是其主要目的在于通過對大數據證據內部算法模型、特定算法決策過程的解釋說明,在控辯雙方產生爭議時,確定并辨別大數據證據在相關性證明邏輯演繹下是否存在相應漏洞,進而維護大數據證據的證據能力和證明力。二是對于大數據證據內部算法決策的真實性和客觀性存在異議的,辯方有權要求提出證據的控方提供相應算法決策解釋。三是原則上算法使用者即提供大數據證據的控方承擔算法解釋義務,但由于大數據證據內部算法并非由其自行設計,控方可要求網絡服務提供者、保險公司等算法應用平臺及算法設計者承擔相應協助解釋義務,這有助于減少甚至消弭控辯雙方之間的數字能力差距,實現權力與權利之間的再平衡。四是關于算法解釋的標準和內容,歐盟《一般數據保護條例》第12條規定,算法控制者負有以“簡潔、透明、易懂、易獲取并清晰直白的語言”提供信息的義務[34]。具體在司法實踐中,控方應當以一般人能夠理解的自然語言向辯方做出解釋說明,包括大數據證據通過算法對海量數據的“二次發掘”、大數據證據與所要證明的犯罪事實的證明邏輯等。如果僅是向辯方提供復雜難懂的源代碼或算法工作原理,算法解釋權也就失去了實際意義。

四、結語

綜上,與傳統證據不同,大數據證據的專業性、衍生性、相關性等特點決定了其在刑事案件的應用勢必會對辯方閱卷權、質證權、取證權等傳統訴訟權利造成沖擊,而其算法運作過程的內在局限也會進一步加大了辯方進行有效辯護的難度。對此,有必要以加強辯方有效辯護為出發點,賦予控方相應數據開示義務和算法公開義務以保障辯方閱卷權和知情權,并對辯方質證思路進行調整和改造。本文僅僅是在分析大數據證據的有效辯護困境的基礎上,提出的一個初步的、概括的完善方案。未來如何使大數據證據自然而然地融入現有的辯護制度并發揮其獨特優勢,仍然需要司法實踐和理論研究進一步發展。