?

筆跡量化鑒定與統計學分析的研究綜述

2023-04-17 16:21李雙雙楊旭陳曉紅
中國司法鑒定 2023年6期
關鍵詞:筆跡特征筆跡離線

李雙雙,楊旭,陳曉紅

(1.華東政法大學刑事法學院,上海 200042; 2.司法鑒定科學研究院上海市司法鑒定專業技術服務平臺司法部司法鑒定重點實驗室,上海 200063; 3.南京警察學院刑事科學技術學院,江蘇南京 210023)

筆跡鑒定是司法鑒定領域和計算機領域的重要工作。 如今,筆跡鑒定檢驗人員仍然運用傳統的技術方法并根據相關經驗對筆跡的書寫人作出判斷。 關于筆跡鑒定有效性和可靠性的爭論由來已久,傳統上用來證明筆跡可變性和個性的基本原則受到了挑戰和批判[1-2]。 與此同時,基于計算機的筆跡鑒定系統開始了個體識別的研究,并嘗試在司法鑒定領域開展應用。 然而,目前計算機離線筆跡驗證系統是基于靜態(離線)二維圖像的測量,而圖像本身很容易被偽造,因此此類筆跡驗證系統判斷摹仿筆跡的能力較弱。 此外,這一領域的研究往往集中在缺乏規模和多樣性的數據集上,致使由此訓練出來的系統魯棒性不能滿足實踐應用需求。 以上這些缺點阻礙了計算機技術在筆跡鑒定中的應用。

隨著科技的快速發展,計算機圖像處理技術、光學、統計學等學科為筆跡特征量化研究提供了可利用的技術和方法,筆跡特征的統計分析能夠客觀反映筆跡檢驗結果,科學評估筆跡鑒定意見是筆跡鑒定的發展方向之一。 目前,筆跡量化鑒定與統計分析研究主要集中在計算機筆跡個體識別與筆跡鑒定兩個領域。 計算機筆跡個體識別系統主要可分為兩種類型:在線筆跡個體識別和離線筆跡個體識別,離線筆跡個體識別系統處理書寫完成的靜態圖像,而在線筆跡個體識別系統處理從采集硬件實時獲得的數據。 筆跡鑒定的任務與離線筆跡驗證最為接近。 本文針對筆跡特征量化、筆跡特征數據分析以及基于似然比模型評估筆跡鑒定意見準確性與可靠性的研究進行梳理和總結,并對筆跡量化鑒定與統計學分析研究在司法鑒定領域面臨的問題以及未來的發展方向進行討論。

1 筆跡特征量化方法

本文中筆跡特征的量化是指以測量的方法檢測筆跡,并以數據形式表示特征的大小和變化。

1.1 在線筆跡動態特征的量化

書寫時間、書寫速度與加速度、書寫壓力、執筆傾斜角度、字的大小、抬筆次數等是常用的在線筆跡動態特征,由數字化采集設備直接測量或計算得出。 為構建更能豐富反映書寫運動特點的特征集,研究人員進一步細化在線筆跡的運動學變量:在書寫速度與加速度分析中,由采樣點X/Y軸坐標計算得出線速度、線加速度、角速度與角加速度[3],由加速度的時間導數得出變加速度(也稱為“躍度”)[4];在分析書寫時間時,將書寫時間分為筆畫持續時間與空中時長[5],有研究人員還通過計算從零到峰值速度的時間與筆畫持續時間的比率來反映書寫運動效率[6]。 這些細化的運動學變量的數值與變化有助于分析書寫運動的具體情況。

在筆跡鑒定中,研究在線筆跡動態特征的一個重要目的是確認和驗證離線筆跡中基于形態特征預測的書寫運動。 可用的方法有建立在線筆跡動態特征數值與紙質筆跡靜態特征相對值的相關性[7-8],為分析紙質筆跡的動態變化提供依據。 HECKEROTH等[9]發現筆跡鑒定檢驗人員在電子簽名與紙質簽名中關于筆跡真實性的結論并不存在顯著差異,表明電子簽名在筆跡識別中是可行的。 雖然之后HECKEROTH 等[10]發現電子簽名和紙質簽名在簽名大小與書寫壓力上存在明顯差異,但這種影響受書寫區域與手寫筆的限制,因此這些不同并不代表書寫行為明顯不同。

1.2 離線筆跡特征的量化

離線筆跡特征的量化是通過分析來自掃描儀或數碼相機轉化形成的二維靜態圖像文件來實現的,過去多數研究關注離線筆跡的形態特征,多種多樣的量化方法已經或正在開展,可歸納為特征賦值與特征測量兩種。

1.2.1 特征賦值

在筆跡鑒定中,可用的離線筆跡形態特征多種多樣,概貌、布局、寫法、運筆等均是常見的形態特征,主要依據檢驗人員對特征的認知進行分類描述,并按照一定的標準對分類結果設定等級與賦值,用數字的大小來表達筆跡特征的表現程度,在一定意義上量化了筆跡特征數據,但這種特征賦值方法具有很強的主觀性,且分類標準因人而異,得到的特征數據不夠客觀。 于彬[11]提出在筆跡鑒定檢驗人員根據專業知識與經驗積累對筆跡特征賦值的基礎上,通過數據建模的方式求得每個筆跡特征指標的權重值并形成量化系統,以量化特征數值來增加賦值結果的可靠性,但此法仍無法有效排除人為因素的干擾。 特征賦值的方法一般用于無法測量的主觀感受或判斷,常用于社科類研究中,且具有一定的意義。 這種方法雖然表現為數值形式,但是實質上仍然是專家的經驗, 存在較大的主觀性,并未完全解決筆跡特征客觀量化的問題。

1.2.2 特征測量

運用幾何方法測量筆跡形態特征,是離線筆跡形態特征量化研究有所進步的表現。 衛燕茹等[12]手工測量了紙質上筆跡的布局、 字行方向等特征,為筆跡鑒定檢驗人員評判特征價值提供了較為客觀的依據,但人為測量偏差仍是一大難題。 借助儀器設備測量筆跡形態特征為筆跡鑒定的量化研究提供了科學方法,如在文檢儀下測量字符的長度與角度[13],再如測量筆跡圖像字符大小、字符間距[14]與筆畫長度[15]等宏觀筆跡特征,均是簡單快捷的形態特征量化方法。 但以上測量方法為手工測量,測量結果因人而異,基于此,研究人員考慮對筆跡圖像進行預處理,分析二值化的筆跡圖像,并進行自動化的特征測量。 MARQUIS 等[16]采用Visilog 1 Xpert 6.11 軟件自動提取二值化筆跡圖像中字母“O”的輪廓,用輪廓的點與質心間的長度以及該直線與橫軸的夾角來表示該點的輪廓特征向量,經傅里葉分析后用于精確描述字母的外形特征;此后,該團隊[17]還對字母“a、d、o、q”的形狀進行分析,為多變量統計模型提供了測量數據。 王相臣等[18]借助Matlab 軟件測量二值化筆跡圖像中字與字之間的質心距離來確定字間距數據,實現了字間距特征的量化。秦曄[19]使用計算機技術自動標記筆跡的字符布局特征、字符間分布特征、字符形狀特征等,并通過軟件程序量化標記的特征數據,這是探索筆跡智能化檢驗的路徑,但受限于圖像處理的標準化水平與筆跡特征數據庫的規模,在實踐中尚不足以承擔鑒定任務的應用。

此外,從立體空間角度來看,筆跡是三維的,筆痕深度是筆尖作用于紙張使之變形的程度,反映了筆力輕重。 利用精密儀器觀測筆畫壓痕,結合計算機技術獲取筆畫各采樣點的壓痕深度值,也是離線筆跡圖像特征的一種量化方法。 研究人員通過大量的實驗,探索了筆跡三維信息提取分析儀檢測獲取的筆畫壓痕在區分摹仿簽名筆跡與摹本簽名筆跡書寫壓力特征[20]、認識書寫紙張與襯墊條件變化對簽名筆跡壓痕影響[21]、分析速度變化筆跡書寫壓力變化規律[22]、比較同一人運動前后簽名筆跡與臨摹簽名筆跡差異[23]等中具有可行性,為輔助筆跡檢驗提供了客觀依據;但該技術的掃描系統靈敏度高,測量精度達微米級,實驗中對書寫材料有著嚴格要求,若紙張褶皺,觀測的筆畫壓痕數據可能存在偏差。 一些筆跡三維形貌測量儀器也可以測量、分析筆畫各采樣點的凹痕深度數據[24]和筆畫的角度、寬度[25],這些儀器與方法為筆跡檢驗提供了更多維度、更為多樣化的特征信息,是對現有筆跡鑒定特征體系的一種有益補充。

1.3 離線筆跡偽動態特征的量化

筆跡的形成是一個物理過程,書寫運動中作用力、書寫速度與加速度等物理量的大小和變化是筆跡形成過程中運動變化狀態的表現[3,26],即壓力與速度的作用形成了筆跡動態特征的具體征象。 從離線筆跡圖像中挖掘筆跡動態信息是筆跡鑒定研究的新角度,但由于其最終以靜態圖像的形式呈現出來,無法實時獲取壓力與速度信息,實踐中多從墨跡濃淡、筆畫粗細、筆畫線條質量、連筆多寡以及紙張正面與背面的凹凸程度等方面定性推斷書寫壓力與書寫速度的變化[26-29],為初步認識并預測筆跡動態信息積累了經驗。 但這些方法更多的是基于主觀經驗判斷,檢驗結果易受筆跡鑒定檢驗人員視覺感知與主觀認知的影響,若筆跡鑒定檢驗人員能力不足或認知存在偏見,所得結果的可靠性將大打折扣。

開發和建立檢測、提取離線筆跡動態信息的工具與方法是筆跡鑒定的迫切需要,是筆跡鑒定從定性分析向定量測量逐漸轉變的關鍵階段。 在近期的研究中,研究人員提出了“相對動態特征”的概念,即在靜態筆跡圖像中恢復筆跡的書寫軌跡,并按照書寫軌跡的順序獲取筆畫寬度、灰度、弧度等信息。因為其與在線筆跡的動態特征不同,不是實時提取的信息,但是反映相對的書寫順序,所以稱為相對動態特征[3]。 為了區別于在線筆跡的動態特征,也有研究人員將這類特征稱為“偽動態特征”,從靜態筆跡圖像的灰度級、筆畫寬度、運筆走勢等方面恢復書寫時的運動信息,在計算機筆跡個體識別中使用較多[30-33]。

1988 年,AMMAR 等[34]將簽名圖像的灰度信息作為一種偽動態特征用于離線簽名鑒定,需要注意的是,這里所提到的偽動態特征是二維圖像的灰度變化分布,有別于上文所提到的“偽動態特征”。 也有研究借助文檢儀捕獲簽字筆油墨對紅外光的吸收反射圖,利用灰度分析量化筆畫的灰度,但書寫壓力所致的灰度值變化的區分度并不明顯[35]。 周鵬等[36]提出精確定位簽名筆跡立體形態特征區域的特征提取算法,以區分不同區域筆跡的灰度差異。

基于書寫機理與書寫經驗可知,書寫壓力、書寫速度影響筆畫的粗細,在一定程度上筆畫的寬度反映了書寫的動態信息,是離線筆跡特征的另一重要內容。 但受不同書寫工具等因素影響,形成筆畫的寬度本身就不一樣,因此單純的筆畫寬度值無法真正反映書寫習慣,而利用筆畫寬度斜度[30]、筆畫寬度變化率[32]可間接反映書寫速度/加速度特征。筆畫弧度反映了運筆走勢與方向特征,運筆走勢與方向的變化必定引發書寫速度的改變,故筆畫弧度是認識書寫速度的一個重要參考依據。 研究人員多從筆畫行筆[37]或端點[32,38-39]兩個方面認識書寫時的動態變化,得到反映筆畫動態變化的特征向量,這在計算機筆跡個體識別中研究較為常見。 以筆畫為研究對象的筆跡特征提取方法不依賴于文本,只要兩份筆跡包含相同筆畫就可適用;但若樣本字數太少,可利用的筆畫不多,將不利于發現真實的特征。

總體來看,目前基于筆畫灰度、寬度、弧度提取離線筆跡特征的研究取得了一定的進展,但在對特征數據的統計學分析方面仍然有待加強,需要進一步構建筆跡特征量化比較分析的方法體系。 此外,目前這些研究多處于實驗階段,這是由于筆畫灰度、寬度、弧度是一種精細信息,實驗研究設置的條件十分理想化,使用的承受紙張基本是平整干凈的。而實際筆跡鑒定工作中遇到的紙張可能發生污損、折疊等變化,其承載的筆跡動態信息也必然發生變化,實驗所得結果與規律是否可用于實際工作仍有待進一步的探究。 但筆跡的量化鑒定不能始終停留在實驗研究中,走向實踐是其最終目標,將實驗研究向實踐應用研究發展,提高方法的使用效率,這應是今后研究人員與檢驗人員共同思考、相互合作的現實問題。

2 筆跡特征數據分析方法

2.1 描述性統計

2.1.1 頻數分析

“頻數”又稱為“次數”,在筆跡檢驗中,頻數分析是對某種筆跡特征出現次數進行的研究,以查看特征的基本分布情況,是一種常見的特征統計分析方法。 頻數與總數的比值為頻率,頻率反映了該特征對總體水平的作用程度,用于量化筆跡特征的價值,在離線筆跡形態特征分析中應用普遍[40-42]。研究人員還注重特征組合在筆跡檢驗中的作用,將多個單一特征的出現頻率相乘得到特征組合的出現率,以反映書寫習慣的特定性[43],相較于單一特征的頻數分析,組合特征的頻數分析結果說服性更強,但各特征是否具有獨立性尚未明確。 頻數分析為初步分析筆跡特征提供了數據基礎,筆跡樣本的充分性、代表性影響分析結果的準確性,若研究中筆跡樣本數量不足、代表性不強,所得結果可能存在誤差,建立充足的人群筆跡特征數據庫是一種有效的解決方法。

此外,特征出現頻率在DNA 證據研究中有非常廣泛的應用,這是基于DNA 生物模型的理論已經非常明確和成熟,不同基因座之間是獨立的。 由于筆跡特征之間并非是統計學意義上的獨立變量,恰恰相反,很多傳統形態學證據,如筆跡、指印等,特征變量之間往往是相關的。 因此,在筆跡鑒定中,僅僅評估特征的出現頻率可能并不能發揮非常強大的作用。

2.1.2 統計量的計算

在筆跡特征分析中,經儀器設備或計算機技術采集的原始數據是筆畫中各采樣點的信息,數據龐大且繁雜,而筆跡檢驗是對組合字(如簽名)、單字、偏旁部首、筆畫的具體征象進行分析與比較,為快速獲取有價值的信息,需用簡潔的統計量來描述龐雜的特征數據,常用的統計量有均值、標準差、方差、極差、最值、變異系數等。 特征均值用于分析書寫運動的整體情況[5,20-24,36,44];標準差用以描述某具體特征數值與均值的標準距離, 以衡量均值的代表性,是常用的統計量[5,23,36],其次是方差[22]、極差[24]、最值[24];變異系數因消除了均值不同和度量單位不同對多組數據比較的影響,比較結果更為客觀,目前在筆跡檢驗中逐漸得到關注與應用,多用以分析同一人書寫筆跡的穩定性[44]與不同人書寫筆跡的變異性[4],但其缺點是若均值接近于零,微小的波動也會對變異系數造成巨大影響,造成精確度不準等問題。 因此,分析筆跡特征時,應根據特征數據的具體情況選擇相適應的統計量。

2.2 相關性分析

筆跡鑒定中相關性分析有兩個目的:一是確定兩份或多份筆跡的相似程度,二是分析書寫因素與筆跡特征的相關關系。 前者的變量為筆跡特征數據,后者的變量有筆跡特征數據、書寫因素,其中筆跡特征數據在統計分析中是一種數值變量,書寫因素則是分類變量。 在筆跡鑒定中,常用于表述筆跡相關性的方法有相關系數的計算、相似性度量。

2.2.1 相關系數的計算

相關系數是用以度量變量之間相關程度的統計指標,Pearson 相關系數、Spearman 相關系數、Kendall 相關系數是三種常用的相關系數。 Pearson相關系數在筆跡特征的統計分析中使用較多,用于比較兩份筆跡的穩定性與變化性[4,44],進而分析筆跡的相關性。 實驗研究筆跡特征時,為保證結果的可靠性,通常會收集大量筆跡樣本,兩兩計算得到的相關系數十分龐大,為簡化數據、選擇有效的相關系數,有研究[45]選取相關系數最大值作為待檢驗樣本與參考樣本之間的相關系數,有研究[24]則使用平均相關系數來量化書寫人與某一書寫條件下筆跡特征的相關性,兩種選擇均具有合理性。 雖然使用Spearman 相關系數、Kendall 相關系數分析筆跡相關性的研究尚不普及,但因其通用性強,應逐漸得到筆跡鑒定檢驗人員的關注。

2.2.2 相似性度量

將筆跡特征視為特征向量,每個特征下有多種具體表現,作為特征向量中的維度,在樣本筆跡較少的情況下,以某特征來確定兩份筆跡相關性時,可以通過計算兩個N維特征向量的距離來實現。兩份筆跡之間的測量距離越大,是同一人書寫的可能性越??;反之,距離越近,越有可能來自同一書寫人,通常認為與參考筆跡距離最小的待檢驗樣本是同一人書寫,這就是筆跡的相似性度量。 目前此法在計算機筆跡個體識別中應用普遍。

距離度量方式是鑒別筆跡相似性準確率的重要影響因素,常用的度量方式有歐式距離、曼哈頓距離、卡方距離、余弦距離。 歐式距離是最簡單的距離度量方法,即兩點間的實際直線距離,在低維的筆跡特征數據中其適用效果較好[37,46]。 曼哈頓距離與卡方距離的鑒別率與采用的特征有關[47],在沈潔等[48]的研究中,曼哈頓距離比歐式距離獲得更好的鑒別率;而在古孜麗塔吉·乃拜[49]的研究中,卡方距離是鑒別率最好的距離度量方法。 余弦距離通過計算兩個特征向量方向夾角的余弦值來衡量兩份筆跡的差異大小,更加強調方向上的差異性,在高維的筆跡特征數據距離度量中應用頻繁[39,50]。 此外,因馬氏距離考慮了筆跡特征之間的聯系程度與差異性,在計算機筆跡個體識別中也具有較好的鑒別率[51-52]。

在筆跡特征數據較多的情況下,不同維度的特征出現率不同,這時需要考慮筆跡特征之間的差異,通過對特征數值賦予不同權重可以改進計算方法。 研究表明,使用加權的距離度量方式比使用不加權距離度量方式的鑒別效果更好[53-54],即加權距離度量可以提高筆跡鑒別的正確率。

2.3 差異顯著性檢驗

在筆跡鑒定中,利用統計學方法驗證不同筆跡之間的特征是否存在顯著差異,實質上是判斷筆跡差異是抽樣誤差引起的還是本質差別造成的,這是進行筆跡鑒別的依據。在不同情形下形成的筆跡,其筆跡特征只有存在顯著差異時,才能據此進行筆跡判別。t檢驗與方差分析是常用的差異顯著性檢驗方法,目前在筆跡特征數據分析中已逐漸得到應用。

2.3.1t檢驗

t檢驗用來驗證兩類筆跡中特征均值是否存在顯著差異,包括單樣本t檢驗、獨立樣本t檢驗、配對樣本t檢驗。 單樣本t檢驗比較樣本均值與總體均值之間的差異,通常用于判斷所選筆跡樣本是否具有代表性;獨立樣本t檢驗判斷從兩個不同總體中抽取的兩個樣本的均值是否存在顯著差異,是組間差異分析的一種方法,多用于比較分析不同身體狀態或精神狀態對筆跡變異的影響[55-57];配對樣本t檢驗的樣本數據是通過觀測相同人群兩次得到的,是組內差異分析的一種方法,通常用于判斷同一人在不同條件下書寫的筆跡是否具有明顯差異。

目前,研究人員更多關注某一書寫因素變化對筆跡特征的影響是否存在顯著差異,因此配對樣本t檢驗在筆跡鑒定中應用較多,用于分析不同時間書寫的筆跡[58]、患病前后形成的筆跡[59-61]是否存在明顯變化。使用配對樣本t檢驗時,特征指標多為兩組數據的均值差,通常通過與數值零對比,來分析書寫因素變化對筆跡特征的影響。

使用t檢驗的前提條件是數據符合正態分布,而并非所有的筆跡特征數據都符合正態分布。Wilcoxon 帶符號秩檢驗也是均值差異檢驗方法之一,黃飛騰[44]在分析坐姿與站姿筆跡的書寫時長、書寫速度、平均壓力差異時,因數據不滿足正態性,便通過Wilcoxon 帶符號秩檢驗來判斷改變書寫姿勢對筆跡動態特征的影響。 因此,分析筆跡特征數據差異性時,應根據數據的分布情況來選擇合適的檢驗方法。

2.3.2 方差分析

當比較三組或三組以上筆跡的特征均值是否具有顯著差異性時,需要使用方差分析,包括單因素方差分析、雙因素方差分析、多因素方差分析。 單因素方差分析可以比較一種書寫因素變化對多組筆跡特征數值的影響,而雙因素方差分析可比較兩種因素變化的影響,多因素方差分析則可比較三個及以上書寫因素變化的影響。

單因素方差分析要求多組筆跡樣本之間控制其他不相關書寫因素,保證沒有其他因素對結果產生影響,以準確檢驗不同組別筆跡的顯著性差異,在實驗研究中使用較多[62-65]。 而實際上筆跡通常會受到多個因素影響,雙因素方差分析與多因素方差分析在判斷多個因素對筆跡特征數據的影響時,可進一步分析究竟幾個因素產生了顯著影響、是否為幾個因素之間的交互作用對筆跡特征數據產生了顯著影響。 如SLAVIN 等[6]通過雙因素方差分析考察了書寫人的年齡、書寫時的視覺條件對在線筆跡動態特征的影響,發現兩種書寫因素變化在筆跡動態特征中存在交互作用,老年人書寫筆跡時更依賴外部視覺刺激;類似的,還有MOHAMMED 等[66]判斷簽名風格與簽名行為對筆跡動態特征的影響。 可見,雙因素方差分析與多因素方差分析在筆跡特征數據差異性分析中更普遍、更實用。

總體來看,描述性統計因原理簡單、計算方便,在筆跡特征統計分析中應用普遍,在實踐中也常作為一種參考依據。 而相關性分析與差異顯著性檢驗多用于分析在線筆跡動態特征,離線筆跡中使用較少,且尚未應用于實踐。 實際上相關性分析與差異顯著性檢驗在筆跡特征的統計分析中更具現實意義,是筆跡鑒定走向科學的有效依據,這需要加強筆跡鑒定量化的實踐探索,更需要研究人員將實踐探索轉化為實踐運用。

3 筆跡證據價值評估

3.1 似然比模型概述

基于筆跡特征量化與分析得到的鑒定意見的準確程度與可靠程度需經科學評估才有可能用于實踐,一種方法是利用似然比(likelihood ratio,LR)模型評價筆跡鑒定意見。 從21 世紀初,國外法庭科學便展開了將LR 模型用于筆跡鑒定的研究[67-68]。在筆跡鑒定中,LR 是認定檢材筆跡與樣本筆跡為同一人書寫的概率(控方假設)與否定同一的概率(辯方假設)的比值,其中分子量化了檢材筆跡與樣本筆跡的相似程度,分母量化了檢材筆跡與樣本筆跡在人群中分布的典型性[69]。 傳統筆跡檢驗方法多偏重筆跡特征的相似性,忽略了特征的典型性,對于兩份筆跡,如果發現不了其筆跡特征明顯不同,通常即認為是同一人書寫,方法存在一定的缺陷,得到的鑒定意見容易引起質疑。 基于LR 模型得到的數值用來客觀評估筆跡特征對鑒定意見的相對支持強度,評估方法更有邏輯性,有助于化解筆跡鑒定意見科學性不足的問題。

LR 模型可分為評分LR 與基于特征的LR。 在筆跡鑒定中,評分LR 是基于檢材筆跡與樣本筆跡的相似性度量值來計算LR,將多變量特征減少為單變量特征,實現了數據降維,減少了運算量;特征LR 則直接將概率分配給多變量特征來計算LR,保留更多筆跡信息,但操作復雜。 目前,評分LR 方法因具有數據降維與模型簡單的優勢,在評估司法鑒定證據中普遍存在[67,70-71],筆跡證據價值評估也多為此法。

3.2 LR 模型的計算方法

利用LR 評估筆跡鑒定意見時,筆跡鑒定檢驗人員的任務是計算LR 值,LR 中分子與分母的概率值源于筆跡樣本數據庫和LR 統計模型,主觀賦值法[72]、特征頻率統計法[73]、多變量LR 模型法[16,74]是三種常用的統計計算方法。 無論LR 是否基于數據庫來分配,主觀賦值法都可以量化LR 的分子與分母,該方法具有很強的主觀色彩,MORRISON 等[75]認為對于主觀判斷生成的LR 的分子與分母,必須經過校準與檢驗來減少認知偏差的可能性,LR 的取值應以相關數據、定量測量與統計模型為依據。特征頻率統計法與多變量LR 模型法基于大規模的數據進行訓練與驗證,得到的LR 評估方法更具合理性與適用性。 在筆跡鑒定中,特征頻率統計法通常假定筆跡特征是獨立的,減少了待估參數的個數,實際上筆跡特征之間存在某些相關性,這意味著單變量特征不足以用于證據評估,可能會產生極端的證據價值,為了更好地評估證據,有必要進行多變量數據評估[76]。TARONI 等[77]使用多變量LR 模型法計算LR 值時,發現相較于單變量LR 模型,前者在女性群體中正確分類率上升,這是因為多變量LR 模型考慮了更復雜、更詳細的字符輪廓形態特征。LINDEN 等[68]認為多變量LR 模型應考慮同源與非同源變異性的不同建模,以減少較差背景數據對模型性能的影響。 此外,MARQUIS 等[16]通過多變量數據設計LR 模型時,還計算了對數似然比(loglikelihood ratio,LLR),根據LLR 的正負指向性表示對筆跡鑒定意見支持性,這也是評估筆跡鑒定意見的一種科學方法。

3.3 LR 模型的性能評估

基于LR 模型評估筆跡鑒定意見時,LR 模型系統的性能決定了檢驗結果的準確性,因此有必要對系統性能進行評估,常見的性能評估指標有CLLR(LLR 消耗)、RME(rate of misleading evidence,證據誤導率)、EER(equal error rate,等錯誤率)。CLLR是準確性的主要指標,可分為CcalLLR、CminLLR,CcalLLR用于判斷證據的標準化程度,是判別能力的指標[78];RME 用于表示精確度[76],CminLLR可分為RMED(支持辯方假設的錯誤率)、RMEP(支持控方假設的錯誤率),通過計算RMED、RMEP 可得知所使用鑒定方法的錯誤率,這是評估筆跡證據不可缺少的指標[68,71,76],因為多伯特(Daubert)準則要求鑒定人在出具鑒定意見時報告鑒定方法的錯誤率[79],以保證結果是準確可靠的。 EER 是判別能力的主要指標,是錯誤認定率和錯誤否定率相等時的錯誤率,EER 值越小,系統性能越好。 此外,研究人員常結合圖形來評價LR 模型的計算結果,常見圖形有直方圖、Tippett 圖、DET圖、ECE 圖,前三種圖形均可反映LR 模型的識別力,ECE 圖則可反映LR 模型的識別力與區分力[80]。

目前,基于LR 模型的筆跡自動識別系統的驗證已存在部分成果。 CHEN 等[78]基于LR 模型建立筆跡自動識別系統,在使用偽動態特征區分Sig-Comp2011 中簽名筆跡真偽時,結果顯示該系統相較于其他參賽系統更具識別力,證據誤導率更低,這表明利用LR 模型評估筆跡鑒定意見具有較好的可行性。但應注意的是,基于LR 模型評估筆跡鑒定證據時,樣本數據庫與特征統計數據會影響系統的性能[16,76]。下一步應不斷擴大筆跡樣本數據庫以及筆跡特征的種類與數量,以增強LR 模型系統的有效性與可靠性。

4 結語

當前,國內外筆跡量化鑒定和統計學分析的研究主要圍繞以下幾個方面:筆跡特征量化為筆跡鑒定提供了客觀的數據支撐,統計學分析為筆跡鑒定提供科學系統的方法,基于貝葉斯框架的證據價值評估有助于科學表達證據的不確定度。 目前,國內外筆跡鑒定實踐主要依靠專家經驗判斷,筆跡量化鑒定的研究雖然取得了豐碩成果,但這僅僅是個開始,要將科學研究應用于法庭科學實踐,學者和科研人員仍需付出更多的努力。 首先,科學研究需要不斷接受真實數據的檢驗,并對系統進行完善和修正,特征選擇影響模型性能,選擇特定的、有效的筆跡特征尤為重要,這在很大程度上需要一個具有代表性的數據庫,因此建立多樣化、普適的筆跡樣本數據庫是未來研究的一個重點;其次,拓展認識筆跡特征的途徑,挖掘筆跡的動態與靜態信息,需要依靠科學技術充分提取可靠的、客觀的數據,這是筆跡鑒定檢驗人員與科研人員需要考慮的現實問題;最后,量化、分析筆跡特征并評估筆跡證據的技術與方法涉及龐大的學科知識體系,研究人員需要熟悉多學科交叉研究工具和方法,這對筆跡鑒定檢驗人員也提出了更高的要求,如何讓筆跡鑒定檢驗人員信任、熟悉新的方法和手段,也是新技術在筆跡鑒定應用中需要著手解決的問題。

猜你喜歡
筆跡特征筆跡離線
異步電機離線參數辨識方法
呼吸閥離線檢驗工藝與評定探討
巧克力能否去除桌上的油性筆筆跡
淺談ATC離線基礎數據的準備
離線富集-HPLC法同時測定氨咖黃敏膠囊中5種合成色素
阿拉伯數字筆跡鑒定之探究
筆跡泄露大秘密
淺談簽名筆跡的檢驗要點
筆跡不說謊
筆跡鑒定過程中的心理偏差及其控制
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合