?

異源虹膜塊狀特征相似性統計

2023-02-21 13:17張翌陽唐云祁陳子龍
刑事技術 2023年1期
關鍵詞:塊狀虹膜形狀

張翌陽,唐云祁,陳子龍,苗 迪

(1.中國人民公安大學偵查學院,北京 100038;2.公安部鑒定中心,北京 100038;3.北京中科虹霸科技有限公司,北京 100190)

近年來,虹膜識別在國內外公共安全領域應用廣泛。由于虹膜表面紋理特征豐富,且這些紋理特征終生不變,人各不同,同時虹膜位于人眼內部的特殊位置也很難偽造,所以虹膜已經成為繼指紋、人臉、DNA后又一廣泛應用于公安機關核驗人員身份的生物識別技術[1]。虹膜識別的精度高,比對速度快,非接觸式采集并且不易偽造,同時也特別適合用于大規模人群的身份識別[2]。在虹膜識別技術成熟應用于身份識別后,隨之而來的問題是虹膜識別的結果無法直接作為證據應用于司法審判。虹膜從最基礎的用于身份識別到作為證據應用于司法審判,兩者之間仍然缺少虹膜鑒定這一重要環節。

目前,公安機關使用各種人體生物特征進行身份識別,而對于指紋、DNA、人臉等生物特征的檢驗鑒定也已取得了一定成果。其中指紋是在已有的人工鑒定方法[3-5]基礎上,研究開發出了指紋自動識別系統,而虹膜則是自動識別技術發展在前,鑒定方法的研究相對滯后。虹膜識別技術與虹膜鑒定研究是兩個不同的問題,虹膜識別技術是典型的模式識別和計算機視覺問題,識別過程中將虹膜特征以編碼形式進行匹配,這種特征編碼不需要具備實際的物理意義,因此盡管虹膜識別的精度非常高,但得到的結果無法直接用作鑒定結論,難以在法庭審判過程中發揮作用。虹膜鑒定是通過對兩幅虹膜圖像進行鑒別,尋找其中能夠被人們所認識的特征,最后通過綜合分析,判斷兩幅虹膜圖片是否來源同一。雖然全國各地公安機關現已開始了虹膜采集工作,虹膜識別在公安領域的應用也越來越廣泛,但虹膜鑒定的方法研究還相對滯后。相比于指紋和DNA成熟、系統的鑒定方法,虹膜的鑒定方法還有待進一步完善。

虹膜鑒定方法研究的難點有兩個:第一是選擇什么特征作為虹膜鑒定的依據,這個問題是虹膜鑒定的基礎,需要對虹膜上所有紋理有總體的認識,從而將不同特征按照各自的特點進行分類;第二是虹膜鑒定特征數量的確定,當前法庭科學領域的發展趨勢,對于檢驗鑒定的要求愈發嚴格,特征數量問題不能僅憑經驗找到一定數量符合的特征點即可認定同一,而是要在此基礎之上從客觀角度出發,給出相應的統計概率作為證據解釋。目前在虹膜鑒定方法的研究中圍繞這兩個難點,將虹膜上的特征分為了塊狀特征、線狀特征和環狀特征三類[6]。受限于當前標準下虹膜圖像清晰度的限制,線狀特征和塊狀特征會更加清晰和穩定,本文對類間虹膜塊狀特征相似性進行統計,首先利用Tophat算法提取虹膜上的塊狀特征, 然后用Hu矩特征和位置坐標信息兩個參數描述塊狀特征的相似度,最后使用計算機算法對不同虹膜上提取到的塊狀特征進行兩兩比較,統計異源虹膜上塊狀特征的相似情況。本文希望找到一種方法,能從概率論的角度解釋虹膜鑒定過程中多少個特征點相吻合即可認定同一。

1 研究現狀

虹膜識別從上世紀90年代就已經開始興起,1993年,Daugman博士[7]研究出基于Gabor變換的虹膜識別算法,使虹膜識別技術有了突破性的進展。在國內,1998年底中科院自動化所譚鐵牛博士[8]開始進行虹膜識別方面的研究,2000年成功開發出具有我國自主知識產權的虹膜識別系統,填補了國內空白。目前虹膜識別技術的發展已經非常成熟,虹膜識別技術在世界上已有很多成功的應用案例,如印度的Aadhaar計劃和阿聯酋的出入境虹膜識別系統等[9-10]。

對于虹膜鑒定方法的研究,公安部鑒定中心以國家重點研發項目為依托,以理論研究和計算機輔助軟件兩方面研究作為切入點,在該領域開展了深入的研究。在理論研究方面,結合眼解剖學和虹膜基礎理論,將虹膜特征分為放射狀溝線、向心溝、卷縮輪、隱窩和色素點五大類型[11],并對虹膜圖像特征的提取和分析方法進行了研究,解決了虹膜圖像的人工特征選取和標注問題。但對于特征點數量問題方面的研究仍有待進一步推進。若要從概率論的角度來解釋特征點數量問題,需要統計大量的虹膜上各種特征出現情況,通過人工統計的方式工作量太過龐大,而且由于虹膜紋理特征形狀的隨機性,肉眼觀察也會產生很大誤差,這就需要用到計算機算法來自動提取虹膜特征并進行自動統計。

首先要解決的問題是如何從大量虹膜圖像中有效、準確提取到紋理特征。Shen等[12-14]通過實驗證實了虹膜隱窩特征作為虹膜識別特征的有效性,并設計了基于虹膜隱窩特征的虹膜識別算法,算法中使用Tophat對隱窩特征進行處理后,能夠自動勾畫虹膜隱窩輪廓,準確地將虹膜隱窩特征提取出來。Tophat算法經常被用來分離比鄰近點亮的一些斑塊,在一幅圖像具有大幅背景,而微小物體比較有規律的情況下可以使用。彭博等[15]利用Tophat算法來增強醫學超聲圖像的局部對比度,在保證特征細節不丟失的情況下有效抑制了背景噪聲。虹膜圖像和醫學超聲圖像都是灰度圖像,在特征細節上虹膜塊狀特征和超聲圖像上的特征也有著相似之處。朱成軍等[16]使用Tophat濾波對車牌進行處理,將車牌號碼突出出來,有效提高車牌的識別率。段建民等[17]則利用Tophat濾波處理的方式,抑制路面上車道線以外的大多數背景物體,大大提高車道檢測的準確程度。根據Tophat算法的特點,剛好可以用來對虹膜上的背景噪聲進行抑制,突出虹膜塊狀特征并進行分割。

其次要解決的問題是虹膜塊狀特征的形狀用什么方式描述。Hu矩一般用來識別圖像中大的物體,能較好地描述物體的形狀,但圖像的紋理特征不能太過復雜。商立麗等[18]提出了一種基于全局Hu矩和局部TF-KSURF特征的青銅器銘文相似性度量方法,用Hu矩特征準確地描述了青銅器上銘文的形狀,提高了銘文的檢索性能。曹鵬輝等[19]提出了一種基于光譜降維與Hu矩的壁畫顏料層脫落區域的提取方法,文中使用了Hu矩特征對壁畫中顏料脫落區域的形狀進行描述并二次分類,提高了壁畫顏料層脫落區域的提取精度??梢钥吹?,Hu矩特征經常用于描述青銅器銘文和壁畫顏料脫落區域這種小斑塊的形狀。因此本文選擇使用Hu矩特征值對經過Tophat處理過的虹膜塊狀特征進行描述,以實現對虹膜圖像中的塊狀特征進行自動提取和自動統計。

2 異源虹膜塊狀特征相似性統計方法

由于虹膜的生理結構,可以將其近似看成同心的圓環,隨著瞳孔的放大和縮小,虹膜上的各種特征也隨之變化,因此需要將虹膜圖像進行歸一化處理后再進行后續的實驗。得到歸一化圖像后首先對圖像進行Tophat處理,再通過計算連通域的方式將虹膜圖像上的塊狀特征提取出來,然后記錄每個特征的位置信息和Hu矩特征,最后把所有虹膜圖像上的塊狀特征進行兩兩比較,統計不同虹膜上出現位置相同且形狀相似的塊狀特征的情況。本文提出的異源虹膜塊狀特征相似性統計方法示意圖如圖1。

圖1 統計方法示意圖Fig.1 Schematic for statistical method utilized with this paper

2.1 塊狀特征的自動提取算法

2.1.1 虹膜圖像預處理

一張虹膜原始圖像中除了有用的虹膜紋理信息外,還包含瞳孔、鞏膜、睫毛以及上下眼皮等無用信息。另外,由于瞳孔在不同光照條件下的縮放,虹膜的各類紋理特征也會隨之產生變化。因此在提取塊狀特征前需要對虹膜原始圖像進行預處理,本文的預處理過程包括虹膜圖像歸一化處理、直方圖均衡化及反色操作。

虹膜歸一化操作是以瞳孔中心為基準點,沿虹膜內外邊界同心圓的徑向方向,將圓環狀虹膜紋理區域展開成矩形的歸一化區域。虹膜內外邊界均為圓形,以瞳孔圓心為起點,與虹膜內外邊界的交點坐 標 分別 為(xi(θ),yi(θ))和(xo(θ),yo(θ)),則 利 用下式可將虹膜原圖像中的每一個點一一映射到極坐標(r,θ)中[20-21]。

虹膜歸一化能夠很好地將每幅虹膜圖像調整為同一尺寸,在最大程度上去除無用信息的干擾,從而消除平移、縮放、旋轉對虹膜紋理的影響?,F行公安標準虹膜原圖分辨率為640×480像素,在進行歸一化操作后,得到虹膜歸一化圖分辨率為540×70像素,如圖2。

圖2 虹膜原圖(a)和歸一化圖(b)Fig.2 Original iris image (a) and its normalized version (b)

對虹膜歸一化圖進行直方圖均衡化操作,以消除光照等因素對虹膜塊狀特征分割的影響,進而保障了虹膜塊狀特征分割結果的穩定。直方圖均衡化是一種易于操作且效果明顯的圖像增強方法,通過改變圖像的直方圖來調整圖像中各像素的灰度,能夠有效增強圖像的對比度。

直方圖均衡化的基本原理就是將圖像中對畫面起主要作用的灰度值進行展寬,對畫面不起主要作用的灰度值進行歸并,增大圖像對比度,使圖像更加清晰。虹膜歸一化圖像由于其灰度分布集中在較窄的區間,圖像不夠清晰,直方圖均衡化能把歸一化圖像的直方圖變換為均勻分布的形式,從而增強圖像整體對比度,更加突出虹膜塊狀特征,如圖3。

圖3 直方圖均衡化效果圖Fig.3 The effect image after histogram equalization

虹膜原圖經過歸一化和直方圖均衡化處理后,還需要進行反色處理,如圖4。這是由于在歸一化圖像中,塊狀特征的顏色深于虹膜的背景,經過反色處理后,虹膜塊狀特征的灰度會明顯高于其鄰域,以便后續使用Tophat算法對塊狀特征進行提取。

圖4 反色效果圖Fig.4 Reverse color handling into the effect image from histogram equalization

2.1.2 基于Tophat算法的塊狀特征分割

Tophat算法[17]實際上是原圖像與開運算的結果圖之差,開運算就是先腐蝕后膨脹的過程。設輸入圖像為f(x,y),內核為b(x,y),則Tophat算法表達式為

式中符號“?!北硎緝群薭(x,y)對圖像f(x,y)的開運算,將該運算繼續展開

式中符號“ ”表示結構元素b(x,y)對圖像f(x,y)的腐蝕;符號“”表示b(x,y)對圖像f(x,y)的膨脹。其中,腐蝕和膨脹運算定義如下:

式中符號“”與“”分別為邏輯與、或運算。實際上,膨脹操作就是將圖像f(x,y)與核b(x,y)進行卷積,腐蝕是膨脹的逆運算。

對虹膜歸一化圖進行開運算可以將歸一化圖中的紋理放大,從原圖中減去開運算后的圖像,此過程突出了虹膜歸一化圖上的紋理特征,最后通過簡單的連通域計算,將面積與形狀符合條件的塊狀特征分割出來。

2.2 塊狀特征相似度計算方法

在虹膜鑒定過程中,對兩個特征相似的界定有兩個方面:一是特征的位置相同,二是特征的形狀相似。

2.2.1 虹膜塊狀特征的位置

同一虹膜兩次采集的圖像在進行歸一化處理后,塊狀特征的絕對位置信息可能會發生改變。這是由于在采集虹膜圖像的過程中頭部發生了旋轉,這種變化會使采集到的虹膜旋轉3°左右,塊狀特征在歸一化圖上的位置也會發生相應變化,如圖5。在實驗過程中,每個塊狀特征的位置信息以質心坐標(x,y)的形式記錄下來,采用歐氏距離來計算兩個特征位置之間的相似程度。

圖5 采集時頭部旋轉對虹膜歸一化圖上虹膜位置的影響(a:同一虹膜兩次采集的圖像;b:因頭部旋轉虹膜上的特征位置發生偏移)Fig.5 Effect of head turning on iris positioning into its normalization map during acquisition (a: two images collected of the same iris; b:iris feature position offset from head turning)

2.2.2 基于Hu矩的塊狀特征形狀信息

虹膜鑒定過程中,虹膜特征的形狀如何去定義是一個很重要的問題。經過Tophat處理后的虹膜歸一化圖,將虹膜塊狀特征提取出來,僅保留了輪廓形狀,這樣更有利于后續對特征形狀的描述。Hu矩算法是由Hu于1962年提出并證明它們具有旋轉、縮放和平移不變性,能夠較好描述目標的整體輪廓結構特征,被廣泛應用于圖像識別領域[22]。

在空間坐標系(x,y)中,設一幅虹膜塊狀特征圖像f(x,y),其(p+q)階矩定義為:

中心距定義為:

式中,p,q=0, 1, 2, 3…,N和M分別是圖像的高度和寬度;中心距μpq保持位移不變性,矩心(x,y,代表質心位置,矩心計算公式為

由此得到虹膜塊狀特征的Hu矩特征向量為

將所有塊狀特征的Hu矩值計算出來后,發現Hu矩值的范圍很大,有些無法直接進行比較,因此需要先進行式(10)中的對數變換再進行比較。

通過式(11)來計算兩個特征之間形狀的相似程度。

2.3 塊狀特征相似閾值的調整方法

虹膜鑒定過程當中,由于虹膜紋理特征完全是隨機出現,形狀也是隨機形成的,所以兩個塊狀特征的相似認定實際上是非常復雜的。在從位置和形狀兩個角度對塊狀特征之間相似的定義過程中,對認定相似的參數需要進行調整,以達到最接近實際情況的效果。以下兩個實驗可以對參數的調整提供參考。對于塊狀特征的位置特征,由于塊狀特征位置會因為圖像采集過程中頭部的旋轉而產生橫向偏差,在歸一化操作時也會因為內外圓自動提取的不準確而產生縱向偏差。頭部旋轉導致的虹膜圖像旋轉在3°左右,因此結合虹膜圖像歸一化過程的特點,在分辨率為540×70像素的歸一化圖像上,只要兩個特征之間的歐氏距離小于等于3×540÷360,即小于等于4.5,就認為兩個特征的位置相同。此距離大小的選擇在不同分辨率的歸一化圖像上略有不同。對于塊狀特征的形狀特征,需要經過多次的實驗,選取同一只眼睛多次拍攝的虹膜圖像上的同一塊狀特征,計算并比較它們的Hu矩特征值,找到類內塊狀特征Hu矩值之間的差距。本文通過選取4個來自于同一虹膜4次采集的4張虹膜圖像上同一個清晰穩定的塊狀特征A、B、C、D(圖6),比較它們的Hu矩值(表1~2),以此作為參考,調整本文實驗中認定類間塊狀特征形狀相似的閾值。

表1 類內塊狀特征Hu矩特征值對比Table 1 Comparison among the intra-class block-shaped characteristic Hu-moment values

圖6 類內塊狀特征示例Fig.6 Examples of the intra-class block-shaped features

從表1和表2明顯可以看到,類內塊狀特征之間Hu矩特征值相似度d差距均小于7,越小說明特征之間的形狀越接近。根據經驗,類間虹膜塊狀特征的Hu矩特征值差距明顯大于類內的差距。

表2 各塊狀特征之間Hu矩相似度d的值Table 2 The d values of Hu-moment similarity between blockshaped features

3 實驗與結果分析

實驗的操作系統是Windows 10(64位),CPU為英特爾Corei7-10750H,內存16 GB,GPU為GTX1660Ti,軟件平臺采用MATLAB2018b。依據現在公安實戰中對虹膜圖像的規格要求,共選取來自全國不同地區的952枚分辨率為640×480像素的清晰虹膜圖像。本實驗所用虹膜數據庫由公安部鑒定中心和北京中科虹霸科技有限公司提供。

3.1 不同內核對塊狀特征提取結果的影響

本文針對虹膜塊狀特征進行分割,為了更準確地分割塊狀特征,盡可能多地消除塊狀特征以外的信息,結合以前對塊狀特征的研究,對內核的形狀和大小進行反復實驗。圖7為不同形狀和大小的內核對Tophat處理虹膜歸一化圖的效果。發現當使用矩形內核時,塊狀特征的邊緣會損失掉一部分;使用圓盤形內核時如果半徑過小,有一些形狀復雜的塊狀特征會被拆成多個小的斑塊,而半徑過大則不能很好地過濾背景噪聲,相鄰很近的幾個塊狀特征可能會被融合為一個塊狀特征。最終經過多次嘗試,當使用半徑大小為9的圓盤形核時,對于虹膜上的塊狀特征的腐蝕最為準確。這主要是由于塊狀特征的形狀多為類橢圓形,在分辨率為540×70像素的歸一化圖中,塊狀特征的大小為50~500像素不等。這樣經過與內核卷積,虹膜上的塊狀特征被較為完整地保留下來,而一些線狀特征則被很好地過濾掉,最后再通過面積和形狀的限定,將符合條件的塊狀特征分割出來。

圖7 不同形狀內核提取的效果對比(a:虹膜歸一化圖;b:邊長為9的矩形核處理效果圖;c:半徑大小為3的圓盤形核處理效果圖;d:半徑大小為9的圓盤形核處理效果圖;e:半徑大小為15的圓盤形核處理效果圖)Fig.7 Extraction effects of shape-different cores (a: normalized iris image; b: effect from processing with side-length-of-9 rectangular core;c: effect from processing with radius-of-3 disc-form core; d: effect from processing with radius-of-9 disc-form core; e: effect from processing with radius-of-15 disc-form core)

3.2 不同閾值對實驗結果的影響

實驗過程中虹膜塊狀特征相似需要調整兩個閾值,一個是位置相同的閾值,另一個是形狀相似的閾值。本文中使用歐式距離對塊狀特征的位置相似進行度量,但實際實驗過程中發現并不是兩個斑塊位置坐標的歐氏距離越小,得到的實驗結果越接近實際。認定兩個塊狀特征位置相同時,它們位置坐標的歐氏距離需要考慮到歸一化圖的分辨率大小,由此設定一個合適的值,本文實驗中設置的值為4.5。如果這個值設置得過小,將會漏掉一些采集虹膜過程中產生偏差的塊狀特征,使得最后得到的統計結果小于實際值。

塊狀特征形狀相似的閾值本文實驗設置為7,因為在實驗過程中發現類內塊狀特征之間的相似程度d都在7左右。理論上,d的值越小,塊狀特征之間的相似程度便越接近,但由于采集虹膜時的光照、角度等外界因素的影響,同一虹膜上的同一塊狀特征,在多次采集的虹膜圖像上也會呈現出不完全一致的形狀。如果閾值設置過小,將會人為過濾掉一部分形狀相似的塊狀特征,也會使統計結果小于實際值。

3.3 關于虹膜塊狀特征相似性統計結果的分析

本文實驗從952枚虹膜圖像中提取出7 041個塊狀特征,不同虹膜圖像上的每個塊狀特征之間兩兩比對,記錄每一對相似的塊狀特征,再計算得出不同虹膜上相同位置出現相似虹膜塊狀特征的頻率。在952枚的虹膜庫中,實驗得出滿足位置和Hu矩特征值均相似的塊狀特征22 443對。

經計算,952枚異源虹膜之間進行兩兩比對,共比對452 676次,其中兩枚不同虹膜上出現1個塊狀特征相似的情況19 811次,出現2個塊狀特征相似的情況2 418次,出現3個塊狀特征相似的情況198次,出現4個塊狀特征相似的情況16次。此時兩枚不同虹膜上出現1個塊狀特征相似的比率為4.38%,2個塊狀特征相似的比率為0.534%,3個塊狀特征相似的比率為0.043 7%,4個塊狀特征相似的比率為0.003 53%。如表3,出現比率=出現次數÷452 676。

表3 虹膜塊狀特征相似性實驗統計結果Table 3 Statistics about appearing similar block-shaped iris feature on two different irises

根據大數定律,在試驗不變的條件下,重復試驗多次,隨機事件的頻率近似于它的概率。由于本實驗中數據庫的大小有限,實驗結果中沒有出現5個以上塊狀特征相似的情況,并且以上幾種情況的頻率還并不能準確接近于它的概率。但當數據庫達到一定規模后,其頻率就將近似等于它的概率。在今后繼續擴充數據庫的過程中,可能還會有5個、6個甚至更多塊狀特征相似的情況,所對應的概率也可以據此方法計算出來。

4 結論

本文對異源虹膜塊狀特征相似性進行統計,提出利用Tophat算法對虹膜圖像進行處理。根據塊狀特征的特點優化內核的形狀,減少背景噪聲,并成功提取到了虹膜塊狀特征;在統計不同虹膜上相同位置出現的形狀相似的塊狀特征時,采用Hu矩特征來對塊狀特征的形狀進行描述,通過實驗探究了塊狀特征相似的閾值調整方法。本文使用計算機算法對異源虹膜塊狀特征相似性進行統計,得到了兩枚不同虹膜上出現1~4個相似的塊狀特征時各自所對應的頻率,在今后的研究中,還可以針對虹膜上其他特征進行類似的統計。

解決鑒定過程中認定同一的特征數量問題,不能僅憑經驗,人為地通過設置閾值制定鑒定標準,要以科學的方法為依據,給出客觀、可信的標準。本文運用算法自動提取塊狀特征,在提出虹膜塊狀特征相似性度量方法的基礎上,統計塊狀特征的出現情況,計算出兩枚虹膜上出現不同數量相似的塊狀特征時對應的頻率,運用科學統計的方法給出設置不同數量的塊狀特征作為同一認定標準時所對應的概率。該方法可用于計算大規模虹膜數據集下異源虹膜間出現不同數量相似塊狀特征的概率,為解決鑒定過程中需要多少個特征相同才能認定同一的問題奠定基礎,對虹膜鑒定的研究具有重要的意義。

猜你喜歡
塊狀虹膜形狀
挖藕 假如悲傷有形狀……
雙眼虹膜劈裂癥一例
你的形狀
“刷眼”如何開啟孩子回家之門
Ghosts in the shell: identif i cation of microglia in the human central nervous system by P2Y12 receptor
看到的是什么形狀
厚層塊狀特低滲礫巖油藏水平井壓裂參數優化
LTE上行塊狀導頻的信道估計研究
基于Hough變換的快速虹膜識別算法研究
氧化釔摻雜塊狀SiO2氣凝膠的制備與表征
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合