?

彩色激光打印機跟蹤暗碼的計算機自動比對技術研究

2022-12-09 04:53魏顯峰胡祖平
關鍵詞:碼本打印機矢量

魏顯峰, 王 宇, 胡祖平

(浙江漢博司法鑒定中心,浙江杭州 310007)

0 引言

隨著彩色激光打印機的迅速普及,彩色激光打印機的打印速度、打印品質也不斷提高,在為人們日常工作提供便利的同時,也為一些不法分子偽造各類打印文件創造了條件,他們利用彩色激光打印機偽造高質量的假鈔、假票據甚至偽造政府公文,嚴重危害了國家利益和人們的正常生產生活秩序,也為此類案件的物證鑒定工作帶來極大挑戰。打印機制造商及有關政府機構很早就意識到高質量的打印設備會給不法分子提供便利,美國密勤局(United States Secret Service)要求打印機生產商在彩色激光打印機中設置一種跟蹤暗碼,執法部門和打印機制造商可以通過這項隱藏技術來確認偽造者的身份[1]。

跟蹤暗碼是指重復出現在某種機型的彩色激光打印機打印文件上,由直徑只有0.1 mm左右的黃色墨點所組成的點陣圖形[2],點陣圖形以組為單位規律分布于整張紙面,圖文處和紙張空白處均有分布。由于白色紙張和黃色墨點之間的色差較小,所以肉眼往往難以直接識別,必須借助儀器設備進行顯現。打印機制造商將打印機的信息編碼為一個唯一性的點陣圖形并儲存在芯片中,由芯片中的固定程序指揮,一般的機械故障不會影響到該系統的正常工作,如果試圖毀壞該系統,那么有可能會直接造成打印機具的損毀[3],所以該特征具有較強的穩定性。

打印機制造商一直將跟蹤暗碼作為商業機密未向外界透露其破譯方式,除了一個名為“電子前沿基金會”(Electronic Frontier Foundation,EFF)的研究組織在此前破譯并公布了富士施樂牌彩色激光打印機跟蹤暗碼所包含的品牌、打印時間等信息外,其他品牌的打印機跟蹤暗碼信息目前尚未完全破解,因此需要采用逆向分析方法,通過對不同品牌、不同型號、不同打印時間的樣本進行分析,總結歸納出彩色激光打印機跟蹤暗碼特征規律,建立不同品牌、不同型號彩色激光打印機暗碼特征數據庫,利用計算機自動比對技術對彩色激光打印機跟蹤暗碼進行識別與比對,從而提高鑒定效率。

1 材料與方法

1.1 儀器

VSC8000文檢儀、Stemi2000-C體視顯微鏡、Epson Perfection V850 Pro掃描儀、Photoshop CS6圖像處理軟件等。

1.2 樣本制作

收集了3臺市面上比較常見的彩色激光打印機,使用同一個Word文檔在A4幅面的復印紙上分別以彩色模式和灰度模式進行打印,時間間隔為7天,實驗樣本打印質量較高,具備檢驗條件,具體機具品牌型號如表1所示。

表1 彩色激光打印機品牌型號表

2 顯現方法與步驟

2.1 顯微檢驗法

利用體視顯微鏡將實驗樣本放大觀察,可以清晰地觀察到紙張表面跟蹤暗碼的輪廓和顏色。由于顯微鏡的視場較為狹窄,且紙張顏色與黃色墨點的顏色反差不大,所以很難通過顯微鏡直接觀察到跟蹤暗碼的整體形態,上述3臺彩色激光打印機跟蹤暗碼微觀形態如圖1、圖2、圖3所示。

圖1 HP Color LaserJet CP1515n牌彩色激光打印機打印文件跟蹤暗碼微觀形態

圖2 TOSHIBA FC-2010AC牌彩色激光打印機打印文件跟蹤暗碼微觀形態

圖3 Konica Minolta blzhub C226牌彩色激光打印機打印文件跟蹤暗碼微觀形態

2.2 分色檢驗法

由于不同顏色的物體對光的吸收和反射的特性不同,使用波段范圍在400~480 nm的藍色光源照射,藍色光線被跟蹤暗碼的黃色染料所吸收,黃色小點呈深灰色,而白色紙張會全部反射這一波段的光線,使得兩者增大了反差,從而將跟蹤暗碼顯現出來,藍光越強,顯現效果越好[4]。把實驗樣本依次置于VSC8000文檢儀中,采用藍色光源可以較為快捷地將打印文件上的跟蹤暗碼顯現出來,上述3臺彩色激光打印機跟蹤暗碼點陣形態如圖4、圖5、圖6所示。

圖5 TOSHIBA FC-2010AC牌彩色激光打印機打印文件跟蹤暗碼點陣形態(局部)

圖6 Konica Minolta blzhub C226牌彩色激光打印機打印文件跟蹤暗碼點陣形態(局部)

2.3 PS處理顯現法

把實驗樣本放入到Epson Perfection V850 Pro掃描儀中,采用1200dpi掃描分辨率對實驗樣本依次掃描,掃描完成后將掃描圖像保存為JPG格式文件。然后運行Photoshop CS6圖像處理軟件將上述文件打開并放大到合適倍率,在“通道”欄中僅勾選“藍”,此時可以清晰地觀察到跟蹤暗碼的點陣圖案,為了增大反差可以選擇圖像——調整——反向功能使圖片呈現黑底,也可以繼續使用圖像——調整——色階功能來增大反差,直至得到最佳的顯現效果。在顯現過程中,應注意底灰等因素造成虛假的暗碼點。上述3臺彩色激光打印機跟蹤暗碼點陣形態如圖7、圖8、圖9所示。

圖7 HP Color LaserJet CP1515n牌彩色激光打印機打印文件跟蹤暗碼點陣形態(局部)

圖8 TOSHIBA FC-2010AC牌彩色激光打印機打印文件跟蹤暗碼點陣形態(局部)

圖9 Konica Minolta blzhub C226牌彩色激光打印機打印文件跟蹤暗碼點陣形態(局部)

3 跟蹤暗碼特征分析

3.1 跟蹤暗碼微觀形態

實驗發現,彩色激光打印機的跟蹤暗碼大多由直徑約為0.05~0.2 mm的黃色小點組成,且在彩色打印模式下打印彩色內容時出現,在彩色模式下打印黑白內容或在灰度模式下打印則不會出現。同種品牌不同型號或者不同品牌的打印機跟蹤暗碼的微觀形態可能會存在差異,但對于富士施樂牌彩色激光打印機,同一品牌、不同型號的打印機打印文件跟蹤暗碼的形態和大小完全一致[5]。比較常見的跟蹤暗碼形態有正圓形、空心圓、扁橢圓等,一般情況下,同機打印的文件上跟蹤暗碼的形態和大小完全一致,不會隨著時間的變化而變化。

3.2 跟蹤暗碼出現的位置

彩色激光打印文件跟蹤暗碼分布于整張紙面,在紙面的任何部位都可以觀察和提取,紙面空白處和圖文處均有分布,以點陣為單位重復出現。

3.3 跟蹤暗碼點陣形態

本次實驗發現:HP Color LaserJet CP1515n牌彩色激光打印機打印文件跟蹤暗碼點陣形態輪廓為21×17陣列,TOSHIBA FC-2010AC牌彩色激光打印機打印文件跟蹤暗碼點陣形態輪廓為17×21陣列,Konica Minolta blzhub C226牌彩色激光打印機打印文件跟蹤暗碼點陣形態呈較為密集型輪廓。根據當前的研究結果顯示[6-8],不同品牌之間的彩色激光打印機打印文件的跟蹤暗碼點陣形態存在差異,同一品牌的彩色激光打印機打印文件的暗碼點陣形態之間既有相似之處,同一品牌不同型號之間也存在一定的差異。對于同一臺彩色激光打印機而言,大多數打印文件的暗碼點陣形態不會隨著時間的變化而發生改變,但也有少數的彩色激光打印機,如富士施樂牌彩色激光打印機打印文件的暗碼點陣形態會隨著時間的變化而發生局部改變。

4 計算機自動比對

通過顯現實驗獲得跟蹤暗碼的點陣圖,再經過對比增強、噪點去除、裁剪等方式消除干擾項后,可以利用計算機圖像識別技術對其進行關鍵特征提取,相關特征可以作為圖片的“指紋”信息,與相關打印機型號信息等進行關聯,建立檢索數據庫。對于未知的點陣圖片,可通過對比數據庫進行已有特征的相關性檢測,計算得出相關打印機型號等信息。

常見的相似圖片檢測方法有:基于哈希算法、基于特征匹配、基于BOW+K-Means模型以及基于卷積網絡的圖像相似度計算方法。受限于實驗樣本的數量,本實驗目前探索了前3種計算方法,相關實驗圖片如圖10、圖11、圖12、圖13所示。

圖10 樣本圖片

圖11 對比圖片(a)

圖12 對比圖片(b)

圖13 對比圖片(c)

4.1 哈希算法

哈希算法是通過生成類似縮略圖的方式保留圖片低頻信息,對圖片生成一個“指紋”字符串,然后比較不同的圖像指紋,結果越接近說明圖片越相似。本實驗使用差異哈希算法(Hash)對實驗圖片做比對。實現過程如下:

(1)將圖片縮小至8×9共72像素,然后將縮放圖片轉為256階灰度圖。

(2)計算每行中相鄰元素差異,若左邊像素比右邊更亮,則記錄為1,否則為0,總計產生64個差異值,組成該圖的指紋。

(3)圖片相關性檢測。計算兩張圖片指紋字符串的漢明距離,距離越小則差異越小、相關性越高。測試結果顯示,跟蹤暗碼圖與非跟蹤暗碼圖差異明顯,跟蹤暗碼圖之間差異值符合真實相關性[9]。

4.2 特征提取匹配

SIFT特征提取是在不同的尺度空間上查找關鍵點,對關鍵點周圍區域計算特征向量。其不止具有尺度不變性,即使改變旋轉角度、圖片亮度或拍攝角度等,都有比較好的檢測效果,在實驗中甚至對未做優化處理的原始圖片也能計算較為準確的相關性。對于特征匹配,則使用KNN算法計算圖片相關性。實現過程如下:

(1)讀取樣本及測試圖,并轉為灰度圖片。

(2)使用OpenCV SIFT算法分別檢測獲得圖片的關鍵點及對應描述。

(3)使用OpenCV FlannBasedMatcher算法查找兩圖中每個特征最相關的2個關鍵點,然后統計其中最近距離距較近的關鍵點占整體匹配結果的比例,作為二者的相關性[10]。

4.3 基于BoW+K-Means的相似圖片檢測

SIFT特征雖然已經能很好地描述一幅圖片,但每個SIFT特征矢量是128維的,而一幅圖通常包含成百上千個SIFT矢量,所以在進行圖片相似度計算時計算量非常大。實踐中更常用的做法是使用KMeans算法對樣本特征矢量進行聚類生成碼本,然后將樣本圖片矢量映射到碼本,最終只需要使用一個碼本矢量來描述一幅圖片,大大提升相似度計算效率。實現過程如下:

(1)圖片預處理,然后使用SIFT提取特征,每個特征使用128維矢量表示。

(2)使用K-Means對所有矢量做聚類,將矢量聚為200個簇,形成一部字典。然后計算每樣本圖片SIFT特征到每個特征詞的距離,對距離最近的特征詞計數+1,作為詞頻。完成當前圖片特征映射后即得到了圖片對應到碼本的詞頻矢量。

(3)構造碼本,做TF-IDF加權消除停用詞影響,做L2歸一化。最終將處理后的碼本持久化作為模型。

(4)相似圖片檢索。對檢索圖片做同樣的特征提取、TF-IDF、L2歸一化之后,計算其與(3)產出的訓練碼本的距離,對應距離最近的樣本圖片則可認為與檢索圖片最相似[11]。

上述3種測試方法的具體結果如表2所示。

從表2可以看到3種相似度檢測方法都能反映出與樣本圖片最相近的對比圖片,SIFT與Bow+KMeans則可以更高的精度反映出圖片的相似程度。

表2 測試結果

5 結論

本文對常見不同品牌、不同型號的彩色激光打印機跟蹤暗碼進行了顯現和分析,并分別運用基于哈希算法、基于特征匹配、基于BOW+K-Means模型3種檢測方法對實驗樣本進行了比對,取得了較好的效果,證實了該方法的可行性。但受限于當前收集的打印機樣本數量不足以及相似圖片檢測模型精準度等情況,本次研究還存在一定的局限性。需要建立更多不同品牌、不同型號的彩色激光打印機跟蹤暗碼數據庫、提升樣本圖片質量等手段來提高模型精度,做到對檢索圖片的精準匹配,進而更好地運用到鑒定工作實踐當中。

猜你喜歡
碼本打印機矢量
免調度NOMA系統中擴頻碼優化設計
矢量三角形法的應用
基于有限域上仿射空間構造新碼本
基于Zadoff-Chu 矩陣的最優碼本構造方法
幾類近似達到Welch界碼本的構造
另類3D打印機
基于矢量最優估計的穩健測向方法
打印機基板大型注塑模具設計
三角形法則在動態平衡問題中的應用
FDM型混色3D打印機的設計
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合