?

基于神經網絡的塑料打包帶高光譜模式識別

2024-03-19 05:21韓林杰姜紅田陸川趙靜遠劉業林牛奕張永強
包裝工程 2024年5期
關鍵詞:打包帶塑料光譜

韓林杰,姜紅,田陸川,趙靜遠,劉業林,牛奕,張永強

基于神經網絡的塑料打包帶高光譜模式識別

韓林杰1,姜紅2*,田陸川1,趙靜遠3,劉業林3,牛奕3,張永強3

(1.中國人民公安大學 偵查學院,北京 100038;2.甘肅警察職業學院 刑事偵查系,蘭州 730046; 3.江蘇雙利合譜科技有限公司,江蘇 無錫 214000)

建立一種快速、準確、無損的塑料打包帶的檢驗及分類方法。利用高光譜在波長為350~990 nm的條件下采集52個不同來源的塑料打包帶樣品的高光譜數據,并對樣品進行Savitzky-Golay平滑處理,同時結合主成分分析對樣品進行降維。將提取到的主成分進行-Means聚類,以聚類結果為依據建立徑向基函數神經網絡(RBFNN)與BP神經網絡模型(BPNN)。打包帶樣品的高光譜譜圖在400~500 nm、600~700 nm處有較大區別。實驗共提取了5個初始特征值大于1的主成分,可以解釋96.633%的原始數據。通過-means聚類將塑料打包帶樣品分為6類,Calinski-Harabasz指數為28.76,RBFNN分類準確率為86.7%;BPNN分類準確率為98.1%,BPNN的分類效果更好。研究表明神經網絡在高光譜譜圖分類處理上具有較高的準確度,同時也驗證了高光譜在區分檢驗塑料打包帶類物證的可行性與科學性,為公安機關提供了一種新的檢驗方法。

高光譜;塑料打包帶;神經網絡;模式識別

塑料打包帶在各類案件現場中較為常見,因其具有質輕、耐磨、耐腐蝕等優勢,犯罪分子在包裝、運輸兇器等過程中經常使用塑料打包帶[1]。因此,系統地分析塑料打包帶樣品可以為偵查人員提供線索,為縮短偵查時間、縮小偵查范圍提供幫助。

塑料打包帶常用聚氯乙烯(Polyvinyl Chloride,PVC)、聚乙烯(Polyethylene,PE)、聚丙烯(Polypropylene,PP)、聚對苯二甲酸乙二醇酯(Polyethylene Glycol Terephthalate,PET)作為主要成分[2],其中以PP和PET最為常見。為降低成本、改善性能,生產廠家常在生產過程中加入重質碳酸鈣、滑石粉、高嶺土、鈣粉等填料和白油(液體石蠟)、石蠟、鄰苯二甲酸二辛酯、低相對分子質量聚乙烯(聚乙烯蠟)及硬脂酸等助劑。

目前法庭科學領域檢測塑料打包帶類物證的方法有:紅外光譜法、拉曼光譜法[3]、X射線熒光光譜法、差示掃描量熱法[4]、掃描電鏡能譜法等。高光譜成像技術融合了圖像技術與光譜信息技術,既可以獲得目標的二維位置信息又可以獲得一維的光譜信息,在光譜分辨率與波段范圍上有更好的表現。作為一種新興、無損、準確的分析方法,高光譜成像技術已在食品安全[5],醫學研究[6],航空航天[7]等領域有廣泛應用,近些年也在血跡檢驗[8-9]、文件檢驗[10-11]、生物物證[12]等領域有所進展。在塑料打包帶生產過程中,由于主要成分與填料的不同,塑料打包帶在高光譜譜圖中會存在一定的差異,這為后續分析檢驗塑料打包帶樣品提供了科學依據。

以往檢驗塑料打包帶的文獻通常用譜圖峰值與標準特征峰對比或元素含量對比的方法對其進行分類,如《拉曼光譜法檢驗塑料打包帶(繩)的研究》[3]《紅外光譜結合X射線光光譜檢驗塑料打包帶(繩)的研究》[1]這2篇文章,沒有使用化學計量學加以分析;而在《X射線熒光光譜結合多元統計分析塑料打包帶(繩)》[2]一文中,作者使用了Fisher判別,但相關系數為0.993,沒有達到100%的正確率。本實驗在上述方法的基礎上進行創新升級,將高光譜與神經網絡相結合對塑料打包帶進行分類。

1 實驗部分

1.1 實驗儀器及條件

主要實驗儀器:GaiaFiled Pro-V10E(江蘇雙利合譜);測試方式為5×5排列,從上到下依次掃描。

主要實驗條件:光源為鹵素燈;波長為400~1 000 nm,分辨率為1 936×1 456,CPU為Intel(R) Core(TM) i5-10400 CPU @ 2.90 GHz,RAM為16 G,硬盤為256 G。

1.2 實驗樣本及前處理

不同品牌、不同來源、不同規格的樣品共52個(樣品表略)。將每個樣品剪成長約1 cm,用酒精擦拭干凈,晾干待測。

1.3 譜圖采集與預處理

首先將樣品按長度為1 cm進行裁剪,再用酒精棉球擦拭,在環境光背景下對樣品進行掃描測試。采用ENVI5.3光譜圖像處理軟件處理高光譜圖像,采集不同特征點的光譜曲線,再利用Savitzky-Golay平滑處理提取得到光譜圖。

1.4 數據處理方法

1.4.1 主成分分析法(PCA)

主成分分析(PCA)是最常用的線性降維方法,它通過投影的方式將高維的數據映射到低維的空間中,同時希望提取的主成分可以最大地表示原始數據。當數據量龐大且各項數據可能存在線性重疊的情況下,需要對數據降維再進行處理。在主成分分析的過程中,當主成分和累計方差百分比過低時,主成分不足以解釋原始光譜數據,因此一般要求提取的主成分特征值大于1且累計方差率高于85%。

1.4.2-means聚類分析

-means算法是經典的無監督聚類算法之一,其原理是在給定個初始類簇中心點的情況下,把每個樣本點分到距離最近的簇中心點所代表的簇中,最終對劃分工作完成后的數據進行迭代運算,從而獲得一個最優的聚類結果。樣本點與簇中心點的距離計算方法采用歐氏距離,具體表達式如式(1)所示。其中,X表示第個對象;C表示第個聚類中心;X表示第個對象的第個屬性;C表示第個聚類中心的第個屬性。

1.4.3 徑向基函數神經網絡

徑向基函數神經網絡(RBFNN)是三層前反饋神經網絡,其包括輸入層、隱層、輸出層。當RBF的中心點確定以后,可以確定輸入矢量到隱層及隱層到輸出層的映射關系,輸入層到隱藏層的神經元之間的權重全部為1。隱層是使用徑向基函數作為激活函數的神經元,其作用是把向量從低維度映射到高維度,使得低維度不可分的情況到高緯度變得可分。RBFNN可以處理系統內難以解析的規律性,具有良好的泛化能力,并有很快的學習收斂速度,是一種局部逼近網絡[13-14]。

1.4.4 BP神經網絡

BP神經網絡(BPNN)是一種多層前反饋神經網絡。其基本思想是梯度下降法,類似于人類的神經元。輸入層接收數據,輸出層輸出數據,前一層神經元連接到下一層神經元,收集上一層神經元傳遞來的信息,經過“激活”把值傳遞給下一層,利用梯度搜索技術,使網絡的實際輸出值和期望輸出值的誤差均方差為最小。與RBFNN不同的是,BPNN的隱節點采用輸入模式與權值向量的內積作為激活函數的自變量。此外,各參數(權值、閾值)對網絡輸出的影響力相同,且對任何輸出都有影響,是一種全局逼近網絡[15-17]。

1.5 實驗流程

實驗具體流程如圖1所示。

2 結果與討論

2.1 光譜預處理結果

樣品的原始光譜圖如圖2所示。由圖2可以發現,樣品在波長為400~500 nm,600~700 nm處有顯著差異,說明樣品的主要成分有所區別。為了更好地增強審視效果,運用Savitzky-Golay算法對光譜數據進行平滑處理,減少噪聲干擾,在保留譜圖原始信息的同時可以避免數據冗雜,降低神經網絡模型的分類準確度與訓練效率。平滑處理的部分結果如圖3所示。

圖1 實驗流程

圖2 全部樣品高光譜的譜圖

圖3 8#樣品平滑處理的前后對比

2.2 主成分分析

高光譜圖像因攜帶有大量的數據信息增強了其檢測能力,但冗余的數據也增加了其分類難度。對光譜圖像進行降維處理的目的在于提取主要特征的同時減少數據信息量,降低處理信息的時長與難度,同時增強數據分析的精確度。

本文對52個樣品進行主成分分析,共提取了5個主成分,其主成分分析結果見表1。由表1可以發現,樣品的累計方差貢獻率為96.633%,降維效果較好。

表1 樣品的主成分分析結果摘要

Tab.1 Summary of principal component analysis results

2.3 K-means聚類分析

為了使聚類效果最好,本文將降維得到的5個主成分作為新的變量帶入分析,采用Calinski-Harabasz準則判斷最佳值。CH指數的本質是簇間距離與簇內距離的比值,由于整體計算方式類似于方差計算,又被稱為方差比準則。CH值越大,代表內部協方差越小,類別之間協方差越大,可以說明聚類效果更好[18]。為避免值設置過大導致原屬于同組的樣品被細分,使聚類結果缺乏解釋性,本文設置值范圍為2~8,得到塑料打包帶樣品不同值對應的CH指數,如圖4所示??梢园l現,當聚類數為6時,樣品的CH值最大,聚類效果最好,由此設定值為6。

圖4 不同K值下的Calinski-Harabasz指數

2.4 神經網絡分類

2.4.1 徑向基函數神經網絡

以-Means聚類結果為依據,本次實驗按照8∶2的比例隨機分配徑向基函數神經網絡的訓練集與測試集,其中輸入向量為提取到的5個主成分,隱藏層激活函數為Softmax,輸出層向量為-Means聚類結果,具體的分類結果如表2所示。由表2可以發現,徑向基函數神經網絡(RBFNN)對樣品的分類準確率為86.7%,準確率偏低。

表2 RBFNN的分類結果

Tab.2 Classification result of RBFNN

2.4.2 BP神經網絡

同樣以-Means聚類結果為依據,實驗按照8∶1∶1的比例隨機選擇BPNN的訓練集、測試集與驗證集,采用交叉熵作為損失函數,訓練算法為量化共軛梯度法進行訓練,其結果如圖5、圖6所示。當采用交叉熵作為損失函數時,交叉熵越低,就證明模型的策略越接近最優策略,在迭代數為40時,BPNN的交叉熵最低,模型訓練完成,其具體訓練過程如圖5所示。樣品的混淆矩陣(見圖6)表明樣品的準確率為98.1%,結合ROC曲線(見圖7)可以看出,該訓練模型適合對塑料打包帶進行分類。選擇部分樣品作為測試集測試訓練模型的分類正確率,得到的測試集混淆矩陣(見圖8)表明,該模型對塑料打包帶分類的正確率為100%。

圖5 BPNN的訓練過程

圖6 樣品分類混淆矩陣

BPNN屬于全局逼近網絡,具有較強的泛化能力、容錯能力和高度的自適應能力,可以逼近任意的非線性關系。BPNN的優點在于能夠通過學習自動提取并輸出數據間的“合理規則”,并自適應地將學習內容記憶于網絡的權值中,適合時可以將學習成果應用于新知識,并且BPNN在局部的或者部分的神經元受到破壞后仍然能正常工作。相較于RBFNN,BPNN在解決具有相同精度要求問題時的結構要更加簡單,運算大量樣本時能有效減少運算量。在實驗得到低維數據的情況下,采用BPNN更為合適。經過驗證,BPNN檢驗樣品的準確率更高。綜上所述,BPNN可以較好地對塑料打包帶進行分類。

圖7 樣品ROC曲線

圖8 測試集混淆矩陣

注:NaN%表示非確定數值或數值無法被計算。

3 結語

本實驗利用高光譜技術對52個塑料打包帶進行了檢驗,并將樣品譜圖進行Savitzky-Golay平滑處理。樣品在400~500 nm、600~700 nm的譜圖差異,可以作為樣品分類的主要依據。采用主成分分析法對樣品進行降維,將提取到的5個主成分進行-Means聚類,比較不同值對應的CH指數,選擇最大值,確認最佳聚類數為6,以聚類結果為依據建立徑向基函數神經網絡(RBFNN)與BP神經網絡模型(BPNN)。其中,BPNN分類準確率為98.1%,選擇部分樣品對模型進行測試,得到測試集的分類正確率為100%,可以較好地對塑料打包帶進行分類。

當今,將神經網絡應用于高光譜圖像檢測與分類已有不少研究成果見諸報道,但用于公安刑偵中塑料打包帶類物證的檢測,屬于應用創新,具有較好的應用價值。本文驗證了高光譜在區分檢驗塑料打包帶類物證的可行性與科學性,該方法操作簡便,無損樣品,可以為公安檢測工作提供新手段。

[1] 馬梟, 姜紅, 楊佳琦. 紅外光譜結合X射線熒光光譜檢驗塑料打包帶(繩)的研究[J]. 化學研究與應用, 2019, 31(9): 1643-1648.

MA X, JIANG H, YANG J Q. Research on Inspecting the Plastic Pack Belts(Ropes)by Infrared Spectrometry Combined with X-Ray Fluorescence Spectrometry[J]. Chemical Research and Application, 2019, 31(9): 1643-1648.

[2] 馬梟, 姜紅, 楊佳琦. X射線熒光光譜結合多元統計分析塑料打包帶(繩)[J]. 激光與光電子學進展, 2019, 56(22): 243-247.

MA X, JIANG H, YANG J Q. Examination of Plastic Pack Belts (Ropes) via X-Ray Fluorescence Spectrometry Combined with Multivariate Statistical Analysis[J]. Laser & Optoelectronics Progress, 2019, 56(22): 243-247.

[3] 馬梟, 姜紅, 楊佳琦, 等. 拉曼光譜法檢驗塑料打包帶(繩)的研究[J]. 上海塑料, 2018(4): 29-35.

MA X, JIANG H, YANG J Q, et al. Research on Inspecting the Plastic Pack Belts (Ropes) by Raman Spectroscopy[J]. Shanghai Plastics, 2018(4): 29-35.

[4] 馮計民, 陶克明, 孔曉明. 差示掃描量熱法(DSC)對聚乙烯、聚丙烯制品的檢驗[J]. 刑事技術, 1992(1): 1-5.

FENG JM, TAO K M, KONG X M. Inspection of Polyethylene and Polypropylene Products by Differential Scanning Calorimetry[J]. Criminal Technology, 1992(1):1-5.

[5] WU D, MENG L, YANG L, et al.Feasibility of Laser-Induced Breakdown Spectroscopy and Hyperspectral Imaging for Rapid Detection of Thiophanate-Methyl Residue on Mulberry[J].International Journal of Molecular Sciences, 2019, 20(8): 2017- 2017.

[6] AGGARWAL S L P, PAPAY F A. Applications of Multispectral and Hyperspectral Imaging in Dermatology[J]. Experimental Dermatology, 2022, 31(8): 1128-1135.

[7] 郝明達, 普運偉, 周家厚, 等. 一種用于預測航空遙感影像光譜信息的深度學習方法[J]. 遙感信息, 2022, 37(6): 123-129.

HAO M D, PU Y W, ZHOU J H, et al. A Deep Learning Method for Predicting Spectral Information of Aerial Remote Sensing Images[J]. Remote Sensing Information, 2022, 37(6): 123-129.

[8] 莊園, 高樹輝, 謝菲, 等. 基于高光譜成像技術鑒別血痕種屬的實驗研究[J]. 激光與光電子學進展, 2022, 59(16): 1630001.

ZHUANG Y, GAO S H, XIE F, et al. Identifying Bloodstain Species Using Hyperspectral Imaging[J]. Laser & Optoelectronics Progress, 2022, 59(16): 1630001.

[9] 孫威, 劉懷策, 劉金坤, 等. 基于偏最小二乘法的血跡陳舊度高光譜預測研究[J]. 應用化工, 2022, 51(1): 273-276.

SUN W, LIU H C, LIU J K, et al. Age Imaging by Hyperspectral Estimation of Bloodstains Technology Based on Partial Least Squares Regression[J]. Applied Chemical Industry, 2022, 51(1): 273-276.

[10] 李云鵬, 代雪晶, 王猛, 等. 隱性字跡的快速光譜顯現與高光譜分類技術研究[J]. 光譜學與光譜分析, 2021, 41(11): 3524-3531.

LI Y P, DAI X J, WANG M, et al. Study on Rapid Spectral Reappearing and Hyperspectral Classification of Invisible Writing[J]. Spectroscopy and Spectral Analysis, 2021, 41(11): 3524-3531.

[11] 張倩, 陳維娜, 郝紅光. 高光譜成像技術在文件檢驗應用的研究綜述[J]. 應用化工, 2020, 49(1): 165-170.

ZHANG Q, CHEN W N, HAO H G. A Review of Research on Hyperspectral Imaging Technology in Document Inspection Applications[J]. Applied Chemical Industry, 2020, 49(1): 165-170.

[12] PALLOCCI M, TREGLIA M, PASSALACQUA P, et al. Forensic Applications of Hyperspectral Imaging Technique: A Narrative Review[J]. The Medico-Legal Journal, 2022, 90(4): 216-220.

[13] 侯偉, 王繼芬, 劉怡然. 基于機器學習的人體指甲光譜模式識別及溯源分析[J]. 激光與光電子學進展, 2022, 59(18): 463-470.

HOU W, WANG J F, LIU Y R. Spectral Pattern Recognition and Traceability Analysis of Human Fingernail Based on Machine Learning[J]. Laser & Optoelectronics Progress, 2022, 59(18): 463-470.

[14] 潘立劍, 陳蔚芳, 崔榕芳, 等. 基于激光誘導擊穿光譜與徑向基函數神經網絡的鋁合金定量分析[J]. 激光與光電子學進展, 2020, 57(19): 193002.

PAN L J, CHEN W F, CUI R F, et al. Quantitative Analysis of Aluminum Alloy Based on Laser-Induced Breakdown Spectroscopy and Radial Basis Function Neural Network[J]. Laser & Optoelectronics Progress, 2020, 57(19): 193002.

[15] 吳俊, 郭大千, 李果, 等. 基于CARS-BPNN的江西省土壤有機碳含量高光譜預測[J]. 中國農業科學, 2022, 55(19): 3738-3750.

WU J, GUO D Q, LI G, et al. Prediction of Soil Organic Carbon Content in Jiangxi Province by Vis-NIR Spectroscopy Based on the CARS-BPNN Model[J]. Scientia Agricultura Sinica, 2022, 55(19): 3738-3750.

[16] 沈飛龍. 基于機器學習與光譜信息的土壤鐵氧化物估算模型研究[D].武漢: 華中農業大學, 2022.

SHEN F L. Study on Soil Iron Oxide Estimation Model Based on Machine Learning and Spectral Information[D]. Wuhan: Huazhong Agricultural University, 2022.

[17] 田安紅, 付承彪, 熊黑鋼, 等. BPNN對不同人為活動區域的鹽漬土Na+高光譜估測[J]. 水土保持研究, 2020, 27(2): 364-369.

TIAN A H, FU C B, XIONG H G, et al. Hyperspectral Estimation of Na+ Ion in Saline Soils in Areas with Different Human Activities Using BPNN Model[J]. Research of Soil and Water Conservation, 2020, 27(2): 364-369.

[18] WANG C Y, ZHA Q. Measuring Systemic Diversity of Chinese Universities: A Clustering-Method Approach[J]. Quality & Quantity, 2018, 52(3): 1331-1347.

Hyperspectral Pattern Recognition of Plastic Packaging Tape Based on Neural Network

HAN Linjie1, JIANG Hong2*, TIAN Luchuan1, ZHAO Jingyuan3, LIU Yelin3, NIU Yi3, ZHANG Yongqiang3

(1. Investigation Institute, People's Public Security University of China, Beijing 100038, China; 2. Criminal Investigation Department, Gansu Police Vocational College, Lanzhou 730046, China; 3. Jiangsu Dualix Spectral Imaging Co., Ltd., Jiangsu Wuxi 214000, China)

The work aims to establish a fast, accurate, and non-destructive inspection and classification method for plastic packaging tapes. 52 samples of plastic packaging tape were collected from different sources through hyperspectral data in the wavelength range of 350-990 nm, and the samples were smoothed with Savitzky Golay. Principal component analysis was also used to reduce the dimensionality of the samples.-Means clustering was conducted on the extracted principal components, and a radial basis function neural network (RBFNN) and BP neural network model (BPNN) was established based on the clustering results. There were significant differences in the hyperspectral spectra of the packaged sample at 400-500 nm and 600-700 nm. A total of 5 principal components with initial feature values greater than 1 were extracted in the experiment, which could explain 96.633% of the original data. The plastic packaging tape samples were clustered into 6 categories, with a Calinski Harabasz index of 28.76 for-means and a classification accuracy of 86.7% for RBFNN. The classification accuracy of BPNN was 98.1%. BPNN had better classification performance. Research has shown that neural network has high accuracy in the classification and processing of hyperspectral spectra, and it has also verified the feasibility and scientificity of hyperspectral recognition in the detection of plastic packaging tape type evidence, providing a new inspection method for public security organs.

hyperspectral; plastic packaging tape; neural network; pattern recognition

TB487;O433.4

A

1001-3563(2024)05-0240-07

10.19554/j.cnki.1001-3563.2024.05.029

2023-05-10

國家重點研發計劃項目(2019YFF0303405);食品藥品安全防控山西省重點實驗室基金資助(202204010931006)

猜你喜歡
打包帶塑料光譜
基于三維Saab變換的高光譜圖像壓縮方法
畢業了,我想把可愛的室友們打包帶走
塑料也高級
星載近紅外高光譜CO2遙感進展
家電產品常用的各類規格等級打包帶性能分析
塑料
亂世奇商(下)
教你逗
塑料和聚合物的超聲焊接
苦味酸與牛血清蛋白相互作用的光譜研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合