?

文本圖像條帶污染去除的0稀疏模型與算法

2022-07-12 14:03耿則勛
計算機應用與軟件 2022年6期
關鍵詞:條帶識別率強度

喻 恒 耿則勛,2

1(平頂山學院信息工程學院 河南 平頂山 467000) 2(信息工程大學地理空間信息學院 河南 鄭州 450052)

0 引 言

文字作為人們普遍使用的信息交流載體,在信息傳播中發揮著重要作用,現代文字通常采用橫向表述的方式,因此條帶污染是網絡文本圖像最常用、最經常出現的干擾、加噪及涂改方式(如圖1所示),這種圖像涂改方式并不會影響閱讀者對于文字圖像內容的理解,但是會嚴重干擾網絡監管系統的對文字信息的自動識別,因此研究污染的文本圖像條帶去除技術,對網絡中文本圖像的識別和監管具有重要的現實意義。

(a) 文檔圖像 (b)網絡文本圖像圖1 條帶污染的文本圖像

一般意義上受污染的文本圖像主要指采用掃描儀、復印機等光學儀器對紙質文檔掃描成像時,受紙張質量、背景等原因產生的噪聲[2],大量研究都集中在去除這類噪聲污染而針對人為或手工故意添加的條帶型污染、劃痕、標注等噪聲去除與恢復的研究較少。通常學術界對條帶噪聲的研究一般集中于遙感圖像,是由探測元件掃描不一致或探測器運動、溫度變化等因素的影響引起的一種系統性條紋污染[3]。這種噪聲污染與文本圖像的條帶污染都是對圖像的像素進行逐行破壞,具有一定相似性。

近年來,針對遙感圖像的條帶去除方法主要是分為三類:基于濾波的方法、基于統計的方法和基于泛函變分的方法?;跒V波的方法是通過各種濾波器去除遙感圖像的條帶噪聲(如文獻[4-6])?;诮y計的方法主要是分析條紋的分布(如文獻[7-8])。最近,基于泛函變分的方法在遙感圖像去除條帶噪聲問題上顯示出優越性,該方法主要是探索和發現內在先驗知識,生成合理的正則化模型。文獻[9]提出了一種去除MODIS圖像條紋的單向全變分(Unidirectional Total Variation,UTV)模型。文獻[10]提出了一種將UTV與稀疏條紋先驗相結合的優化模型。文獻[11]利用具有各向異性光譜空間全變分正則化的分裂Bregman迭代法去除多光譜圖像條紋。文獻[3]提出了一種非凸L0稀疏遙感圖像去噪模型,并通過近似交替方向乘數法(PADMM)為基礎的算法求解得到了較好的結果。然而,文本圖像中的條帶噪聲相比較于遙感圖像中的條帶噪聲對于圖像像素的逐行破壞比較嚴重,對文字覆蓋的像素寬度比例也更大,單純采用遙感圖像的去條帶方法并不能準確地估計出條帶圖像,需要尋找到合適的方法準確地估計并修復條帶區域,這也是本文的主要工作。

圖像修復方法主要分為兩類:基于偏微分方程(PDE)的方法和基于范例/樣本的方法?;跇颖镜姆椒ㄊ且环N非常有效的大目標區域修復方法。它們傾向于通過直接從源區域復制和粘貼來填充目標區域,從而很好地保留圖像紋理[12-14]?;谄⒎址匠痰姆椒ú惶m合恢復大區域的紋理,但非常適合于完成直線、曲線和修補小區域,可以有效避免斷裂邊緣,因此更適合文本字符圖像的修復。這項技術首先由Bertalmio等提出[15]。根據Bertalmio等的工作,文獻[16-17]提出了兩個基于偏微分方程的模型,全變分(TV)模型和曲率驅動擴散(CDD)模型,用于處理非紋理圖像的修復問題。近年來基于TV模型的修復研究得到不斷拓展,文獻[18]提出了一種自適應分數階TV修復算法,利用分數階微分的全局性,將ROF修復模型的正則項由一階微分拓展到分數階微分。文獻[19]提出結合紋理結構的分數階微分TV模型,文獻[20]改進了TV修復算法,在正則項中加入自適應參數擴散調節系數,提高了運算速度,獲得了較好的效果。因此可以判斷出TV模型算法是一種廣泛使用的基于偏微分方程的修復算法。

綜上所述,為了去除文本圖像的條帶污染,我們從條帶的結構特性出發,提出了一個基于稀疏模型的污染范圍(或區域)估計方法,該模型主要由三個稀疏先驗構成,包括基于原圖與修復圖相似性的約束項、條帶(Y軸)的方向特性的L0稀疏先驗、條帶(X軸)的過平滑“L0稀疏先驗”;在X軸和Y軸先驗模型中引入自適應參數,實現對水平條帶的細節保持和其他方向紋理的平滑并給出對該稀疏模型的優化求解算法,估計出準確的條帶污染區域。為了保證字符的完整連續,我們采用經典的TV模型圖像修復方法恢復文字。仿真和測試圖像的結果表明,該方法可以有效去除文本圖像的條帶污染,與當前最新的遙感圖像去除條帶噪聲算法以及條紋脈沖噪聲圖像修復算法相比,本文估計的條帶污染區域更加準確,PSNR和SSIM值也有很大提高,均值分別在20和0.93以上,污染英文文本圖片文字正確識別率提高40%以上,中文文本提高10%以上。

1 條帶估計算法研究

1.1 條帶噪聲模型

遙感圖像條帶噪聲一般由加性成分和乘性成分組成[21]。文本圖像中的條帶污染主要是人為在原圖上添加的規則或不規則的條紋型噪聲污染,因此本文將研究集中在加性條帶模型上。

u(x,y)=n(x,y)+s(x,y)

(1)

式中:u(x,y)表示觀察圖像;s(x,y)表示條帶分量;n(x,y)表示底層文本圖像。為了方便起見,將式(1)按照逐行轉置疊加的方式改寫成如下的向量形式:

U=N+S

(2)

式中:U,N,S∈Rn,n=M×N,分別表示觀測圖像、修復圖像和條帶噪聲,M和N表示圖像的行列數。我們的工作目的是估計條帶S,找出被污染的區域,然后進行修復。

1.2 0梯度最小化模型

(3)

式中:第一項是保真項,Sp表示平滑后輸出圖像,Up表示輸入的觀測圖,p表示圖像像素坐標位置;λ是正則化參數,C(S)表示0范數正則化項即

C(S)=‖▽Sp‖0=#{p||▽xSp|+|▽ySp|≠0}

(4)

式中:▽是圖像的差分運算符,▽x表示沿水平方向的差分運算,▽y表示沿垂直方向的差分運算。C(S)表示圖像在水平方向和垂直方向梯度不為0的像素個數。

1.3 條帶估計模型

分析條帶污染的文本圖像,可將未覆蓋的文字區域看作待平滑區域,條帶區域為平滑后的待保留區域。污染條帶一般是逐行(X軸)或近似逐行出現的,并且條帶自身可近似為灰度相等、均勻連續的水平條狀窄帶,相鄰像素之間水平差異(X方向梯度)很小,或者甚至接近零,因此,我們使用條帶水平方向(X軸)梯度稀疏的先驗模型,即:

R1=λ1‖▽xS‖0

(5)

?yS>>?xS?xS≠0

(6)

式中:?xS和?yS分別表示圖像水平方向和垂直方向的偏導數。如果只采用式(5)的正則項,可以對圖1(a)所示的條帶污染進行完美的估計,但是對手工添加的不規則條帶污染(圖2(a))提取效果比較差。圖2(b)所示為只包含式(5)的模型對圖2(a)提取的條帶區域,可以看出無法精確地提取出非水平方向的條帶。

(a) 人工條帶污染文本圖

(b) X軸正則項提取條帶圖像

(c) 非自適應正則參數提取條帶圖像圖2 只保留X軸正則項和不包含自適應參數條帶提取

為此我們引入帶自適應參數的垂直方向正則化項并定義正則化項參數:

(7)

同時定義式(5)正則化參數λ1為:

(8)

式中:k1,k2∈R+為輔助參數;ε為不等于零的極小正數,防止出現分母為零的情況。在近似水平條帶區域,▽xS值較小,▽yS的值較大,λ1值趨近于無窮小,λ2的值趨近于無窮大,可以有效地平滑掉垂直方向的紋理,保持水平條帶,這與我們的目的一致。但是在垂直紋理區域(文本字符部分區域)當▽xS值較小,▽yS的值較大,λ1值趨近于無窮大,λ2的值趨近于無窮小,會保持垂直紋理,這與我們的目的不一致,因此設置兩個輔助參數k1、k2,k1參數值偏大,用來抑制Y軸方向梯度,k2參數值偏小,用來盡可能保持水平紋理。而在非垂直非水平的紋理(字符的部分筆畫)部分,λ1、λ2可保持在合適的數值,使得非條帶區域的文本部分被有效地平滑掉。如果缺乏自適應參數,則模型會有效地保持任意梯度的紋理條紋,使得針對條帶污染的提取失敗,如圖2(c)所示。

(9)

式中:第一項為保真項,S為條帶圖像,U為觀測的條帶污染圖像。

1.4 模型求解

(10)

C1(S)=#{p||▽xS|≠0}

(11)

C2(S)=#{p||▽yS|≠0}

(12)

引入輔助變量(hp,vp),令hp=▽xSp,vp=▽ySp,將目標函數重寫為:

(▽yS-vp)2]+λ1C1(h)+λ2C2(v)}

(13)

式(13)的目標函數可分解為下述3個子問題:

S子問題:

(14)

h子問題:

(15)

v子問題:

(16)

下邊分別討論每個子問題求解方法。

1)S子問題最小化可寫作以下形式:

(17)

以矩陣向量的形式表示為:

(18)

式(18)為連續可微凸泛函,對J求關于S的一階偏導數,并令偏導數等于零,得到:

S=[E+β(BTB+DTD)]-1[U+β(BTH+DTV)]

(19)

直接求逆矩陣計算耗時,可對上述方程兩端作傅里葉變換,注意B、D為循環矩陣,其傅里葉變換的卷積等于對應元素的乘積,因而有:

(20)

2)h子問題能量函數可以寫作:

(21)

因為C1(h)是0范數,當λ1/β≥(▽xSp)2時,若hp不等于0,則:

(22)

若hp等于0,則:

Ep=(▽xSp)2

(23)

所以hp=0時,minEp=(▽xSp)2。

當λ2/β<(▽xSp)2時,若hp不等于0,則:

(24)

若hp等于0,則:

(25)

綜合以上兩種情況,有h子問題最優解表達式為:

(26)

3) 對于v子問題最優解表達式為:

(27)

綜合以上三個子問題的分析,對于式(9)的最小化求解算法如算法1所示。

算法1式(9)算法

輸入:觀察圖像U(包含條帶污染),參數β0、βmax迭代系數r,參數k1、k2。

初始化:S←U,β←β0,i←0

當β≤βmax重復:

3)β←rβ,i++

輸出:圖像S

結合步驟1)到步驟3),給出式(9)的完整算法。特別是子問題都有閉式解公式。有關算法的收斂性分析參見文獻[22]。算法1中總結了求解過程,其中β0、βmax、k1、k2是預先定義的參數。本文將k1設置為1 000,k2設置為0.001。

由于文本或文檔圖像中的字符包含有極小的水平梯度的像素區域,因此通過算法1得到的條帶估計圖像會一定程度上保留這些水平梯度區域,在估計的條帶圖像中以噪聲的形式存在,因此需要對條帶圖像做進一步去噪處理,以得到準確的條帶圖。本文采用了形態學去除小區域的方法,以8連通域為標準,計算各區域像素個數記為該連通域面積,將像素面積較小的噪聲區域進行去除,從而得到文本圖像條帶污染區域的最終估計。

2 文本圖像修復

文本文檔圖像中的條帶污染一般可分為覆蓋文字區域和未覆蓋文字區域兩類對于未覆蓋文字的條帶形標注、涂改可采用N=U-S直接獲取底層文本圖像,但是因為覆蓋文字的條帶區域較大,簡單的通過式(2)獲得的去條帶圖像會有很大部分的像素缺失,對于文本識別是不利的??紤]到文本圖像不同于普通的灰度圖像,文字特征在圖像中的表達更趨近于一種紋理,因此本文采用基于TV模型的圖像修復,在之前估計出的污染區域的基礎上,進一步恢復被條帶污損的文字。

TV模型圖像修復方法是一種基于偏微分方程的圖像修復方法,其修復模型為:

(28)

式中:D為待修復區域即估計的條帶區域,E為D的鄰域,第一項為正則項,作用是尋求E∪D區域的最優解,第二項是保真項,u0為待修復圖像,u為估計得到的最優修復圖像,λ為平衡正則項和保真項的正則化參數。

(29)

(30)

3 實驗結果與比較

本節將對所提出的方法性能進行分析,針對英文和中文文本圖像中水平方向的規則條帶、近似水平的不規則條帶以及各種行寬強度的條帶污染進行估計和修復,并分析修復前后的文本圖像PNSR和SSIM值,以及文字識別率。因為目前針對文本圖像去條帶污染的相關研究較少,本文與幾種最新的去條帶方法和圖像修復方法進行比較,包括遙感圖像條帶去除和脈沖噪聲圖像修復等。由于沒有標準的測試圖像集,我們使用規則/非規則條帶噪聲污染文本圖像建立一個包含150幅圖像的測試集(測試文本包含原圖以及污染圖片,內容為隨機選取中英文文檔,不包含任何含義),其中規則條帶污染各種文本文檔圖像50幅,不規則條帶污染各種文本文檔圖像50幅,不同強度條帶污染圖像50幅。所有實驗均在4 GB RAM和Inter(R)Core(TM)CPU i7- 5500UCPU,@2.40 GHz的臺式機上用MATLAB(R2016a)進行。

3.1 規則條帶文本圖像修復

規則的條帶污染文本文檔圖像一般指使用辦公軟件或者圖像編輯軟件自動添加的水平條紋,這種方式添加的條帶一般為絕對水平梯度,覆蓋整個文字區域。本文算法效果如圖3所示。

(a) 英文文本圖像修復

(b) 中文文本圖像修復圖3 規則條帶污染的文本圖像條帶估計與修復

可以看出,使用辦公軟件對英文和中文文本添加的規則水平梯度的條帶污染,本文算法可以準確地估計出條帶圖像,修復后的圖像能夠完整地去除條帶部分,并對條帶遮擋區域進行了效果滿意的恢復,如字母“e”和漢字“民”,但是個別字符仍然存在修復不完全的情況,如字母“A”和漢字“毛”。

為了客觀評價算法的有效性,我們比較去除條帶前后圖像的PSNR、SSIM值,同時為了驗證算法的實際應用性(即條帶污染的網絡文本圖像的文字識別),我們使用同一文字識別模型的OCR識別算法對修復前后的文本圖像進行識別。按照識別率=正確識別字符個數/全部字符個數×100%的公式計算(下文的識別率都按照此方法進行初步定性分析)。

圖2(a)英文文本圖像修復前PSNR、SSIM值分別為16.216 4、0.876 7,正確識別(按順序)率44.2%,修復后PSNR、SSIM值分別為22.357 9、0.967 3,正確識別率98%,;圖2(b)漢字文本圖像共31個字符(包括標點)修復前PSNR、SSIM值分別為18.382 6、0.889 4,正確識別率87%,修復后PSNR、SSIM值為25.397 7、0.953 3,正確識別率達到100%。我們對50副規則條帶污染文本圖像(英文23副,中文27副)進行實驗,英文條帶文本圖像PSNR平均提高6.53,SSIM值平均提高0.087,字符識別率平均提高53.2%,中文條帶文本圖像PSNR平均提高7.93,SSIM值平均提高0.092,字符識別率平均提高14.9%,因此本文算法對于規則條帶污染的文本圖像修復具有較好的效果。

3.2 不規則條帶文本圖像修復

不規則條帶污染指的是人為添加條狀或近似條狀的涂改,一般包括兩種情況,一種是指通過圖像編輯軟件手動添加的條狀涂改標注等,這一類是直接對數字圖像進行編輯;另一類是紙質書籍、文檔中手工添加的條帶狀標注、涂改、刪除等,當需要轉化為電子文檔、數字圖片進行保存或對書籍文檔中的文字進行自動識別時,就需要將這些條帶污染去除。這類條帶污染一般是近似水平梯度的情況,而且是不規則的出現,如圖4所示。

(a) 中文書籍文本圖像修復

(b) 英文書籍文本圖像修復

(c) 中文電子文檔文本圖像修復

(d) 英文電子文檔文本圖像修復圖4 不規則條帶污染的文本圖像(黑色背景上的 白色條子圖帶表示估計的污染區域)

可以看出,分別對中文書籍圖像(圖4(a))、英文書籍圖像(圖4(b)),中文字符電子文檔圖像(圖4(c))、英文字符電子文檔圖像(圖4(d))人工添加條帶污染,雖然條帶噪聲在部分區域呈現非水平梯度,算法仍然能夠很好地提取完整的條帶圖像,并對文本圖像進行修復,達到正常閱讀和識別的目的,這從實驗的視覺效果中可以直接體會到。修復前后PSNR、SSIM與OCR算法文字識別率(只針對條帶覆蓋字符區域)結果如表1所示。

表1 人工條帶污染文本圖像修復前后評價數據對比

可以看出,條帶污染對英文文本的字符識別率破壞比較嚴重,而被污染的中文字符的識別率稍高,經本文算法處理后的文本圖像的PSNR、SSIM值以及識別率都得到了有效改善。通過對50幅人工污染的條帶文本圖像(中文書籍圖片15幅,英文書籍圖片8幅,中文電子文檔圖片15幅,英文電子文檔圖片12幅)仿真實驗分析,中文書籍圖片修復后文字PSNR和SSIM平均分別提高4.98、0.079,識別率平均提高12.5%,英文書籍圖片修復后PSNR和SSIM平均提高4.33、0.068,識別率提高50.3%,中文電子文檔圖片修復后識別率提高9.8%,PSNR和SSIM分別提高7.84、0.082,英文電子文檔圖片修復后識別率提高62.4%,PSNR和SSIM分別提高8.14、0.089。因此本文方法在去除人工污染的英文文本圖像中不規則條帶方面同樣有很好的表現,有效去除了條帶噪聲,提高了文本圖像的識別率。

3.3 不同強度條帶去除分析

從圖4的結果中可以初步分析出,條帶區域在覆蓋文字字符占比較大即條帶行寬較大的情況下,文字修復后的視覺效果和識別率均有一定程度的降低。為了進一步分析本文算法對于文本圖像不同行寬的條帶污染估計和修復能力,我們對同一文本圖像添加不同行寬的條帶污染,分析本文算法對條帶圖像的估計情況和修復效果。

如圖5、圖6所示,對同一英文文本圖像和中文文本圖像添加不同行寬強度的規則與不規則的條帶污染,通過實驗結果視覺效果可以看出,本文算法能夠精確地估計出不同強度的條帶污染區域,但是隨著條帶行寬強度增大,字符修復的效果逐漸變差,在條帶噪聲強度最大的最后一行出現字符被遮擋區域效果更差。

圖5 英文文本不同強度條帶估計與修復

圖6 中文文本不同強度條帶估計與修復

為了分析本文方法在不同強度條帶污染的文本圖像修復的文字識別率,對同一文本圖像添加強度逐漸增加的條帶污染,計算PSNR和SSIM值,通過OCR方法進行識別,并分析識別率。

如圖7所示,對同一英文文檔圖像(共計34字符)添加三種強度寬度規則條帶污染和不規則條帶污染。修復前后的PSNR與SSIM值如表2所示。圖7(a)三幅圖像字符識別率分別為58.8%、26.5%、0%;修復后圖7(e)字符識別率分別為100%、79.4%、18.8%;圖7(b)字符識別率分別為64.7%、56.3%、41.2%,修復后圖7(f)字符識別率分別為100%、91.2%、79.4%。通過實驗結果可以分析出本文方法在不同強度條帶污染的英文文本圖像修復上都大幅度提高了字符的識別率,但是隨著條帶強度的增大,PSNR與SSIM值以及識別率有所下降,但相比較比原圖有著一定提高,這一數據也和主觀視覺感受相一致。

(a) 規則條帶 (b) 不規則條帶

(c) 規則條帶估計 (d) 不規則條帶估計

(e) 規則條帶修復圖像 (f) 不規則條帶修復圖像圖7 多強度條帶英文文本圖像修復

表2 多強度條帶英文文本圖像修復PSNR和SSIM

如圖8所示,對同一中文文檔圖像(共計15字符)添加三種強度寬度規則條帶污染和不規則條帶污染,修復前后的PSNR與SSIM值如表3所示。原始圖像圖8(a)三字符識別率分別為80%、66.7%、60%;修復后圖8(e)字符識別率分別為100%、93.3%、53.3%;圖8(b)字符識別率分別為93.3%、53.3%、46.7%,修復后圖8(f)字符識別率分別為100%、93.3%、46.7%。通過實驗可以分析出因為中文字符的結構與英文的差別,條帶污染對中文字符識別率的影響要低于英文字符,但相同的是條帶強度越大,PSNR、SSIM值和識別率越低,通過本文算法修復后的各項數據均有一定提高,在條帶強度逐漸增大的情況下,數據改善效果逐漸降低。

(a) 規則條帶 (b) 不規則條帶

(c) 規則條帶估計 (d) 不規則條帶估計

(e) 規則條帶修復圖像 (f) 不規則條帶修復圖像圖8 多強度條帶中文文本圖像修復

表3 多強度條帶中文文本圖像修復PSNR與SSIM

為了驗證本文方法在不同強度條帶污染圖像修復效果一般性,我們采用圖7、圖8實驗方法分析三種強度條帶污染(規則和不規則)的文本圖像50幅(電子文本圖片)的文字識別率,每幅不少于100字符。其中英文25幅(規則條帶12幅,不規則13幅),每幅中文25幅(規則條帶12幅,不規則13幅),計算修復后的字符識別率(如圖9、圖10所示),直方圖縱坐標為字符識別率,橫坐標為測試圖像編號,淺灰色直方圖為0.5磅寬度條帶,標注為強度1,深灰色直方圖為1.5磅寬度條帶,標注為強度2,黑色為2.5磅寬度條帶,標注為強度3。

(a) 規則條帶英文OCR識別率直方圖

(b) 不規則條帶英文OCR識別率直方圖圖9 英文文本圖像OCR識別率直方圖對比

(a) 規則條帶中文OCR識別率直方圖

(b) 不規則條帶中文OCR識別率直方圖圖10 中文文本圖像OCR識別率直方圖對比

由識別率直方圖對比結果可以看出,本文算法對不同強度條帶污染文本圖像的修復識別率顯著提高,但是隨著條帶行寬增加(如強度3條帶圖像),條帶覆蓋字符區域面積比例較大,對字符結構破壞比較嚴重,修復后識別率提高效果不明顯,說明修復算法還有進一步提升的空間,但是實驗結果仍然證明本文方法在去除條帶,提高文本圖像識別率上確實有效的。

3.4 本文算法與其他算法比較

因為目前在文本圖像條帶污染去除方面的研究較少,為了進一步分析本文算法與其他方法在文本圖像去除條帶的修復效果,我們選擇在遙感圖像去除條帶噪聲效果較好的幾種最新算法,包括方向0稀疏建模的圖像條紋噪聲去除(UESTC)[3](圖11(a))、基于圖像分解的遙感圖像條紋噪聲去除(LRSID)[25](圖11(b)),以及0TV稀疏優化方法的脈沖噪聲圖像恢復算法[23](圖11(c))??梢钥闯鋈N算法在條帶估計和圖像修復上都有較好的視覺效果。

(a) UESTC

(b) LRSID

(c) 0TV圖11 三種算法條帶估計和去除

為了比較三種算法和本文方法文本圖像條帶去除效果,實驗選用0.5磅強度的規則/不規則條帶污染文本圖像,分別給出了四種算法對測試圖的條帶估計級圖像修復效果,并比較去除條帶后圖像的PSNR、SSIM值以及OCR識別率。

如圖12(b)所示,UESTC算法能夠較好地估計出文本圖像規則條帶污染圖像,修復效果也可達滿意效果,但是對于不規則條帶的估計和修復效果不好,特別是非水平梯度區域;圖12(c)中LRSID算法也可估計出規則條帶,但是對于不規則條帶的估計以及整體修復結果較差;圖12(d)0TV算法因為缺少精確的條帶估計方法,使得對所有類型文本圖像修復效果都比較差。本文算法可以精確地估計規則條帶進行修復,尤其在不規則條帶的估計和文本圖像修復上有著明顯優于其他算法的表現,這從實驗的視覺效果中可以直接體現出來。

(a) 條帶污染文本圖

(b) UESTC

(c) LRSID

(d) 0TV

(e) 本文算法圖12 不同算法去除文本條帶污染效果比較

為了量化本文算法文本圖像去條帶能力,實驗分別給出4種算法條帶污染文本圖像修復后對應的PSNR、SSIM以及文字OCR識別率(以單個字符為準)計算值如表4所示。為了制表方便,圖12(a)四幅受污染文本圖像分別標記為圖像1、圖像2、圖像3和圖像4。

表4 四種算法PSNR、SSIM和OCR識別率

可以看出,本文算法修復的圖像在PSNR和SSIM值上都明顯優于其他三種算法,尤其在修復圖像識別率上有著更優秀的表現。采用以上方法對10幅條帶污染圖像的實驗分析比較,本文算法在英文文本修復圖像的PSNR值均在20左右,SSIM值在0.93左右,對中文文本修復圖像的PSNR值均在24左右,SSIM值在0.94左右,都優于其他算法。OCR識別率本文算法的規則條帶識別率都在90%以上,不規則條帶文本識別率均在95%以上,綜合以上實驗數據,本文算法具有良好的文本圖像條帶去除能力,基本達到提高識別率的要求。

3.5 一般性實驗

為了驗證算法的一般性,我們又對包含文本字符較多的大幅文本圖像進行了仿真實驗,部分實驗結果如圖13所示。

(a) 英文文本條帶提取與修復

(b) 中文文本條帶提取和修復圖13 多行大幅文本圖像條帶提取和修復

由圖13的實驗結果可以觀察到,本文算法針對行數較多的大幅文本圖像也能夠較好地提取條帶污染并進行修復。我們在測試集基礎上添加了20幅平均超過15行的大幅文本污染圖像,經過實驗均能有效地提取出文本中的條帶污染進行修復,證明本文算法針對一般尺寸的書籍、文檔等數字圖像的條帶污染具有較好的修復能力。

3.6 局限性分析

由于我們的方法是假定文本圖像條帶的具體類型是水平梯度和近水平梯度的,雖然這與文本涂改的一般情況相一致,但是對于非水平梯度的涂改污染修復效果還是有限的。同時本文方法雖然可以良好地估計出各種行寬強度的條帶圖像,但是對強度較大的條帶圖像修復效果還達不到滿意的結果,因此對于任意方向、行寬強度條帶污染文本污染的估計和文本圖像的修復算法還需要進一步研究。

4 結 語

猜你喜歡
條帶識別率強度
基于高光譜成像的肉品檢測去條帶噪聲方法
受災區域衛星遙感監測的條帶分解方法研究
巧用廢舊條幅輔助“蹲踞式起跑”教學
檔案數字化過程中OCR技術的應用分析
基于PCA與MLP感知器的人臉圖像辨識技術
計算電場強度常用的幾種方法
電場強度疊加問題的求解
電場強度單個表達的比較
科技文檔中數學表達式的結構分析與識別
人工智能現狀和發展
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合