?

基于改進區域生長法的漢字骨架提取算法

2021-09-22 02:14劉南鋒
科技研究 2021年22期
關鍵詞:細化

劉南鋒

摘要:針對Zhang-Suen細化算法細化漢字時存在交叉點易出現斷裂、漢字骨架有毛刺和無法保證單一像素的問題,提出一種基于改進區域生長法的漢字骨架提取算法。首先,該算法對二值圖像漢字按筆畫進行分解;然后對分解后的每個漢字筆畫基于改進區域生長算法采用設計的區域生長規則對筆畫進行細化,并基于筆畫寬度與細化后筆畫寬度比例關系確定細化筆畫位置;最后對細化后筆畫按照筆畫順序合并得到細化后的文字骨架,消除Zhang-Suen算法弊端并提高細化后文字骨骼線的質量。

關鍵詞:Zhang-Suen細化;區域生長法;漢字筆畫;細化;漢字骨架

中圖分類號:TP391 文獻標識碼:A

0引言

隨著計算機視覺領域的不斷發展,運動目標檢測、人臉識別、指紋識別以及字符處理等領域得到廣泛應用,而目標特征的提取將是計算機視覺處理的關鍵步驟[1]。在字符處理領域,對漢字進行細化得到漢字骨架將是目標特征提取的重要手段,漢字細化一般是指在保證原漢字拓撲結構的情況下,刪除漢字周邊像素直至得到位于中心線的單像素漢字骨架,但漢字骨架的提取受細化算法規則的制約,易出現筆畫斷裂、像素冗余和漢字骨架存在毛刺等問題,影響漢字細化結果質量。因此,在保證漢字原始拓撲結構不變的情況下,對漢字進行細化來提取定位更精確的漢字骨架將成為字符處理領域研究的熱點問題[2]。

為適應技術發展的需求,國內外學者提出很多經典細化算法,包括:Hilditch細化算法[3]、Pavlidis細化算法、Zhang并行細化算法、Zhang-Suen細化算法等。

1 算法分析

1.1區域生長算法

區域生長算法是區域分割領域經典算法,該算法對每個區域指定種子作為當前區域的生長點,然后將種子點和周圍的像素點根據生長規則對比分析,并將符合條件的點放在一個集合繼續生長,直至沒有滿足生長規則的像素點,該算法可將具有不同特征的連通區域進行分割,并得到較精確的邊界信息和分割結果。其算法步驟為:

(1)首先算法需創建一個空白圖像,并指定一個種子點進行生長,該種子點放入棧中。

(2)將當前種子點和周圍像素點按照生長規則進行對比分析,并將符合生長規則的點壓棧,并在下次將該點作為種子點按照生長規則繼續生長。

(3)重復上述步驟,直到當棧中不存在種子點后停止生長,完成生長過程。

不難看出該算法是一種迭代算法,具有很好的分割效果,本文將引用區域生長算法并對區域生長算法進行改進,用于對漢字進行細化提取漢字骨架。

2 基于改進區域生長算法的漢字骨架提取

針對區域生長算法在對圖像進行處理時獲得精確的邊界信息和較好分割結果的優良特性,本文將對區域生長算法進行改進來獲得質量更佳的漢字骨架。其實現步驟如下:

(1)算法首先對漢字按照筆畫順序進行分解,來獲得漢字的全部分解筆畫。針對每個筆畫,在筆畫任意位置選擇種子點,并將種子點sp1壓入棧S中。

(2)根據設計的生長規則統計種子點周圍八鄰域像素點的個數,并根據八鄰域像素點個數判定當前點是否可壓入棧S中,具體生長規則如式(1):

式中,Num(sp1)表示當前種子點sp1八鄰域像素點的個數;(1,2)表示像素點個數為1或2;Grow表示當前點為種子點并壓入棧S中,同時以該點為生長點繼續按生長規則生長;Del表示當前點為非種子點,刪除該像素點。

(3)重復步驟(2)直到漢字所有筆畫都經過細化,得到所有筆畫的細化骨架。根據筆畫寬度和細化筆畫寬度比例關系[8],將得到細化筆畫相對于原筆畫的位置,即細化筆畫置于原筆畫的中心線位置。

(4)對筆畫按照漢字分解的順序進行合并,最終得到細化后的漢字骨架,完成漢字的細化。

3實驗結果分析

3.1實驗參數與評價指標

為驗證本文算法的有效性,在硬件配置為:Inter(R) Core(TM) i7-10510U,主頻為2.3GHz,內存為16GB;軟件配置為:Microsoft Visual Studio 2010和OPENCV2.4.10的實驗平臺進行實驗仿真。

3.2 實驗結果分析

本文基于改進區域生長法的漢字細化算法相較于Hilditch細化算法和Pavlidis細化算法,可保證細化后的文字骨架相對于原文字圖像拓撲結構不變,即保證漢字的原有特征不變,并很好的保持漢字T行交叉和拐點的連通性,克服畸變產生的影響。本文算法相較于Zhang并行細化算法和Zhang-Suen細化算法,可消除對漢字細化后出現冗余像素或像素骨架像素不單一的問題,同時本文算法可很好提取骨架的中心線結構,規避骨架毛刺的風險。綜上,本文基于改進區域生長算法的漢字骨架提取算法在保證漢字原有拓撲結構的基礎上可更精確的提取漢字的骨架,提高細化后漢字骨架的質量。

4 結論

本文提出一種基于改進區域生長法的漢字骨架提取算法。該算法首先對漢字按筆畫順序進行分解,得到該漢字的所有筆畫集合;然后,基于區域生長法的思想對每個筆畫選定種子點并按照設計的生長規則確定種子點繼續生長,并對刪除不滿足生長規則的像素點;最后,基于筆畫寬度和細化筆畫寬度比例關系,確定細化筆畫的中心線位置,并將所有筆畫按筆畫順序合并得到最終細化后文字骨架。本文算法可很好克服現有細化算法的不足,并獲得定位精度更高、質量更佳的漢字骨架。

參考文獻:

[1]耿藝寧,劉帥師,劉泰廷,嚴文陽,廉宇峰.基于計算機視覺的行人檢測技術綜述[J].計算機應用,2021,41(S1):43-50.

[2]董軍,蔣同海,艾孜麥提·艾尼瓦爾,程力,徐春.一種改進的哈薩克文編碼字符處理方法[J].中文信息學報,2017,31(04):94-99.

[3]韓東旭,鐘寶江.基于梯度掩模濾波的邊緣細化算法[J].激光與光電子學進展,2020,57(18):182-188.

猜你喜歡
細化
在融入鄉村振興中細化文明實踐
淺析人造板企業如何細化成本管理提升經濟效益
道路保潔“以克論凈”精細化管理的實踐和思考
淺談新教材下地理課堂教學的細化和補充
論初中英語教研工作中的“細”與“實”
點陣漢字細化算法及應用
用于提出負面評價的CA非優先結構的執行策略
活化教學目標,促進有效學習
基于分區梯度的醫學圖像邊緣檢測算法
細化定格,篩選凸顯
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合