?

基于MATLAB的圖片中字符的分割與識別

2016-10-14 00:32張雯李浩進
科學與財富 2016年28期
關鍵詞:字符識別

張雯+李浩進

摘 要:本文主要介紹字符識別的基本原理,并且利用MATLAB工具軟件實現圖片中字符的分割和識別,對于滿足一定要求的圖片可以實現字符的分割與識別 ,通過圖像讀取,圖像預處理,圖像投影,字符分割,字符識別五個步驟實現.

關鍵詞:圖像預處理;字符分割;字符識別

Abstract:this paper mainly introduces the basic principle of character recognition, and using MATLAB tool software to realize the image segmentation and recognition of the characters, pictures to meet certain requirements to achieve character segmentation and recognition, image reading, image preprocessing, image projection, character segmentation and character recognition five steps.

Keywords:Image preprocessing;Character segmentation;Character recognition

0.引言

近年來,字符分割和識別的技術發展,其中最廣泛的應用是停車場出入口車輛牌照的識別結合計算系統自動確定車輛在停車場中停留的時間,付費金額.大大提高了停車場的運行效率和信息的準確性.以及在公路上實現取證拍照,監控道路違規行為,已經發展成為智能交通中不可或缺的一部分, 通過引入數字攝像技術和計算機信息管理技術,采用先進的圖像處理 模式識別和人工智能技術,通過對圖像的采集和處理,獲得更多的信息,從而達到更高的智能化管理程度。

1.字符識別原理

目前用于字符識別(OCR)中的算法主要有基于模板匹配的OCR算法以及基于人工神經網絡的OCR算法。

1.1 基于模板匹配的OCR的基本過程是:首先對待識別字符進行二值化并將其尺寸大小縮放為字符數據庫中模板的大小,然后與字符庫中的所有的模板進行匹配,選最佳匹配作為識別結果。

1.2用人工神經網絡進行字符識別主要有兩種方法:一種方法是先對待識別字符進行特征提取,然后用所獲得的特征來訓練神經網絡分類器。識別效果與字符特征的提取有關,而字符特征提取往往比較耗時。字符特征的提取主要方法是充分利用神經網絡的特點,直接把待處理圖像輸入網絡,由網絡自動實現特征提取直至識別。本文主要研究基于模版匹 配的字符識別技術。

2.字符識別流程

2.1圖像預處理

在讀取到圖像后進行灰度化,二值化,對比度增強,腐蝕,膨脹,濾波等處理增強圖象。

2.2字符分割和識別

由于灰度圖像只有0和1兩種取值,先進行像素點的差分運算,尋找突變位置,截取第一行字符,再截取后面各行字符拼接到第一行字符上,橫向連接圖像塊,以第一行字符為基準,對其余的字符進行歸一化大小,進而和字符模版庫中的字符大小相匹配。

3.效果圖

4.結語

利用MATLAB軟件,對圖片中文字進行識別,為了提升檢測結果的準確率,通過大量的數據進行試驗,并且對出現的錯誤檢測分析圖片中字符的結構,進行代碼優化,單一背景的圖片背景的處理過程簡單,僅僅需要圖片灰度化處理,二值化處理,然后進行水平方向上整行文字的分割,再進行垂直方向上的分割,特殊字體上下結構,左右結構,左中右結構,上 中下結構如“非”,“船”,“品”通過正向延拓尋找小于 3 的點,再反向延拓尋找小于 3 的點,可以實現該類字體的切割。但是沒有加入對斜體字的矯正,因此對于該類字體的檢測結果錯誤率比較高。

參考文獻

[1]朱小燕,史一凡,馬少平.手寫體字符識別研究[J].模式識別與人工智能.2000.

[2]張圻中.漢字識別技術[M].北京:清華大學出版社,1992.

[3]王 勇,吳立德.圖像恢復和邊緣提取的后驗均值方法.電子學報,1994,22(2):70-75.

[4]阮秋琦.數字圖像處理學.北京:電子工業出版社,2001.317-320.

[5]T, Kasar, Font and Background Color Independent Text Binarization. ICDAR 2005.

猜你喜歡
字符識別
一種改進深度學習網絡結構的英文字符識別
車牌識別系統的設計與實現
基于深度學習法的視頻文本區域定位與區別
融合字符及字符排列特征的銘牌識別方法
一種基于OpenCV的車牌識別方法
儀表字符識別中的圖像處理算法研究
一種實用的金融票據框線去除算法
紙幣冠字號提取的方法研究
基于CUDA和深度置信網絡的手寫字符識別
機加工件點陣字符識別研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合