?

基于Android圖文同步識別系統研究

2016-11-09 22:40薛峰朱強
數字技術與應用 2016年9期

薛峰 朱強

摘要:伴隨越來越多的人利用手機等移動設備處理日常工作以及生活中的各種事宜。本文基于Android系統技術平臺對圖文同步識別系統進行分析和研究,針對圖形和文字不太規范,圖文識別系統不明顯等缺陷提出了相應的改進方案,盡可能對圖文進行同步預覽以及識別,結合系統實際運行過程中存在的問題,提出消噪、亮度均衡、閾值分割等質量提升處理措施,保證圖文信息的識別率得到提升。

關鍵詞:Android應用系統 圖文同步 識別系統

中圖分類號:TP391.41 文獻標識碼:A 文章編號:1007-9416(2016)09-0058-02

如何利用Android系統對軟件進行研究和開發,逐漸成為目前相關領域工作人員需要研究和思考的問題,系統架構和開發模式將會對系統最終的運用成果產生直接的影響,智能手機系統中研究和開發所得的尚書七號、ABBYY FineReader都運用在手機掃描設備中。但是,其便捷性相對較低,而且圖文信息處理較為繁瑣,無法滿足對文字進行識別和記錄的需求,通過對終端設備圖文信息進行識別能解決大型設備移動難度大、使用步驟繁雜等劣勢,讓辦公和移動學習更加順利進行。

1 系統知識理論

當前使用Android手機平臺能夠在一定程度上達到OCR等功能要求,通過這種移動系統使用和開發能夠方便對各種不同接口函數進行使用,對各種不同的硬件設備進行調用,并實施編程開發,在對系統進行開發是要能夠加大對相關開發工具的使用,包括Android SDK、Java JDK和Eclipse等。

1.1 JAVA技術支持

Java屬于一種面向對象的編程語言。當前使用的主要目的就是讓程序開發者能夠一次完成編寫,從而順利運行,這就標志著從一個平臺轉移到另外平臺,不需要對代碼進行重新編譯,Java應用程序一般會翻譯成字節碼,因此,無論哪種計算機體結構在所有的Java虛擬機上使用。Java語法來自于C++,但是,存在的差異的是配合語法結構化,一般面對對象編程,Java是作為一種面向對象的構成因素,一切的代碼都屬于類范圍、對象除了浮點、整形、字符、布爾型,Java也改變了C++中會出錯的指針、goto語句以及全局變量等。

1.2 Android編程技術

現階段Android系統所具有的內核控制包括儲存器、安全、進程、驅動程序模型和網絡堆疊等幾種。Android構件包括Linux Knrnel、Libraries、Applications等。針對移動設備應用程序來分析,界面設計給用戶留下的首個印象關鍵點界面設計效果將會對用戶的選擇造成直接影響,Android工具開發期間提供了直接簡單的設計方法和界面布局,開發者使用設計UI界面、XNL文件開發、利用簡單有效的操作能夠對交互按鈕進行增加,對布局位置進行設計,對圖片和文字格式進行調整,這種邏輯控制分開、界面設計從根本上提升了編程效率,程序員可以利用邏輯實現進行考慮。

2 程序設計

2.1 OCR功能模塊

(1)預處理。預處理也是保證ORC功能模塊實現的首要步驟,也是后期對圖文信息進行操作的條件,因為圖文信息受到自然環境因素的影響,包括空氣中下雨、灰塵、光照缺乏、收集設備硬件的影響,從而讓圖文信息中的圖文達到更加清晰。[3]所以,在對文本圖像進行相應的識別和處理之前,首先要能夠對其圖文實施預處理,盡可能排除各種不良干擾因素可能會對識別結果造成的影響。(2)字符處理。在進行字符處理也是該程序相對重要的一個步驟,正確科學的字符處理也是保證相關功能、用戶體驗效果得到提升的主要途徑,一般基本類型的核心所在就是OCR算法,該種算法能夠出現相應的候選字符分級列表,包括特征提取和矩陣匹配兩種。[4]Tesseract和Cuneiform兩種不同的軟件的使用可以通過相應的方法來完成字符識別,其中第二種方法也稱之為自適應識別,并且利用能夠更好地對第二次剩余的字母可信度形狀進行認可。

2.2 系統設計

系統選擇層次式的設計結構,如下圖1所示,頂層屬于用戶操作的UI交互界面,主要是負責和用戶的觸屏點擊等操作、識別結果進行顯示。下面層次則是系統功能模塊層,負責對業務邏輯進行處理,包括同步、批量以及聯網識別等。同步識別模式包括對預覽圖文進行同步連續識別,用戶在對拍攝圖文進行預覽的過程中能夠看到相應的識別效果;批量識別模塊能夠對批量圖文進行一次性識別,利用一鍵來獲得電子書的效果;聯網識別則能夠對服務器端口進行識別接口,讓性能較低的移動終端獲得相應的支持;最后的圖文處理層則主要是結合手機或者其他移動終端拍攝圖文顯示出的特點,結合圖文的實際狀況來提升引擎文字所具有的識別率,讓圖文能夠更容易被識別。針對處理之后的圖文文字實施文字識別,并且識別所得的結果返回到UI交互界面。

對軟件圖標進行點擊之后就轉入到功能選擇系統,更好地完成實時、批量識別工作,全面系統地閱讀文檔資料。觸摸面上面設置的圖標一旦遭到觸發就會讓功能事件發生,并開始操作實時識別,通過單張圖片、連續圖片拍攝識別技術產生相應的功效,配合實際識別、手機聯網等問題選擇是否能夠利用網絡進行識別,并將獲得的結果轉變為文檔信息資料。[6]通過系統本身所具有的批量識別技術挑選出需要調整的圖文資料,配合圖文的信息、質量來選擇是否進行聯網識別操作,結合儲存位置選擇文檔,并將其打開閱讀,完成相關操作之后則認為操作結束,返回到選取功能的界面,實際操作如圖2所示。

3 系統實現

首先為預覽圖文同步識別,因為手機硬件之間存在差異,對圖片的實際識別和處理速度、連續拍照時間間隔都存在較大的差異,因此,在對圖文信息進行連續采集時不可能對固定時間間隔進行設定,避免出現文字信息識別、圖文顯示不對稱等現象。所以,系統利用Android系統所提供的接口條件,在實際拍攝獲得的預覽圖文幀信息,保證圖文顯示以及識別結果能夠達到需求。其次,在對單張拍攝圖文進行識別時,通過對取景框觸碰來達到指定對焦的目的,按下拍照按鈕就能夠得到關于圖文處理的相關數據,還能夠在提升質量、識別處理工作之后在文檔編輯框顯示識別結果。[7]因為拍攝單張圖文識別并非需要對圖文數據進行聯系采取,圖文從獲取到識別都是順序完成,所以,只要選擇單線程就能夠獨立完成。最后,文檔閱讀模塊能夠為用戶提供更多的文檔編輯和查閱操作,包括內置和外置閱讀器,利用相應的系統選擇需要查閱的文檔,并將其內容讀取到編輯框中加以顯示,可進行編輯保存等。

4 結語

該系統的研究和開發基本上滿資料查閱、場景記錄等需求,利用OCR手機字符增強識別的方法能夠讓用戶需求得到更好地滿足,人性化體驗的增加具有顯著的市場價值,系統實現圖文字符識別以及圖文處理要求,但是,其存在一定的缺陷,例如技術不成熟、處理適度較慢,所以,需要對系統功能進行繼續完善,對代碼質量進行優化,這也是后期的研究發展方向。

參考文獻

[1]楊飛,茅和華,溫一軍.基于Android的隨身客戶信息管理系統的設計與開發[J].沙洲職業工學院學報,2012(04):11-16.

[2]任偉嘉,何志毅,陳名松.Android平板電腦無線控制的計算機演示系統[J].計算機工程與設計,2015(02):556-561.

[3]王國裕,李玄華,張紅升. Android應用框架層usb驅動設計及在DAB接收機上的應用[J].電子質量,2015(03):26-29.

[4]孔令來,王倩,季紅.基于Android系統平臺設計和實現電子書的閱讀應用[J].電子制作,2013(24):50-55.

[5]鮑曉.基于Android平臺的新聞資訊閱讀軟件的設計與實現[J].計算機應用,2013(S2):279-282+289.

[6]朱應麗,崔彥軍,解建軍.基于Android平臺的信息采集傳輸系統設計[J].電腦與信息技術,2014(02):4-7.

[7]陳望挺,林滿足,陳健,章躍,傅奇佳,竺樂慶.基于JSP和Android的C/S結構問卷系統[J].計算機應用,2013(03):886-889.

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合