?

入校信息核驗系統的設計開發

2022-02-16 12:13徐士博李雨陽王紹卿
科技視界 2022年28期
關鍵詞:入校核驗報表

徐士博 李雨陽 鄭 順 王紹卿

(山東理工大學計算機科學與技術學院,山東 淄博 255049)

0 引言

為加強常態化疫情防控工作[1,2],落實疫情防控要求,對于擬進入校園的教職員工、外地返校的學生,或校外人員,很多學校要進行健康碼[3]、行程卡[4]、48小時核酸陰性檢測結果[5](以下簡稱“三碼”)的檢驗,三項信息符合標準,才可以進入校園。傳統的人工信息核驗過程慢,且人為核驗容易出現紕漏。另外,人工核驗不能自動生成報表,更不便于對歷史數據進行管理,比如不能快速摸排近14天入校人員的到訪城市信息。本文設計并開發入校信息自動核驗系統,利用計算機運算速度快、精確度高的特點,實現三碼信息的收集、提取、存儲、自動核驗、數據可視化展示等功能,極大地提高了入校信息核驗工作的效率,有效地助力了高校的常態化疫情防控工作。

1 系統的功能設計

入校信息核驗系統包括三級用戶:超級管理員、部門管理員和入校人員。超級管理員用于開通每個部門的管理員賬號和唯一的三碼提交URL;部門管理員對本部門的人員進行名單管理、查看今日入校核驗結果和詳情、查閱歷史數據和可視化的結果等;入校人員主要是完成個人三碼截圖的提交。

系統主要包括四個功能模塊:入校信息收集、關鍵信息提取、統計與報表、數據可視化。系統采用B/S架構,結構如圖1所示。

圖1 系統結構

1.1 入校信息收集

根據每個部門專屬的提交URL,擬入校人員使用手機應用程序,如微信、QQ、瀏覽器等,將三碼截圖提交到系統。其中,因手機截圖文件的尺寸較大,為減少服務器空間占用,在存儲到服務器前,系統對截圖文件進行自動壓縮。

1.2 關鍵信息提取

對擬入校人員提交三碼截圖文件,系統采用OCR技術對圖像中的文字信息進行識別,并提取和存儲關鍵信息。其中,日期、時間、身份證號、手機號等信息采用正則表達式進行提取。

1.3 統計與報表

統計與報表模塊主要包括今日入校詳情、未提交名單和核驗未通過名單。今日入校詳情以列表形式展示三碼截圖中包含的關鍵信息,以及自動核驗的結果。未提交名單用于展示部門內哪些成員沒有提交三碼截圖,便于部門管理人員督促。核驗未通過名單用于向上級部門進行報表,不僅包含相關的姓名、聯系方式等基本人員信息,還包括核驗未通過的原因,如酸陰性證明超過48小時等。

1.4 數據可視化

數據可視化模塊主要對歷史數據進行可視化展示,用于管理部門整體掌控所有入校人員的相關信息。其中提交次數可視化采用散點圖的形式,提交時間可視化采用柱狀圖的形式,到訪城市可視化采用二級地圖的形式展示入校人員近期的旅居地,這為后期的常態化的中高風險地區旅居史摸排工作提供了數據支撐。

2 入校信息核驗系統的實現

2.1 構建入校人員信息庫

入校信息核驗系統的數據庫選擇使用當前主流的MySql數據庫。系統的數據庫中主要包含admin、department、person、enterInfo四個表。admin表要存儲各個部門相關的部門編號、用戶名、密碼等信息。department表主要存儲部門的部門編號、部門名稱等信息。person表主要包括部門現有人員的學號/工號、姓名、身份證號、電話等信息。enterInfo表主要存儲入校人員三碼關鍵信息,以及對應的自動核驗結果等數據。數據庫系統的E-R圖如圖2所示。

圖2 E-R圖

2.2 三碼截圖的收集和關鍵信息的提取

擬入校人員使用手機端應用程序打開部門專屬的URL,輸入個人信息和選擇三碼截圖。然后,系統自動對截圖文件進行OCR識別,并提取關鍵信息。

2.3 信息核驗和校對

對抽取的三碼信息進行自動核驗,用紅色顯著地標注核驗不通過信息。對于部分特殊情況,比如全員核酸后用戶上傳完成檢測的貼紙照片而導致的識別異常,部門管理員可以打開用戶三碼截圖文件進行人工校對。

2.4 比對名單生成報表

系統根據當天用戶提交的情況,與數據庫中的名單進行自動比對,生成沒有提交入校信息的人員名單報表,以及提交但審核未通過的人員名單報表。報表生成過程中自動關聯相關人員的身份、聯系方式等信息。

2.5 數據可視化展示

系統將各類處理好的數據導入可視化模型中,生成散點圖、柱狀圖、地圖等多種樣式的圖形化界面,清晰地展示入校人員信息提交時間和次數、到訪城市等信息,為中高風險地區旅居史摸排提供數據支持。

3 系統關鍵技術

3.1 多線程文字識別

Paddle OCR是一個實用的超輕量級OCR技術,擁有識別速度快、準確率高的特點,可以滿足三碼信息的識別需求。為應對多用戶并發提交,系統設計多線程[6]并行識別技術加速文字識別。

3.2 關鍵信息的提取

三碼中的關鍵信息主要包括三類:個人信息、日期時間和結論信息(如綠碼、核酸陰性等)。系統采用正則表達式從OCR識別出的文字內容中進一步抽取這些關鍵信息。正則表達式的靈活性、邏輯性和功能性較強,可以迅速地用極簡單的方式達到對字符串的復雜控制。

3.3 數據的可視化

本系統采用ECharts,以正則表達式處理后的數據為基礎,來進行數據的可視化工作。ECharts可以提供直觀,生動的數據可視化圖表,極大地方便了管理者對入校人員的三碼信息的查看。

4 結語

入校信息核驗系統已經正式運行一個多月,從系統運行情況來看,一方面,核驗準確性高,反饋迅速,大大縮短了各部門在入校信息核驗工作上的時間,提高了工作效率。另一方面,歷史數據可追溯,強化了各級部門的責任。該系統有效地助力了高校的常態化疫情防控工作,為堅決打贏疫情防控阻擊戰提供了技術支持。

猜你喜歡
入校核驗報表
2020年度新聞記者證核驗人員名單公示
停下!請接受身份核驗
《金橋》2020年度新聞記者證擬通過年度核驗人員名單公示
《中外玩具制造》編輯部2020 年度核驗新聞記者證公示名單
LabWindows/CVI中Excel報表技術研究
北京大學:“刷臉入?!遍l機西南門試運行
從三大報表讀懂養豬人的成績單
我校省內外護理新生入校適應情況調查
月度報表
月度報表
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合