徐士博 李雨陽 鄭 順 王紹卿
(山東理工大學計算機科學與技術學院,山東 淄博 255049)
為加強常態化疫情防控工作[1,2],落實疫情防控要求,對于擬進入校園的教職員工、外地返校的學生,或校外人員,很多學校要進行健康碼[3]、行程卡[4]、48小時核酸陰性檢測結果[5](以下簡稱“三碼”)的檢驗,三項信息符合標準,才可以進入校園。傳統的人工信息核驗過程慢,且人為核驗容易出現紕漏。另外,人工核驗不能自動生成報表,更不便于對歷史數據進行管理,比如不能快速摸排近14天入校人員的到訪城市信息。本文設計并開發入校信息自動核驗系統,利用計算機運算速度快、精確度高的特點,實現三碼信息的收集、提取、存儲、自動核驗、數據可視化展示等功能,極大地提高了入校信息核驗工作的效率,有效地助力了高校的常態化疫情防控工作。
入校信息核驗系統包括三級用戶:超級管理員、部門管理員和入校人員。超級管理員用于開通每個部門的管理員賬號和唯一的三碼提交URL;部門管理員對本部門的人員進行名單管理、查看今日入校核驗結果和詳情、查閱歷史數據和可視化的結果等;入校人員主要是完成個人三碼截圖的提交。
系統主要包括四個功能模塊:入校信息收集、關鍵信息提取、統計與報表、數據可視化。系統采用B/S架構,結構如圖1所示。
圖1 系統結構
根據每個部門專屬的提交URL,擬入校人員使用手機應用程序,如微信、QQ、瀏覽器等,將三碼截圖提交到系統。其中,因手機截圖文件的尺寸較大,為減少服務器空間占用,在存儲到服務器前,系統對截圖文件進行自動壓縮。
對擬入校人員提交三碼截圖文件,系統采用OCR技術對圖像中的文字信息進行識別,并提取和存儲關鍵信息。其中,日期、時間、身份證號、手機號等信息采用正則表達式進行提取。
統計與報表模塊主要包括今日入校詳情、未提交名單和核驗未通過名單。今日入校詳情以列表形式展示三碼截圖中包含的關鍵信息,以及自動核驗的結果。未提交名單用于展示部門內哪些成員沒有提交三碼截圖,便于部門管理人員督促。核驗未通過名單用于向上級部門進行報表,不僅包含相關的姓名、聯系方式等基本人員信息,還包括核驗未通過的原因,如酸陰性證明超過48小時等。
數據可視化模塊主要對歷史數據進行可視化展示,用于管理部門整體掌控所有入校人員的相關信息。其中提交次數可視化采用散點圖的形式,提交時間可視化采用柱狀圖的形式,到訪城市可視化采用二級地圖的形式展示入校人員近期的旅居地,這為后期的常態化的中高風險地區旅居史摸排工作提供了數據支撐。
入校信息核驗系統的數據庫選擇使用當前主流的MySql數據庫。系統的數據庫中主要包含admin、department、person、enterInfo四個表。admin表要存儲各個部門相關的部門編號、用戶名、密碼等信息。department表主要存儲部門的部門編號、部門名稱等信息。person表主要包括部門現有人員的學號/工號、姓名、身份證號、電話等信息。enterInfo表主要存儲入校人員三碼關鍵信息,以及對應的自動核驗結果等數據。數據庫系統的E-R圖如圖2所示。
圖2 E-R圖
擬入校人員使用手機端應用程序打開部門專屬的URL,輸入個人信息和選擇三碼截圖。然后,系統自動對截圖文件進行OCR識別,并提取關鍵信息。
對抽取的三碼信息進行自動核驗,用紅色顯著地標注核驗不通過信息。對于部分特殊情況,比如全員核酸后用戶上傳完成檢測的貼紙照片而導致的識別異常,部門管理員可以打開用戶三碼截圖文件進行人工校對。
系統根據當天用戶提交的情況,與數據庫中的名單進行自動比對,生成沒有提交入校信息的人員名單報表,以及提交但審核未通過的人員名單報表。報表生成過程中自動關聯相關人員的身份、聯系方式等信息。
系統將各類處理好的數據導入可視化模型中,生成散點圖、柱狀圖、地圖等多種樣式的圖形化界面,清晰地展示入校人員信息提交時間和次數、到訪城市等信息,為中高風險地區旅居史摸排提供數據支持。
Paddle OCR是一個實用的超輕量級OCR技術,擁有識別速度快、準確率高的特點,可以滿足三碼信息的識別需求。為應對多用戶并發提交,系統設計多線程[6]并行識別技術加速文字識別。
三碼中的關鍵信息主要包括三類:個人信息、日期時間和結論信息(如綠碼、核酸陰性等)。系統采用正則表達式從OCR識別出的文字內容中進一步抽取這些關鍵信息。正則表達式的靈活性、邏輯性和功能性較強,可以迅速地用極簡單的方式達到對字符串的復雜控制。
本系統采用ECharts,以正則表達式處理后的數據為基礎,來進行數據的可視化工作。ECharts可以提供直觀,生動的數據可視化圖表,極大地方便了管理者對入校人員的三碼信息的查看。
入校信息核驗系統已經正式運行一個多月,從系統運行情況來看,一方面,核驗準確性高,反饋迅速,大大縮短了各部門在入校信息核驗工作上的時間,提高了工作效率。另一方面,歷史數據可追溯,強化了各級部門的責任。該系統有效地助力了高校的常態化疫情防控工作,為堅決打贏疫情防控阻擊戰提供了技術支持。