?

基于人工智能技術的計算機輔助翻譯軟件設計和實現

2024-02-03 08:52邸一鳴
信息記錄材料 2024年1期
關鍵詞:測試用例術語譯文

邸一鳴

(山西大學自動化與軟件學院 山西 太原 030031)

0 引言

在信息時代背景下,人工智能技術的出現和應用,可以有效地解決傳統翻譯模式存在譯文精確度低、翻譯速度慢等問題。 該技術在具體應用中,通過構建新型神經網絡體系,靈活運用深度學習模式,對數據庫中的相關術語進行深入地分析和挖掘,從而達到智能化、精確化翻譯的目的[1]。 現階段,國內應用人工智能技術,完成了對計算機輔助翻譯軟件的初步設計。 從理論角度分析,不難發現,應用人工智能技術,雖然可以確保系統翻譯效率和翻譯精確度提高,但是該系統仍存在功能單一、翻譯范圍小、翻譯精確度較低等問題[2],為實現對系統功能的優化和完善,充分發揮和利用人工智能技術的應用優勢,如何設計一款新型、先進的計算機輔助翻譯軟件是技術人員必須思考和解決的問題。

1 系統總體設計

1.1 系統架構設計

該系統架構在具體設計時,除了用到MySQL 數據庫外,還用到ElasticSearch 數據庫,有效地保證了系統作業數據支撐力,通過運用檢索模塊、索引模塊,可以確保數據庫與各個功能進行有效地連接[3],從而實現對用戶、項目、術語庫、翻譯等模塊的智能化管理。 系統架構設計示意見圖1。

圖1 系統架構設計示意圖

1.2 系統運行環境搭建

1.2.1 硬件環境

在搭建系統硬件環境時,技術人員應嚴格按照如表1所示的硬件環境,將應用服務器、數據庫服務器CPU 統一設置在Xeon16.0 G 以上;將其內存統一設置為120 G。 同時,還要將兩種服務器的硬盤指標分別設置為3 000 GB以上和20 T 以上。 此外,還要將客戶端機器的CPU、內存、硬盤分別設置為IntelG2022 以上、20 G 和500 GB以上。

表1 硬件環境表

1.2.2 軟件環境

在搭建系統軟件環境時,技術人員要重點做好對java標準版開發包(Java development kit,JDK)、中間件、程序開發、數據庫、數據連接模式、開發工具、編程語言等工具的配置和選用,為后期系統功能設計提供良好的開發環境。軟件環境如表2 所示。

表2 軟件環境表

2 系統功能模塊設計

為了充分發揮和利用人工智能技術的應用優勢,提高計算機輔助翻譯軟件的穩定性和實用性,技術人員應要嚴格按照如圖2 所示的系統功能模塊,完成相應功能的有效設計。 這些功能在實際設計中,主要選用Eclipse 開發工具和JAVA 編程語言,并綜合運用動態網頁開發(java server pages,JSP)技術、Spring 技術和Hibernate 技術三種Web 展示技術。

圖2 系統功能模塊設計示意圖

2.1 用戶管理功能設計

用戶管理功能主要用于對用戶個人信息、操作權限等信息的有效管理,要求用戶成功注冊系統,并輸入正確的賬號和密碼后,方可正常登錄和訪問系統,從而保證系統作業的可靠性和安全性。 為保證用戶個人信息管理的安全性,運用單向散列算法(message?digest algorithm 5,MD5)[4],將密碼存儲形式設置為20 位“數字+字母”形式,要求用戶在注冊系統時,要做好對登錄密碼的設置,這為后期系統登錄提供驗證依據。 在進行操作權限管理時,要結合用戶登錄身份差異性,為不同用戶有針對性地設置相應的操作權限,從而實現對系統項目的安全化訪問。

2.2 項目管理功能設計

在不同操作項目中,用戶所對應的參與角色不同,需要賦予的翻譯權限也會存在很大的不同。 在設計項目管理功能時,需要結合系統翻譯需求[5],完成對原文集合和譯文集合的有效創建,同時,還要調用和訪問相應的數據庫,實時獲取和整理術語信息,這為后期系統譯文的自動化生成提供重要的依據和參考。 當用戶將譯文操作請求提交和傳輸到系統服務器時,通過應用該功能模塊,可以實現對相關術語的自動化匹配,同時,用戶結合這些術語,調用相應的數據庫,并建立相應的索引關系。 在此基礎上,結合系統所提供的關鍵詞,可以實現對重要詞句譯文信息的有效提取和整理,為后期翻譯功能的設計提供重要的數據支持。

2.3 術語庫管理功能設計

術語庫管理功能在具體設計時,為解決因詞匯量多而導致系統翻譯效率低下問題,需要確定出詞句、上下文銜接相關翻譯標準,并增添合適的固定譯文方法,然后,采用術語翻譯法,獲得高準確率的譯文。 此外,為保證固定用法翻譯質量,需要將常用譯文標注到常見的翻譯文本中,以達到優化譯文結構的目的[6]。 在相同文本環境中,一旦出現大量的重復術語,需要將術語庫標定為最終翻譯結果,此時,當系統提取和識別到該術語時,系統會對詞匯的譯文進行自動化補充和處理,從而有效地提高系統翻譯效率。

2.4 翻譯功能設計

系統翻譯功能主要是指對需要翻譯的語句進行拆分,使其拆分為若干個詞匯,并結合關鍵詞匯,完成對系統數據庫的調用,此外,還要輸入和檢索關鍵詞,實時獲取和整理關鍵譯文內容。 該功能在具體設計時,要根據不同語境的特點[7],有針對性地篩選出符合當前語境的譯文,此時系統會自動將譯文加載到系統翻譯結果中,并將翻譯結果呈現在顯示區域中,同時,結合句子結構特點,不斷地優化和完善譯文,確保所形成的最終翻譯結果具有較高的精確度。

翻譯功能主要包含以下兩個子模塊:(1)翻譯模塊。翻譯模塊主要是指對句子進行拆分,使其拆分為多個分句,然后對分句繼續拆分,使其形成多個短句,并對這些短句進行有效的遍歷,當短句遍歷操作結束后,從系統數據庫中尋找匹配度較高的翻譯結果。 (2)索引模塊。 索引模塊主要用于對翻譯文本對的創建[8],并采用索引處理方式,對翻譯文本進行自動校對,確保所獲得的譯文具有較高的關聯度,從而最大限度地提高系統翻譯效率。

2.5 校對功能設計

校對功能主要用于對語句含義一致性、語句長短一致性的有效校對,有效地提高系統譯文的精確度。 結合句子結構特點,對句子進行有效拆分,使其拆分為多個子模塊,然后,對比和分析各個模塊翻譯情況。 一旦翻譯前句子和翻譯后句子存在不一致問題,系統會自動在翻譯文本中進行標記,并彈出“報錯”對話框[9],提醒用戶重新翻譯,如果用戶所輸入的字段超出系統默認翻譯范圍,系統會自動生成相應的翻譯結果,并顯示出“僅供參考”標記字樣。該功能開發主要包含以下三個層次:(1)底層。 底層屬于校對功能的基礎層,主要用于對中文和英文相關文本信息的有效處理,底層主要涉及英文句子切分、詞性標注、中文分詞、命令識別等操作。 (2)中層。 中層主要涉及術語提取、情感分析、句長檢測等操作,該層次按照所設置好的邏輯關系,完成對所需術語的有效提?。?0],并校對處理術語表達正確性,同時,還要將情感分析、句長檢測這兩種操作設置為校對標準,保證句子完整度和表達方式的合理性。(3)頂層。 頂層主要用于對系統翻譯結果的校對、作業命令的下發以及校對結果的顯示。

2.6 檢驗與索引功能設計

通過應用該功能模塊,可以將數據庫與其他翻譯操作進行有效地結合,并結合系統翻譯需求,完成對數據庫索引關系的有效創建,然后,調用和訪問所需要的翻譯信息,并智能化執行翻譯作業。 在進行翻譯作業時,為保證系統翻譯結果的精確度,需要創建索引當前譯文相關信息,同時,還要構建數據庫表結構,確保數據庫表結構含有龐大的索引關系。 另外,通過設置檢驗功能,可以將數據庫與校對模塊進行有效地連接,從而實現對相關命令的安全化傳輸。

3 系統測試

3.1 測試用例設計

在測試系統功能是否正常運行時,測試人員要采用黑盒測試法,重點測試和分析系統登錄模塊、系統提交模塊。在設計測試用例時,首先,要將系統測試貫穿到整個系統開發周期中,及時發現和修改系統錯誤問題,提高系統運行性能。 其次,在正式進入測試用例設計之前,要確定出系統預期輸出結果,然后,檢驗和分析系統實際輸出結果是否與預期輸出結果相一致,一旦發現不一致問題,需要及時改進和優化系統錯誤問題。 最后,為保證測試用例設計質量,除了要做好對合法輸入測試用例的設計外,還要科學地設計非法測試用例,只有這樣,才能科學有效地驗證系統功能實現效果。 系統登錄模塊和提交模塊的測試用例分別如表3、表4 所示。

表3 系統登錄模塊測試用例

表4 系統提交功能測試用例

3.2 測試結果

通過測試系統部分功能,發現系統實際輸出結果與預期輸出結果完全一致,不存在功能異常、缺陷問題,這表明:該系統功能運行正常、穩定,完全符合預期設計標準和要求。

4 結語

綜上所述,為改善和優化傳統軟件操作系統功能,應用人工智能技術,并結合翻譯實際需求,設計一款功能強大、實用性強的計算機輔助翻譯軟件。 該系統重點應用MySQL 數據庫和ElasticSearch 數據庫兩種數據庫,為系統數據增刪改查提供強大的數據支撐,系統測試結果表明:該系統功能均能正常、穩定地運行,可以為用戶提供精確度較高的翻譯結果,完全符合實際應用需求。

猜你喜歡
測試用例術語譯文
Stem cell-based 3D brain organoids for mimicking,investigating,and challenging Alzheimer’s diseases
基于SmartUnit的安全通信系統單元測試用例自動生成
譯文摘要
基于混合遺傳算法的回歸測試用例集最小化研究
I Like Thinking
基于依賴結構的測試用例優先級技術
有感于幾個術語的定名與應用
從術語學基本模型的演變看術語學的發展趨勢
軟件回歸測試用例選取方法研究
譯文
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合