秦 穎,文秋芳,梁茂成
摘要:試卷自動評分研究中有個十分重要卻常被忽略的環節———對于雷同內容的自動檢測。翻譯考試的雷同譯文與一般的重復文檔有著不同的特點。通過對比各種文檔相似算法,最終選擇了特征碼的方法用于檢測漢譯英雷同譯文,并結合翻譯考試的特點,提出了隨機特征碼的方法,解決了特征碼選取位置難以確定的問題,同時降低了特征碼對于編輯差異的敏感度,提高了雷同內容檢測的查準率和查全率。該算法的復雜度為線性,適用于大規模翻譯試卷的快速檢查。
關鍵詞:自動評分;雷同內容檢測;文本相似度;特征碼
外語電化教學2009年6期
1《安徽建筑》2024年3期
2《人生與伴侶·共同關注》2024年3期
3《花卉》2024年8期
4《天津教育》2024年8期
5《現代經濟信息》2024年5期
6《世界熱帶農業信息》2024年3期
7《家庭醫學》2024年2期
8《中國中醫藥現代遠程教育》2024年10期
9《英語教師》2024年5期
10《城市建設理論研究(電子版)》2024年12期