?

基于組合分類算法的源代碼注釋質量評估方法

2017-01-13 01:24余海李斌王培霞賈荻王永吉

計算機應用 2016年12期

關鍵詞：質量評估文本分類自然語言處理

余海+李斌+王培霞+賈荻+王永吉

摘要：源代碼注釋是軟件的重要組成部分，研究者往往需要利用人工或自動化的方法產生分析注釋，注釋的質量評估也往往是通過人工來完成，這無疑是低效不客觀的。為此，首先從注釋的格式、語言形式、內容以及與代碼相關度4個方面出發構建注釋評估準則；進而，基于這一準則提出了一種基于組合分類算法的注釋質量評估方法。該方法將機器學習以及自然語言處理技術引入到注釋質量評估中來，利用分類算法將注釋分為不合格、合格、良好、優秀四個等級。通過對基本分類算法的組合使用，使得評估效果進一步提高。組合分類算法的準確率和F1值較單獨使用某一種分類算法提高20個百分點左右，除宏平均F1值外，各項指標都達到了70%以上。實驗結果表明，所提方法能夠很好地應用于注釋質量評估。

關鍵詞：源碼注釋；質量評估；文本分類；組合算法；自然語言處理

中圖分類號：TP311

文獻標志碼：A

文章編號：1001-9081（2016）12-3448-06

猜你喜歡

質量評估文本分類自然語言處理

基于貝葉斯分類器的中文文本分類

電子技術與軟件工程(2016年22期)2016-12-26

基于蟻群智能算法的研究文本分類

數字技術與應用(2016年9期)2016-11-09

基于K—means算法的文本分類技術研究

科教導刊·電子版(2016年23期)2016-10-31

文本分類算法在山東女子學院檔案管理的應用

科技視界(2016年24期)2016-10-11

面向機器人導航的漢語路徑自然語言組塊分析方法研究

電腦知識與技術(2016年10期)2016-06-16

詞向量的語義學規范化

求知導刊(2016年10期)2016-05-01

漢哈機器翻譯中的文字轉換技術研究

電腦知識與技術(2016年5期)2016-04-14

中國上市公司會計信息質量研究

中國市場(2016年5期)2016-03-07

HowNet在自然語言處理領域的研究現狀與分析

科技視界(2016年5期)2016-02-22

澳大利亞研究生課程的外部質量評估

世界教育信息(2015年22期)2016-01-06

計算機應用2016年12期

計算機應用的其它文章: 全卷積網絡結合改進的條件隨機場循環神經網絡用于SAR圖像場景分類; 大輸液異物檢測圖像快速位移補償方法; 基于軟件層次化模型的軟件測試數據生成; 基于軟件代碼演化信息的克隆譜系提取方法; 克隆代碼有害性預測中分類不平衡問題的解決方法; 基于用戶興趣遷移的Web日志仿真生成算法

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合