?

結合問句相關度計算的FAQ系統設計

2016-07-06 17:30胡闊慧
2016年21期
關鍵詞:人工智能

胡闊慧

摘 要:隨著計算機技術、自然語言理解技術和人工智能技術的發展,我們生活中隨處都可以看到FAQ系統。它涉及的領域越來越多,包括智能咨詢領域、人工智能領域、培訓教育領域等,隨著其深入應用到生活中,用戶對其答案的準確度和系統友好性要求越來越高。本文在前人研究的基礎之上利用問句相似度計算結合問句相關度進行FAQ系統設計,主要是通過問句的語義相關度對問句進行計算,最終從知識庫中返回用戶需要的答案。

關鍵詞:FAQ系統;問句相關度;問句相似度;人工智能

一、前言

FAQ系統通過一問一答的形式與提問者進行交流,目前對提問者提問的語句進行計算的方式有兩種,一種是基于問句相似度的方式對用戶的問題進行分析,然后給出答案,該種方式的準確率目前可以達到80%左右,一種是根據提問者提問問句中詞匯的相關度對用戶的問句進行計算,該種方式的準確率同樣也在80%左右。

本文主要對在結合問句相關度計算的FAQ系統進行分析,分析的問題計算的方式是采用基于語義相關度的方式結合問句相關度對用戶的問題進行計算,來反饋給用戶正確和期待的答案。該種結合問句語義相關度的計算方式能夠滿足用戶在人機交互方面的需求,使FAQ系統變得更加人性化,更能夠滿足用戶的需求。目前在各個公共場所都能夠看到FAQ系統的存在,例如醫院、購物商場、學校、政府大廳等,用戶通過FAQ系統可以得到自身所需要的信息,同時對答案的準確性要求也變得相對較高,他們在提問的同時不僅僅關注某一個問題的準確性,他們更希望通過問題的關聯性來獲取相應的答案。為了滿足用戶該方面的要求,所以本文對FAQ系統研究與設計具有非常重要的意義。

二、FAQ系統介紹

FAQ系統即問答系統,其主要是通過一問一答的形式進行問題的展示和提供指導服務。FAQ系統是目前自然語言理解領域研究和關注的重點,該類系統的特點是允許用戶通過自然語言進行問題的提問,系統對用戶輸入的自然語言進行處理,最終返回用戶需要的答案。目前國內和國外的學者對于FAQ系統的研究主要集中在以下三類中:特定領域內的FAQ系統、全領域開放式FAQ系統以及基于用戶常見問題集的FAQ系統。

一般的FAQ系統在進行用戶問題處理和答案反饋時一般要經過:問句理解、問句處理、反饋答案。其中問句處理包括漢語分詞、問句中關鍵詞提取、對提取的關鍵詞進行同義詞替換、通過相似度算法對答案進行計算、對用戶的問題進行記錄、反饋最接近用戶想要的答案。

目前存在的FAQ系統有完全單機版的,即采用管理員實現收集的知識庫來為用戶進行服務,也有基于網絡的FAQ系統,該種FAQ系統依靠互聯網強大的知識庫,對答案信息進行抓取來解答用戶的問題。專家認為一個成熟,能夠進行應用的FAQ系統至少能夠對用戶提出的問題的百分之八十進行解答,即使不能解答的問題也能夠找出相應的相似問題進行解答。再進行FAQ系統應用后不僅能夠方便用戶對相應的知識信息進行了解,同時也能夠解放一部分人力,節省機構、高校等的開支,提高用戶對于機構和高校的滿意度。

三、系統設計

語義相關度是一個綜合而且相對模糊的概念,它既包括問句之間的相關度計算又包括問句之間的相似度計算。本文設計的語義相關度計算算法在基于問句語義表征計算的相似度算法之上,添加了前后問句之間的相關度計算。添加相關度計算的目的是使計算的準確率更高、問答系統的友好性更好。

第一,用戶首先需要輸入中文問句,系統在用戶輸入中文問句后對問句進行處理,得到問句的“語義表征”和“問句類型”。

第二,系統會對用戶輸入的問題進行判斷,如果用戶是首次使用我們設計的FAQ系統,那么就不存在前后問句關聯性的問題。系統將通過用戶的問句的語義表征直接進行問句相似度計算,返回用戶所需要的答案。

第三,如果經過判斷,用戶輸入的問題不是第一個問題,那么系統會對用戶目前輸入的問題和前一個問題進行相關度計算;然后形成信息的問句語義表征,最后再進行問句相似度計算。

注:在系統進行問句相關度計算和相似度計算的過程中,都運用了我們建立的領域關鍵詞詞典,目的是提高系統的準確率。

本文設計的結合問句語義相關度計算的FAQ系統的具體流程如下圖所示

圖1 結合問句語義相關度計算的FAQ系統流程圖

四、語句相關度計算

詞語之間的相關度是指兩個詞語之間的相關程度,例如:“統計大學”與“軟件學院”在一定程度上具有一定的相關度,因為后者屬于前者,目前進行詞語相關度計算的算法很多,例如基于《知網》的詞語相關度計算、面向語義消岐的詞語相關度計算算法等。

第一,相關度計算算法是在用戶進行問題輸入的過程中進行的,如果用戶輸入的是第一個問題,不存在該算法的計算流程。該算法只負責計算用戶輸入第一個問題后的后續問句。

第二,有兩個概念需要注意,即何為完整問句?何為不完整問句?

完整問句:我們根據本文建立的領域關鍵詞樹來定義完整問句和不完整問句,問句中包含領域關鍵詞樹的第一,第二,第三層中的一個詞以及第四層中的一次詞,就可以定義為完整問句。這里需要注意,必須包含第四層中的詞。例如:“同濟大學軟件學院簡介?”包含了第一層中的詞“軟件學院”;第四層中的詞“簡介”。所以該問句為完整問句。

不完整問句:是指不包括第一層,第二層或是第三層中的詞,只包括第四層中的詞。例如:“簡介?”就是一個不完整問句。只包含第一層,第二層或是第三層的詞也是一個不完整問句。例如:“統計大學人文學院呢?”就是一個不完整問句。

第三,首先系統會對用戶輸入的問句QuesList2進行預處理,得到該問句的語義表征以及問句的類型。對QuesList2進行判斷,判斷其是否為完整問句,如果QuesList2為完整問句,那么直接利用其語義表征進行問句相似度計算;否則進入(4)。

第四,對QuesList1和Quextion2的問句語義本文在前人研究的基礎之上以及對目前流行的互聯網旅游管理系統進行分析,目前基于互聯網建設的旅游管理系統應該是一款能夠提供全方位服務的信息管理系統??偨Y歸納出一個基于互聯網的旅游管理系統應該的具有的功能至少包括:新聞管理功能、酒店預訂功能、旅游線路預定功能、景區訂票功能、簽證服務功能、留言提問功能、會員注冊功能、短信群發功能、郵件群發功能、在線支付功能、SEO優化功能、優惠返利功能、車票飛機票代購功能。

(作者單位:同濟大學)

參考文獻:

[1] 李雅靜.新型高端旅游人才創新開發使用模式研究[D].北京交通大學,2014.

[2] 張俠.都市旅游發展與政府職能研究[D].華中師范大學,2009.

[3] 龐彤彤.國家旅游線路評價與初步設計[D].中國海洋大學,2010.

[4] 凌琳.地理信息系統(GIS)在旅游業中的應用研究[D].復旦大學,2009.

[5] 梅杏莉.基于C/S和B/S混合型結構的主題公園營運管理信息系統研究[D].暨南大學,2006.

[6] 舒永鋼.WebGIS旅游信息搜索功用研究及應用[D].浙江工商大學,2012.

猜你喜歡
人工智能
我校新增“人工智能”本科專業
用“小AI”解決人工智能的“大”煩惱
當人工智能遇見再制造
AI人工智能解疑答問
人工智能與就業
基于人工智能的電力系統自動化控制
人工智能,來了
人工智能來了
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合