?

人工智能識別與生成人類語言的研究綜述

2019-04-07 13:14林筱松
神州·中旬刊 2019年3期
關鍵詞:人工智能

林筱松

摘要:人工智能識別與生成人類語言是人工智能研究的一大領域,這是一門將計算機科學與語言學結合的技術。本文對其技術要求分為語音識別與合成、自然語言的識別與生成兩大類。語音識別與合成又分別從語音識別、轉換與合成三點進行詳細闡述;自然語言的識別與生成詳細介紹了自然語言處理和生成兩大技術。最后將各項技術有機結合并簡單地介紹了它的應用,同時對這一項技術在電子游戲領域進行了展望。

關鍵詞:人工智能;語言識別;語言生成

1 引言

人類在這顆蔚藍的星球上已經發展了25萬年了,人們通過自然語言進行交流、合作,人類的發展史也是各式各樣的自然語言的發展史。20世紀以后,隨著計算機和互聯網的出現、人工智能的快速發展,人們開始產生了與人工智能也用自然語言進行交流的想法。隨著人們的不斷探索,人工智能不僅學會了識別自然語言,人工智能的自然語言合成技術也逐漸走向成熟。

人工智能要能滿足與人類交流的需求,語音識別是必不可少的,尤其是自然語言,人工智能需要準確地處理自然語言,并能夠理解自然語言中所包含的意思,因此自然語言處理技術也應運而生。人工智能學會識別后便要進行轉換與合成,通過語音轉換和語音合成能夠很好地創造出新的聲音。如果將自然語言合成的技術應用進去,那么人工智能也能夠使用自然語言,成功實現與人類交流的目的。

2 人工智能概述

人工智能是一門以研究人類智慧為主,同時開發用于模擬、延伸及發展人類智慧的新興學科。人工智能從發展階段來說分為兩大類:強人工智能和弱人工智能。強人工智能可分為類人的人工智能和非類人的人工智能[1]?!邦惾恕鳖櫭剂x就是完全和人類生活方式相同,和人一樣有自我的推理和判斷意識。而“非類人”即與人類生活方式不同,也是有自主意識。這兩者不需要人類控制,只需根據先前已設定的指令進行自我調控。弱人工智能就是沒有自我意識,不能進行自我思考,需要人類來進行控制。人工智能是20世紀才出現的新興學科,但發展速度卻快得驚人。從1936年數學家圖靈提出人工智能,到20世紀五六十年代科研人員們進一步對人工智能這一陌生領域研究,再到1997年IBM公司研制的計算機“更深的藍”戰勝國際象棋冠軍,直至到2017年 AlphaGo以3:0完勝終結圍棋冠軍柯潔。雖然人工智能發展歷程快接近百年,但是我們仍舊處于弱人工智能時代。人工智能的迅速發展已運用于智能檢索、模式識別、智能推理、交通運輸、醫療服務等多種領域。人工智能已越來越貼近我們的生活[2]。

3 語音識別與合成

語音識別與合成是人工智能運用的一大領域,可以將其分為語音識別、語音轉換和語音合成等三個領域。

3.1 語音識別

語音識別是一項幫助計算機聽懂人類語言的技術。而它實際上是通過對人類所發出的聲音先進行接受,再根據本來就已設定好的程序進行分析識別。語音識別始于20世紀50年代初期。1952年,貝爾實驗室開發的Audry系統可識別0~9的發音;1956年普林斯頓大學RCA實驗室開發了單音節識別系統;1971年CMU打破了單音節識別的模式,成功研發了能識別一句話的系統Harpy并成功實現了隱馬爾科夫模型與人工神經網絡的運用;90年代語音識別進入市場逐漸開始普及;21世紀,語音識別嵌入芯片,各式各樣的語音識別軟件層出不窮,語音識別技術走向成熟。但語音識別仍舊有一些不盡如人意的地方。環境依賴性強,在嘈雜的環境中,根本無法準確識別;在語氣詞這些細節詞上還有所欠缺;識別速度也是一大急需被克服的難點。面對這些困難,應該進行更深入的研究,并從中探索奧秘,讓語音識別更好地服務于人類[3]。

3.2 語音轉換

語音轉換是一項保留原說話人語意信息,改變其個性化特征,使之具有另一個人個性化特征的技術。個性化特征并不是簡單地指人類語言的音色音調,它可以分成三類:音段特征,指共振峰的位置、共振峰的帶寬、頻譜傾斜、基音頻率、能量等;超音段特征,指音素的時長、基音頻率(就是音調)、能量等;語言特征,這個就是指各種方言、口語、口音等。語音識別還有多種應用領域:在電影電視劇中,經常會發現演員的聲音與現實生活中不一樣,但是沒差多少,這是因為配音將聲音錄制好后通過VC語音轉換使聲音具有演員的個性化特征。通過語音轉換將個性化特征改變,可以對說話人進行保密。對于聲道受損的人,語音轉換在很大程度上的改善了他的語音可懂度。當然,要實現語音轉換就需要經過訓練和轉換兩個階段。在訓練階段計算機對原說話人的語音和目標說話人的語音進行分析特征提取,再對他們的結果進行對齊,接著再進行訓練,最后按照語音轉換規則進行語音轉換進入轉換階段。在轉換階段中對原語音進行分析特征提取,再對訓練階段所產生的結果進行語音轉換,而后進行語音合成,最后轉換語音?,F在語音轉換功能并非十全十美,還是以音段轉換為主,對于超音段的研究甚至語言特征還不夠深入,所進行的語音轉換會引入一定的雜音,引起失真。但是目前的語音轉換對于人類的作用依舊舉足輕重,計算機可以對所識別到的語音進行更多樣式的處理與變化,使語音的功能與魅力大大增強。如果語音識別技術完善后,語音的未來會更加妙不可言[4]。

3.3 語音合成

語音合成是通過機械的、電子的方法產生人造語音的技術。語音合成已經有兩百多年的歷史了,它使計算機有像人一樣說話的能力。語音合成是TTS結構,主要是語言處理、韻律處理和聲學處理三部分。語言處理主要是對所接收到的語音信息進行詞句字義分析處理,同時為后兩部分作發音提示。韻律處理則是在旋律方面做修正,使語音能夠更好地展現它所要表達的意思。而聲學處理主要是輸出語音。計算機的語音合成就使用了輸出的功能[5]。

4 自然語言識別與生成

自然語言是指一種自然地隨著文化演化的語言,例如英語、漢語、法語等,是相對于C語言、Java語言等人造語言而言的。而要使人工智能能夠識別與生成人類語言,就要涉及到自然語言的處理與生成了。

4.1 自然語言處理

自然語言處理涉及到多種學科,也是計算機科學與人工智能這兩大領域的主要研究方向。它是讓人類能夠用自然語言與計算機進行通信的一門科學。自然語言又可以分為自然語言處理資源和技術。所謂資源就是計算機可以識別自然語言的詞典,就好比我們使用的各種字典。而技術還可以根據復雜程度和難度或自然語言處理層次和深度分成基本和高級兩種?;镜淖匀徽Z言處理就是指去除詞根、去除停止詞、詞性標注、分詞。而高級自然語言處理就實際到詞句了,例如短語識別、詞義消除、指代消除、概念抽取等。從1949年起,美國人威弗提出的機器翻譯設計方案到現如今自然語言處理系統能處理大規模的真實文本,能從自然語言文本中抽取有用的信息[6]。這整整70年的發展時間,自然語言處理仍有還未解決的難點:對于一些多義的詞,要能準確的識別它在這句話中所表達的意思;每種自然語言都有各自的語法,要在一篇文章中準確地剖析這句話;遇到方言或口音,甚至語法錯誤要能夠糾正并能識別出[7]??梢娮匀徽Z言處理這一大科學未來仍舊有很長的一條路要走,要繼續深入研究與試驗。

4.2 自然語言生成

自然語言生成是指使計算機能夠像人一樣擁有表達語言的能力的一門科學[9]。它是人工智能與計算機語言學的分支,相應的語言生成系統是基于語言信息處理的計算機模型,其工作過程與自然語言分析相反,是從抽象的概念層次開始,通過選擇并執行一定的語義和語法規則來生成文本。有了自然語言生成,計算機便擁有了“嘴巴”,可以用人類的語言和人類進行交流[10]。

5 總結與展望

人工智能識別與生成人類語音首先人工智能需要具有語音識別和合成技術。語音識別與合成中可分為語音識別、語音轉換和語音合成三部分。語音識別就相當于計算機的耳朵,就是計算機接受外界所傳遞給它的聲音信號,計算機對其進行處理、識別,明白聲音中所含信息。語音轉換就是將“耳朵”所接受到的信息進行分析特征,保留原有意思而改變個性化特征,讓聲音呈現出更多不一樣的精彩。至于語音合成,這就好比計算機的嘴巴,計算機通過計算與數據處理,將所要表達的信息通過語音的方式向外界輸出。這三項技術相輔相成,就像是構成了一個人[11]。

而人工智能為了滿足與人類交流的需求,自然語言的識別與生成這項技術便變得尤為重要,自然語言的識別與生成包括自然語言處理和自然語言生成兩大內容。自然語言處理技術的加入便相當于計算機又多學了一門語言,計算機可以經過數據的處理分析,來“理解”所接收的自然語言所要表達的意思。而自然語言生成技術,計算機可以通過它來合成自然語言,然后再向外界表達,與語音合成如出一轍。計算機有這兩項技術便可以直接與人類用自然語言進行交流。

在這高速發展的背景下,人工智能的發展也不例外,有了自然語言的識別與生成這一項偉大而又跨時代的技術,人類的生活會更加便利。而等到這一技術真正成熟后,可以將這一項技術放入客戶端電子游戲中去,這不僅可以使玩家們更加身臨其境,與NPC“面對面”交流,還可以使他們體驗高科技所帶來的便利,若在游戲中加入知識體系,還有一定的教育意義。當然,不僅僅是游戲,還可以應用于家用、醫療服務、環境保護等領域,有了自然語言的識別與生成這門技術,人類社會會變得更加神奇與精彩。

參考文獻:

[1]鄒蕾,張先鋒.人工智能及其發展應用[J].信息網絡安全,2012 (02):11-13.

[2]本刊編輯部.人工智能概述[J].保密科學技術,2017 (11):8-9.

[3]王敏妲.語音識別技術的研究與發展[J].微型機與應用,2009,28 (23):1-2+6.

[4]李波,王成友,蔡宣平,等.語音轉換及相關技術綜述[J].通信學報,2004 (05):109-118.

[5]李葵,徐海青,吳立剛,等.基于多情感說話人自適應的情感語音合成研究[J].湘潭大學自然科學學報,2018,40(04):39-44.

[6]王燦輝,張敏,馬少平.自然語言處理在信息檢索中的應用綜述[J].中文信息學報,2007 (02):35-45.

[7]徐戈,王厚峰.自然語言處理中主題模型的發展[J].計算機學報,2011,34 (08):1423-1436.

[8]張建華,陳家駿.自然語言生成綜述[J].計算機應用研究,2006 (08):1-3+13.

[9]于振龍.基于LSTM的自然語言生成技術研究與實現[D].北京郵電大學,2018.

[10]蔣茜謙.人工智能已經掌握人類語言了嗎[J].計算機與網絡,2018,44 (24):16-17.

[11]李佐文,嚴玲.什么是計算話語學[J/OL].山東外語教學,2018 (06):24-32.

猜你喜歡
人工智能
我校新增“人工智能”本科專業
用“小AI”解決人工智能的“大”煩惱
當人工智能遇見再制造
AI人工智能解疑答問
人工智能與就業
基于人工智能的電力系統自動化控制
人工智能,來了
人工智能來了
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合