?

機器翻譯淺析

2017-05-22 15:47趙丹
北方文學·中旬 2017年5期
關鍵詞:局限性實例神經網絡

趙丹

隨著計算機技術的不斷發展與更新,機器翻譯行業內部也產生了巨大變化,本文將針對機器翻譯的歷史起源和發展現狀做進一步探究,通過對實例的分析,辨析機器翻譯取代人工翻譯的必然性,也指出機器翻譯暫時存在的不可克服的弊端,而作為過渡時期的機輔翻譯在翻譯過程中起到了不可忽視的作用。

一、機器翻譯的定義與歷史

機器翻譯,又稱為自動翻譯,是利用計算機將一種自然語言(源語言)轉換為另一種自然語言(目標語言)的過程。隨著經濟全球化及互聯網的飛速發展,機器翻譯技術在促進政治、經濟、文化交流等方面起到越來越重要的作用。

機器翻譯的研究歷史可以追溯到 20 世紀三四十年代。20世紀30年代初,法國科學家G.B.阿爾楚尼提出了用機器來進行翻譯的想法。1933年,蘇聯發明家П.П.特羅揚斯基設計了把一種語言翻譯成另一種語言的機器,并在同年9月5日登記了他的發明。1946 年,第一臺現代電子計算機 ENIAC 誕生,隨后不久,信息論的先驅、美國科學家 W. Weaver 和英國工程師A. D. Booth 在討論電子計算機的應用范圍時,于1947年提出了利用計算機進行語言自動翻譯的想法。1949年,W. Weaver 發表《翻譯備忘錄》 ,正式提出機器翻譯的思想。

二、機器翻譯工作原理與現狀

機器翻譯的基本思想是利用計算機對自然語言進行翻譯,而各種機器翻譯系統采用的技術和理念不盡相同;面對各種各樣的機器翻譯系統,文獻上有各種分類方式。

現有的機器翻譯系統按照其基本工作原理,可以分為基于規則的機器翻譯,基于實例的機器翻譯和統計型的機器翻譯這三種基本類型。(一)基于規則的機器翻譯系統的機器翻譯方法又可以分為三類:直接翻譯法,中間語言法和轉轉換法。(二)基于實例的機器翻譯要通過實例庫的構成,語料拆分的碎片化問題及實例庫定制實現。(三)統計型機器翻譯系統。

三、機器翻譯的成就與展望

幾年前,翻譯界的大師謝天振教授曾在上海外國語大學高翻學院的實習基地承接了聯合國的一項任務:在兩個小時內完成將近三萬字的一篇會議文件翻譯。一位讀者看后曾質疑此時的真實性,該讀者的眼光仍用傳統翻譯的思維方法來想象今天的實用文獻、文件的翻譯流程。其實由于聯合國文件的表述有較高的重復率,該基地多年從事聯合國文件翻譯又積累了一個豐厚的語料庫,因此譯員們在按下一個鍵時顯示屏上出現的不只是一個字,而是一個短語或一個句子,甚至是一個段落?,F代科技的發展,已經極大地改變了翻譯的面貌,雖然這個例子不完全是機器翻譯的成功案例,但卻是機輔翻譯的利用達到最大化。最近谷歌漢譯英改用了神經網絡技術,這是統計方法的一種具體的實現方式,想著機器翻譯的不斷發展也許有一天可以讓機器獨立完成翻譯任務。

四、機器翻譯的局限性

統計翻譯的基本思路是“照貓畫虎”,即在系統見識了海量范文之后,用這個辦法的確可以完成大量翻譯工作,但這不意味著統計翻譯可以完全取代人的翻譯工作。這些局限性是不能被現有的神經網絡翻譯的進展所克服,某些小改動可以緩解一些困難,如對訓練樣本加標記,把翻譯單位從單句擴大到多句等等,但這些都不足以徹底解決問題。神經網絡翻譯的上述問題可以總結為一點:這種翻譯過程沒有包括對語句內容及其所屬的言語行為的理解。

五、結論

機器翻譯在經濟社會發展中起到了越來越重要的作用,在文化信息傳播中做出了巨大貢獻。機器翻譯有它固有的局限性,完全的自動化機器翻譯還很遙遠,其仍然面臨著許多瓶頸。但機器翻譯在這短短的五十年間發生的巨大變化,我們是無法否認的。經濟基礎決定上層建筑,如若人們的需求達到一定程度,機器翻譯必然會取代人工翻譯。

參考文獻:

[1]馮志偉.機器翻譯:從基于規則的技術到基于統計的技術.《2010年中國翻譯職業交流大會論文集》,2010.

[2]Charniak E. Statistical Language Learning. Cambridge, MA: MIT Press,1993.

[3]劉群.機器翻譯原理與方法講義.2009.(Lecture)

猜你喜歡
局限性實例神經網絡
神經網絡抑制無線通信干擾探究
自動化事實核查的前景及局限性
基于神經網絡的拉矯機控制模型建立
胸腹部局限性Castleman病的CT特征
復數神經網絡在基于WiFi的室內LBS應用
我國公共行政的系統分析:可行性、必要性及局限性
基于支持向量機回歸和RBF神經網絡的PID整定
“最近發展區”理論及其在教學中的局限性
完形填空Ⅱ
完形填空Ⅰ
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合