?

人工智能時代,常識還重要嗎?

2024-04-22 12:03格爾德·吉仁澤
中歐商業評論 2024年1期
關鍵詞:常識直覺神經網絡

格爾德·吉仁澤

人腦是一個奇跡,擁有近1 000億個神經元和100萬億個連接,在數億年的進化中不斷微調。與當代計算機技術相比,人腦的能效也很高。超級計算機沃森在《危險邊緣》節目中耗能巨大,而它的兩個人類競爭對手的大腦各消耗了20瓦——相當于一個昏暗的燈泡。大腦的主要能量來源是葡萄糖。沃森還需要大量的空調設備,而在一年中最熱的日子里,它的競爭對手只需要一個手持式風扇就可以了。

常識的齒輪

人類智慧的進化是為了應對不確定性。人類為了在不確定的世界中取得成功而進化出的心理技能中,有四種最為突出。

一是因果思維。思考的能力很早就形成了。孩子們不斷地問“為什么”,他們想知道為什么天是藍的,為什么有些人有錢,為什么要吃蔬菜。孩子們提出的問題很多,有些問題父母回答不了。通過提問和思考,孩子們建立了世界的因果模型。對原因而不是單純的聯想感到好奇是人類高智商的特征,也是科學的標志。因果思維既是一種力量,也是一種迷信的來源,就像相信交叉手指會給你帶來好運一樣。

二是心理直覺。兒童在生命的最初幾年會發展出一種心理直覺。他們“知道”其他人有感情和意圖,他們可以從另一個人的角度思考。特殊的大腦回路似乎專門用于監控其他人的知識、想法和信仰。缺乏心理直覺是孤獨癥的標志。

三是物理直覺。同樣,孩子們會形成一種物理直覺來理解時間和空間的基礎知識。例如,他們知道一個固體不能穿過另一個固體,物體會隨著時間的推移而持續存在,而且時間不能逆轉。

四是社交直覺。孩子超過三歲時,他們被鼓勵遵循群體規范(合作和競爭)并學會遵循和捍衛道德標準。

筆者將這些技能的總和稱為“常識”?!俺WR是在生物大腦中實現的關于人類世界和物理世界的共享知識。常識只需要一定的經驗。它源于遺傳傾向以及個人和社會學習(例如知道世界是三維的,或者一個人不應該傷害他人的感情)?!?/p>

常識可以通過直覺或深思熟慮的判斷來實現。例如,大多數人可以準確分辨出真誠的微笑和僅僅出于禮貌的微笑,但無法解釋是怎么做到的。這就是直覺。然而,當一個人了解到,在真誠的微笑中,嘴和眉毛周圍的肌肉都會活動,而在禮貌的微笑中,只有嘴巴周圍的肌肉會活動時,這種洞察力就可以使大腦作出有意識的判斷。直覺和判斷不是相反的兩極,而是基于相同的過程,即相同的視覺線索。

對于從事人工智能開發的人來說,常識是一個巨大的挑戰。即使是對于由文字和圖片代表的社會和物理世界中的物體的基本理解也是如此。我們還沒有通過規則或通過創建能夠學習常識的深度神經網絡將常識編入計算機程序中。感覺運動技能是另一大挑戰。盡管人工智能可以在國際象棋上擊敗人類,但無法將棋盤從架子上拿下來,擺放好棋子。目前仍然很難制造出像小提琴手一樣可以靈活移動手指的機器人,或者像人類一樣可以完成所有家務的管家機器人。在缺乏這些技能的情況下,解決方案之一是重新設計我們的生活空間以適應人工智能。

計算機在以下方面有著出色表現:一是快速計算,快速計算是搜索引擎和國際象棋計算機的命脈;二是在大數據中尋找關聯,計算速度的提高也使得搜索大型變量集之間的關聯成為可能,三是檢測圖像或聲學信息中的模式,算法可以檢測圖像中的模式,比如基因組和天文觀測,這些都是人眼很難發現的。

然而,快速計算能力本身既不能產生因果思維,也不能產生心理直覺、物理直覺或社交直覺。我們看一些具體例子,人類智慧和機器智能之間的差異就變得更加清晰。

語言翻譯

在將文本從一種語言轉換為另一種語言時,譯者需要在理解源語言的同時更好地掌握目標語言,以便表述習語和反諷。這就是為什么專業翻譯人員通常會將母語作為譯入語。制造翻譯機器的最佳方法是什么?如果你遵循心理人工智能程序,那么你會將專業譯者和語言學家聚集在一個房間里,試著把他們的直覺和判斷轉換成可以編入軟件中的規則。但這本身并不十分有效。語言不是一個定義明確的規則系統:單詞不僅有一個含義,而是有多個含義,正確的含義不能簡單地在字典中查找,而必須從上下文和對說話者的了解中推斷出來。同樣,語法規則也不是絕對的,而是經常被打破的。另一種選擇是忘掉人工翻譯之美,聘請軟件工程師,利用強大的計算能力來分析數十億頁譯本中單詞和句子之間的統計關聯。規則和統計始終是關于如何制造翻譯機器的兩個主要思想。

前沿計算機翻譯系統的最大優勢在于數量和速度。好的系統可以在幾分鐘內翻譯一百多種語言的文本,速度驚人,出色的多語言翻譯超出了人類的能力。相比之下,理解文本和高質量翻譯并不是其優勢。常識也不是。計算機在翻譯時會毫不猶豫地給出“我的金魚對著狗吠”這樣的話。職業譯者會被嚇一跳,因為他們懂得金魚不會吠的因果關系。

然而,神經網絡甚至不知道單詞指代何物,只是將詞與詞聯系起來,而不是將詞與想法聯系起來。因此,機器翻譯既有非常準確的譯文,也有令人驚訝的怪誕錯誤。

缺乏常識是所有翻譯系統都存在的嚴重問題。例如,備受贊譽的翻譯系統DeepL 將英語“Pope shot”翻譯為德語“Papstschuss”,再將德語“Papstschuss”回譯為英語時變成了“Papal shot”。這些系統試圖識別需要一起翻譯的整個單詞序列或整個句子,而不是像過去那樣在字典的幫助下逐字翻譯。但譯文質量也取決于來源:如果互聯網上有許多針對特定句子或主題的糟糕翻譯,那么DeepL的翻譯質量也會很差。盡管現在的翻譯軟件已發展得相當不錯,但這并不意味著它們具備常識。沒有理解,再好的翻譯系統也是一個白癡學者。

人工智能缺乏常識,這不僅限制了它在翻譯方面的應用,也限制了它在自然語言理解方面的應用。人們在給出主張的理由時,其有效性不僅取決于理由,還取決于通常不言而喻的“依據”。例如:

主張:你應該帶傘。

原因:正在下雨。

依據:弄濕了不好。

“依據”是人類直覺世界知識的一部分,而機器沒有這些直覺。但是,如果像上面那樣簡化任務并明確提供依據,深度神經網絡能否確定主張是否合理?為了測試這種能力,可以使用如上支持主張的依據,也可以使用不支持主張的依據(“弄濕是件好事”)。在一項研究中,谷歌廣受好評的神經網絡BERT(以《芝麻街》中的完美主義角色命名)對77%的類似問題判斷出了是否有依據提出該主張。鑒于沒有任何準備的普通人只有3%的準確率,BERT的工作確實出色。

然而,先別著急得出網絡已經學會了像人一樣理解自然語言的結論,我們應該三思而后行。要做到這一點需要常識和知識——比如雨水會把我們弄濕,雨傘可以保護我們不被淋濕。那么,BERT 究竟學到了什么,才會如此成功?在更深入研究后,該研究的發起者發現了這個神經網絡的秘密:在訓練和測試該網絡的一組數據中,BERT發現當依據中包含“不”時,主張通常是正確的,如上例所示。按照這種方法,它在大多數情況下得到了正確的答案。然而,這種發現相關性的卓越能力與真正抓住論點無關。重新表述依據,刪除其中的“不”后,該網絡給出正確判斷的概率并未高出隨機判斷。研究小組得出的結論是,神經網絡理解語言的驚人表現可以歸因于找到虛假線索的能力。

物體識別

當一個小女孩指著一只狗說“狗狗”,指著一只貓說“貓咪”時,她就認出了不同類別的動物。物體識別是人類的一項基本能力。抽象、思考和決策等更高層次的認知能力都離不開它。兒童學習認知一個類別所需的實例數比深度神經網絡要少得多。后者需要在監督學習中看成千上萬張狗和貓的圖片。孩子可能只需要看一次或幾次小貓,就能在不同的光照條件下認出貓。如果三歲的孩子在路上看到一輛自行車,并被告知這是一輛自行車,那么從那以后,孩子很可能會認出各式各樣的自行車。筆者同事的兒子在兩歲時就成了汽車愛好者,可以認出街上的各種寶馬汽車,甚至是他以前從未見過的車型。孩子似乎并不是生來就有這種一次性的學習能力,而是在出生后的30個月內習得的。

人類的感知系統具有很強的適應性,可以在不斷變化的光照、情景和背景下識別物體。為了應對這種不確定性,大腦使用的不是一條路線,而是多條路線。一條路線被阻塞,它會選擇另一條路線。大腦的高度靈活性使其可以根據現有情況而依賴不斷變化的線索作出決策,這被稱為“替代功能”。大多數生物系統具有這種功能。例如,候鳥飛行數千英里,可以靠星星導航。如果是陰天,它們可能會依賴地標或磁感應。

場景識別

與識別人、物體或狀態之間的關系相比,識別物體相對簡單。這里的問題是:場景中發生了什么?人類通常借助直覺心理學和直覺物理學來推斷答案。算法如何作比較?

讓我們看看為生成圖像說明而訓練的深度神經網絡在識別因果關系方面的表現。圖 1展示了得克薩斯州好萊塢主題公園的牛仔特技表演。它演繹了一個典型的西部老電影中的暴力場景,一個歹徒被套索拖在馬后面,背景是游客正在觀看表演。神經網絡“看到”了什么?深度神經網絡生成的圖片說明是“一個在土路上騎馬的女人”。深度神經網絡識別的對象大多是正確的——馬和泥土(很難看到馬上是男人,盡管這可以從西部片的標準情節中推斷出來)。然而,從圖片說明可以看出,深度神經網絡并不知道場景中發生了什么。它沒有心理直覺,所以無法推斷出馬背上的人是打算懲罰另一個人,以及該場景是表演的一部分。它也無法理解因果關系,不知道這種懲罰可能是致命的。

不同的想法

人類智慧在于表現世界,建立因果模型,并將意圖賦予其他生物。為此,人們會將圖片與實物區分開來,比如知道圖片上的人不是真人,盡管兩者有時會引發相似的情緒。相比之下,深度神經網絡學習將圖像與標簽或標題相關聯,但不知道圖像指的是現實世界中的某個人或物體。AlphaGo及其接替產品比人類冠軍下棋下得更好,卻不知道它們在下圍棋,而Siri和Alexa等數字助理也不知道什么是餐廳。它們不知道這些有關系嗎?

如果你只問數字助理附近有沒有最好的意大利餐廳或類似的問題,就沒有關系。然而,當系統被允許自動作出關乎生死的決定時,意識是極其重要的,比如軍用無人機、機器人士兵和其他致命的自主武器。機器可能知道如何殺人,卻不知道它在做什么以及為什么要這樣做。更重要的是,這些機器可能會以我們想象不到的方式出錯。

提到深度神經網絡的表現,筆者首先想到的人是所羅門·舍雷舍夫斯基,他是俄羅斯著名的記憶學家,筆者的《直覺思維》一書的讀者都知道他。他的記憶力似乎是無限且持久的。

舍雷舍夫斯基閱讀完一頁文章后,可以逐字逐句地回憶,正著背和倒著背都可以。但當被要求總結他所讀內容的要點時,他或多或少會有點不知所措。他無法判斷歧義詞,無法處理有多種含義的詞和有相同含義的不同詞,更不用說隱喻和詩歌了。舍雷舍夫斯基可以準確回憶起一個復雜的數學公式,即使他無法理解(當然,公式是編造的),并且在15年后還記得很清楚。他的思維與象棋大師截然不同,象棋大師也能完美地回憶起復雜的棋局,但前提是棋局有意義,而不是隨意配置的。舍雷舍夫斯基努力從瑣碎的信息中提取出重要的東西,并在抽象的層面進行推理。

進化本可以給我們所有人完美的記憶力,但代價高昂,舍雷舍夫斯基就是明證,他不會遺忘。盡管他強大的記憶力令人羨慕,但他被無關的細節分散了注意力,這與深度神經網絡被添加到手寫數字中的無關像素或被人們T恤衫上的色塊分散注意力不同。他可能是最接近神經網絡的人類,在存儲和處理大數據方面非常出色,但很難理解這一切的真正含義。

猜你喜歡
常識直覺神經網絡
“好一個裝不下”直覺引起的創新解法
靠不住的常識
林文月 “人生是一場直覺”
一個“數學直覺”結論的思考
神經網絡抑制無線通信干擾探究
近視600度以上,這5條常識務必知道
數學直覺謅議
基于神經網絡的拉矯機控制模型建立
復數神經網絡在基于WiFi的室內LBS應用
回歸常識
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合