?

AI,無處不驚喜

2023-03-22 10:02本刊綜合
發明與創新 2023年11期
關鍵詞:人臉機器語音

本刊綜合

近日,一款名為ChatGPT的智能聊天機器人“火爆”全網,掀起了人工智能(AI)新的浪潮。ChatGPT的厲害之處在哪?除了跟人聊天,AI還在哪些領域表現優異?AI會取代人類嗎?……本期,讓我們在一個個具體的應用場景中,感受AI技術“狂飆”的速度!

同學們,你們了解人工智能嗎?簡單來說,人工智能是研究和開發能模擬、擴展人類智能的理論、方法、技術及應用系統的一門新的技術科學,其研究的目的是促使智能機器會聽、會看、會說、會思考、會學習、會行動。

1956年,約翰·麥卡錫、馬文·明斯基等科學家在美國達特茅斯學院開會研討“如何用機器模擬人的智能”,首次提出“人工智能”這一概念。如今,60多年過去了,以深度神經網絡為代表的人工智能技術飛速發展,實現了從“不能用、不好用”到“可以用”的技術突破,在繪畫、文學創作、視頻、音頻等方面不斷帶給人們驚喜。

AI繪畫

2022年8月,游戲設計師杰森·艾倫的繪畫作品《太空歌劇院》獲得了新興數字藝術家競賽“數字藝術/數字修飾照片”類別一等獎。據報道,參賽者沒有繪畫基礎,是通過AI繪圖軟件Midjourney耗時80個小時才創作出了該作品。

圖1 《太空歌劇院》

近年來,AI繪畫成為國內外社交網絡爭相討論的熱點話題,各類AI繪畫平臺紛紛涌現。借助AI繪畫軟件,哪怕是繪畫“小白”,只需要動動手指,輸入幾個關鍵詞或直接輸入相關圖片,再選擇自己喜歡的畫風和視角,AI“畫師”便可自動生成一幅筆觸細膩、構圖精美的畫作。

AI繪畫本質上是通過人工智能算法作畫,其創作過程是AI系統通過學習大量的人類繪畫作品數據,從而對繪畫產生一定的趨向性認識,繼而從已有的圖像中提取數字特征,并根據訓練圖像的風格創建一幅新畫。

這種模式也使AI繪畫無法對最終生成的結果進行精準控制。在網絡上,類似“狗狗變美女”“男生變女生”等AI繪畫“翻車”現場比比皆是,它們在讓人忍俊不禁的同時,也暴露出AI繪畫距離真正被人類利用還有一段路程要走。

AI寫作

2017年,微軟亞洲研究院研發的AI“小冰”出版了人類歷史上第一部人工智能詩集《陽光失了玻璃窗》,其中包含139首現代詩;2018年,AI創作的第一部小說1The Road出版;2022年,谷歌子公司DeepMind發布劇本寫作模型Dramatron,它能從用一句話表述的戲劇沖突中生成劇本標題、角色、場景、對話;等等——越來越多的AI文學創作案例進入公眾視野。

圖2 《陽光失了玻璃窗》封面

你們一定會好奇,AI的寫作能力究竟如何?有人在AI中文詩歌自動生成系統——“九歌”上進行了測試。該系統由清華大學團隊研發,由多個專門為中文詩歌生成設計的深度學習模型組成,運用超過30萬首古人詩作進行訓練,支持生成集句詩、絕句、詞等不同體裁的詩歌。

測試者以“池塘”和“春雨”為主題詞,讓“九歌”創作一首五言絕句,系統迅速給出了以下答案:“春雨暗池塘,垂楊扶短墻。月明山色淡,風靜水聲涼?!边@首詩對仗工整,意境優美,由此可見,AI創作的詩歌達到了一定的水平。

不過,雖然人工智能可以根據算法邏輯模仿人類創作出文藝作品,但它無法模擬人類基于歷史經驗、生命體驗而產生的情感與意識,更難像人類那樣睹物思人、托物言志。這是目前人工智能無法創作出偉大作品的重要原因。

AI換臉

一提到“AI換臉”,就不得不提Deepfake技術。Deepfake是由“deep machine learning”(深度機器學習)和“fake photo”(假照片)等意義組合而成的一個詞,可以理解為機器通過深度學習而制造出假照片、假視頻等虛假產物。該技術最常見的應用就是“AI換臉”,即在視頻中將一個人的臉部移植到另一個人的臉上。

圖3 (圖/圖蟲創意)

換臉時,機器先要識別出人臉的位置。由于換臉用的素材與待換臉視頻中的人臉的朝向、表情等往往不同,因此,識別出人臉位置后,機器要進一步對人臉進行校準。通過尋找面部具有鮮明特征的區域,機器可以確定每一幀畫面中人臉的朝向、表情,進而將待換臉視頻中需要插入的人臉與素材匹配。

AI“合音”

AI技術的迅速發展使得人機交互變得越來越頻繁,“語音合成”作為人機交互中的重要一環,可使人類與計算機的交流更加方便。

語音合成又稱文語轉換,是將輸入的文字信息轉化為可聽的、連續的語音,賦予機器“說”的能力。在語音合成技術領域,國內的科大訊飛公司一直保持著領跑者的地位。

目前,科大訊飛通過將發音內容、情感、音色進行解耦,實現了對情感及音色的自由控制并輸出合成語音,讓智能語音更具“人味”。不同的行業可根據自身的特點和應用場景進行選擇。如講座類場景可選擇音色穩重又有親和力的發音;面對小朋友,發音者的音調可以更加活潑;在新聞播報場景中,有力量感、莊重的聲音則更加合適。

AI聊天

2022年12月,美國人工智能公司OpenAI發布了自然語言生成式模型ChatGPT,這是一種基于GPT-3(生成式預訓練模型)技術的聊天機器人,它可以通過人工智能模型來與用戶對話,并自動理解用戶的問題,提供更精確、更有價值的信息。

相比GPT-3,該模型回答問題的方式更加貼近人類,具備記憶能力,可實現連續對話,同時還具備修改代碼、撰寫論文、詩歌創作等能力。

圖4 (圖/圖蟲創意)

雖然ChatGPT表現突出,但也引發了不少爭議。有人認為它會成為高校學生寫論文、考試的“作弊神器”,也有人認為它代表了人機協同的未來趨勢。

復旦大學計算機科學技術學院副院長彭鑫表示,ChatGPT可被看作是一個智能助手或一個聰明的秘書,它非常擅長分析、整合既有的知識,并通過人機對話的方式不斷生成文本內容?!皡^別于此前常見的分析決策型AI,如人臉識別,ChatGPT屬于所謂的生成式AI,代表了目前以大數據和大算力為基礎的深度學習技術發展新高度?!?/p>

與其他AI應用一樣,ChatGPT在為用戶提供方便的同時也面臨諸多法律風險和安全、倫理方面的挑戰,如何對相關技術進行監管,從而讓人們更好地利用新興技術,是全社會今后需要思考的問題。

小編說:除了以上這些應用,人工智能還在多個領域大放異彩:在交通領域,無人駕駛技術方興未艾;在醫療領域,醫生能在人工智能的輔助下更快、更準確地得出診斷結果;在家居領域,掃地機器人等已走入尋常百姓家;在教育領域,教師利用人工智能提高教學效率,越來越多的學生了解、學習人工智能相關知識;等等。

值得贊賞的是,有的青少年充分發揮自己的創造力,發明出很多與人工智能相關的作品。如長沙市雷鋒中學唐琮浩、謝涵制作的“人工智能交互式飲水機”就曾在第121屆巴黎國際發明展上斬獲大獎。

相信在未來,人工智能會發展出一條既能滿足人們需要,又不阻礙人類發展的路,為我們的生產生活提供更多的便利。

同學們,對于人工智能,你們有哪些憧憬與想象呢?歡迎來信與我們交流。

猜你喜歡
人臉機器語音
機器狗
機器狗
有特點的人臉
一起學畫人臉
魔力語音
基于MATLAB的語音信號處理
基于MQ3與MP3的價廉物美的酒駕語音提醒器
對方正在輸入……
三國漫——人臉解鎖
未來機器城
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合