?

一段人機共創私人史

2024-01-20 10:54陳楸帆
清明 2024年1期
關鍵詞:機器人類

究竟誰擊敗了莫言,

人還是機器?

2019年春節前不久,原《收獲》編輯、作家、科技創業者走走告訴我,他們用名叫“谷臻小簡”的AI軟件“讀”了2018年20本文學雜志刊發的771部短篇小說,并以小說的優美度,即情節與情節之間節奏變化的規律性,以及結構的流暢程度對這些作品進行打分。

截至2019年1月20日,分數最高的始終是諾貝爾文學獎得主莫言老師的《等待摩西》。下午7點20分,情況發生了改變。AI最終選定的年度短篇是我發表在

《小說界》2018年第4期的《出神狀態》,

《等待摩西》被擠到了第二位,差距僅有0.00001分。

更不可思議的是,我的《出神狀態》里恰好運用了由AI軟件生成的內容,這個算法是由創新工場CTO兼人工智能工程院副院長王詠剛編寫的,訓練數據包括我既往的上百萬字作品。

“一個AI,何以從771部小說中,準確指認出另一個AI的身影?”這是我們共同的疑問。

第一次產生和AI合作的想法還得追溯到2017年下半年。其實機器寫作并不是新鮮事,但是作為高度復雜的文學金字塔的頂端,小說所要求的邏輯性和自然語言理解能力,目前的AI必然未達到這樣的水平。王詠剛聽了我的想法之后也非常興奮,很爽快地答應幫助我編寫程序。

經過一系列的調試,輸入了上百萬字的陳楸帆作品之后,AI程序“陳楸帆2.0”出世了。它可以通過輸入關鍵詞和主語,自動生成幾十到一百字的段落,潤色修改之后我將一些段落嵌入了我的小說《出神狀態》。

王詠剛告訴我,經過大批量語料學習之后,AI程序已逐漸習得了我的寫作偏好。在掌握了關于語句的統計規律后,AI程序便會從大量的語料中隨機找到一些詞,并把這些詞匯按照寫作規律拼接在一起形成句子。比起文學,它更像是統計學與數學。當然,進入具體實施的技術細節將更為復雜。

王詠剛在為我的小說集《人生算法》所作的序中寫道:

AI對語義的解讀,還只停留在膚淺的統計建模層面,遠談不上理解了人類語言。Word2vec的實用價值在于,它是主題、風格、情感等更高級建?;蚍治龅幕A。我曾抽取楸帆作品中代表性較強的詞匯,計算得到每個詞對應的Word2vec向量數值,再通過數學變換將百多維空間中的向量轉換成二維或三維人類可見的圖像——這是標準的、科學意義上的“降維打擊”。

第一次看到AI程序寫出來的句子時,我覺得既像自己寫的又不像自己寫的,有先鋒派的味道,像詩歌又像俳句或者佛偈??梢钥隙ǖ氖?,它們沒有邏輯性,也無法對上下文的劇情和情緒產生指涉性的關聯,為了把這些文字不經加工(存在一定程度上的人工篩選)地嵌入到人類寫作中去,我必須做更多的事情。

所以,究竟是誰擊敗了莫言?是來自我的語料,是來自網絡的開源算法,是王詠剛的微調參數技巧,還是AI評委的評判標準?或者,這是一場人與機器的集體合謀?

如王詠剛所說,這是人類最后一個獨立寫作的紀元,它不單單是人+機器,而是人與機器的復雜互動,其中對于“作者性”的探討重要性超出了故事與文本本身,可以稱之為先鋒的行為藝術。當然這只是一個開始,未來我相信機器將更深入地卷入人類寫作和敘事中,未來的文學版圖也會變得更加復雜、曖昧而有趣。

狂飆突進的大語言模型

巧合的是,2017年也正是谷歌發布自注意力機制與Transformer算法,并開啟了機器學習在自然語言處理領域狂飆突進的歷史性時刻。之后,我們見證了OpenAI推出的GPT模型不斷進化升級,挑戰人類對于智能、意識以及創造力的理解邊界。

2020年,創新工場組織了人工智能訓練營,參與者包括數百名與人工智能相關的高校學生。他們組成團隊進行各種AI項目的開發孵化,其中的一個名為“AI科幻世界”項目的負責人找到了我。他們都是科幻迷,目標是構建一個能寫科幻小說的大模型。我覺得這非常有趣。

這個模型的參數量相當于GPT-2,我們用科幻文類去微調它,讓它知道怎么去創作小說,包括讓結構、情節、風格等方面跟科幻類型更匹配。我們還開發了一些風格濾鏡,例如劉慈欣風格、韓松風格等。也做了《共生紀》的共創活動,邀請了十幾位科幻作家,如吳霜、王元、飛氘、凌晨等,主流文學的小白老師也參與到活動中,跟AI一起創作,然后將創作出的作品放在知乎上,跟網友互動,讓他們去猜哪些是AI寫的,哪些是人寫的。

后面,我又和它一起創作了一系列的短篇作品,包括《火星奧德賽》,我會標明哪部分是人創作的,哪部分是機器創作的,最后給它一個署名,說明是由哪個模型生成的,背后的團隊是哪個,保留了對它背后知識產權的尊重。

與“陳楸帆2.0”不同的是,“AI科幻世界”的交互界面有了巨大的升級,不再是簡單的提示詞生成語句,而是允許有“人機自由創作”與“人機對話接龍”兩種模式。由此可以看到,交互方式的設計對于人機共創的內容有著決定性的影響。

在“人機自由創作”模式下,作者可以靈活地選擇輸入任意長度的語句,并點擊按鍵生成4種建立在先前文本理解基礎上的生成語句,作者可以選擇“嵌入”或者“重新生成”,直到獲得滿意的內容,并進行自由編輯。而在“人機對話接龍”模式下,人類作者可以用問答的形式與AI進行對話,并可對前一回合對話進行“撤銷”,甚至全部“清空”。

AI的進步非???,達到了小學中高年級學生的寫作水平,很難判斷出哪部分是人寫的,哪部分是機器寫的,有時候甚至會出來一些令人拍案叫絕的句子,比如以下選自《火星奧德賽》的例子(下劃線部分為AI創作):

她邀請他去火衛二,那是另一個被遺棄的小行星。他們相信他能幫助他們制造出分子縮微器,這樣,地球上的分子就可以被拼裝成任何他們想要的樣子。他們說,這將是人類歷史的一大進步。

“可我怎么才能去到火星呢?”

“運用你的想象力?!崩咸判χ冻隽朔奂t而空洞的牙齦,“只要你相信自己就在火星上,你就能去那里?!?/p>

他們讓他看了幾乎所有的火星照片,其中不乏經過處理的,高清晰度的?;ɑㄍ蝗活I悟到,所謂的新聞媒體只不過是一種掩人耳目的障眼法。他看到了其中一張照片,正面是地球,而反面是火星。

花花被這個想法震驚了?;鹦鞘堑厍虻姆疵?,而地球是火星的正面。從地球到達火星,只需要從這一面穿透到另一面。

當筆者輸入“可我怎么才能去到火星呢?”之后,AI給出了意料之外的答案,不是乘坐飛船火箭而是一個近乎哲學性的詩意表述:“火星是地球的反面,而地球是火星的正面?!焙侠淼耐普摫闶恰皬牡厍虻竭_火星,只需要從這一面穿透到另一面”的跨維度旅行。但在得出這一結論之前,還需要依據人類推理的邏輯步驟進行鋪墊,于是有了之前的對話與火星照片的線索。

因此不難看出,盡管“AI科幻世界”在自然語言的理解與生成水平上相較之前的模型有了巨大飛躍,但作為創意寫作工具,依然存在著邏輯跳躍、人稱混亂、細節沖突等硬傷,更不用說更為微妙細膩的語言風格與文學表達了。

時間快進到2022年11月30日,一個能夠回答問題,寫小說、論文甚至代碼的對話式AI,在全球掀起現象級熱潮。它獲得100萬用戶只用了不到5天,而推特用了2年,臉書用了300天,照片墻用了75天。相比于之前的GPT-3模型,InstructGPT增加了“依據人類反饋進行強化學習”的概念,能夠更好地理解文本更深層次的復雜含義,無論是連續流暢的對話,還是對于錯誤想法的糾正,甚至能夠質疑不合理前提或者干脆拒絕惡意提問,足以讓對話者產生“以假亂真”的幻覺。

現在我會經常使用AI工具,就像使用鼠標、鍵盤、操作系統和寫作軟件,當AI變成一個生產力工具之后,它已經不再是一個需要去強調它存在的默認狀態。我們不能再像以前一樣使用和想象AI,它倒逼我們去思考怎樣提升人機協作的效率和創造力。

日常工作中我會用AI幫我回郵件,草擬發言稿,做一些基礎翻譯,搜集資料、圍繞資料進行頭腦風暴等等。在創意寫作中,在一個對話序列里,你給它一個語境或開頭去續寫,能看到它前后的連貫性保持得非常好,還能給出一些你意想不到的轉折,甚至有一些語言帶有更復雜微妙的文學意味。AI也可以學習歷史上某位大師的所有文本,之后便可以用大師的思維方式去跟你溝通。比如說我想跟阿瑟·克拉克聊一個創意,聽聽他對這個創意的一些想法,它就能模仿阿瑟·克拉克的那種思維方式,通過對話,給我一些建議和靈感。我新書的封面就是用AI來做的,再通過專業的設計師加個字體,進行一些微調。

有專門為類型文學寫作服務的AI工具,它里面有很多的功能。比如,我要寫某星球的某生物,它可以生成很多關于不同星球的不同生物的描述,包括世界觀的設定,人物、技術、情節上的轉折等等,它都可以很快生成內容,給你提供意見,你只要在里面挑選你想要的。它也能夠在風格上提供幫助,比如輸入一段你寫的文字,它可以很快幫你把它變得或詼諧幽默,或嚴肅,或更接近某位特定作家的風格。

如果說2017年的“陳楸帆2.0”語言模型還是混沌不堪的“隨機鸚鵡”,2020年的“AI科幻世界”連簡單的人稱都搞不清楚,人物關系里面誰是誰,彼此的聯系是什么,寫著寫著它就搞混或者顛倒了。但到了2022年的GPT-3.5和ChatGPT,它的寫作能力已經超乎想象?,F在我花非常多的時間探索怎么跟ChatGPT合作,這肯定不是我們原來想象的簡單粗暴的“復制粘貼”,它是一個非常復雜的人跟機器共生的、迭代式、模塊化的創作過程。在這個過程中我會對自己的寫作有非常多的反思,它讓你理解到人類的邊界和局限性,同時也更好地理解機器的邊界與局限性在哪里。包括目前AI還沒能做到,但今后可能做到的事情。

我將在今后的專欄里進行進一步深入分析。

AI時代的文學挑戰

五年的時間,AI技術的進步確實遠遠超過我們的預期,這一點是最可怕的。它的進步不是我們習慣的線性增長,而是一個指數性的增長,而且這個增長才剛剛開始。AI提供給我們非常強大的工具,創意的工具、寫作的工具、設計的工具,同時也讓我們思考到底原創性的邊界在哪里,人類的主觀能動性在哪里,包括知識產權,包括怎么尊重被采集數據的作者,他們是否也擁有一定的權利。所有這些問題都在一團迷霧當中尚待被理清和討論。

如果說AI寫作在此之前只不過是游戲式的實驗,那么擺在每一個文學創作者面前的當下大語言模型時代,卻挑戰著所有傳統文學對于現實的定義與理解。

我們生活在充斥著數據和比特的今天,人類的大腦卻與數萬年前石器時代的大腦沒有太大區別,依然是億萬年進化而來的基于物理先驗知識的信息處理系統,我們大部分的思考都是由一套強大的受控于情緒與生物本能的系統一,與另一套不那么強大的可以運用有限理性進行數據收集、分析、決策的系統二共同完成的,它們所動用的大腦區域是不一樣的,我們往往要花很大的力氣才能讓系統二凌駕于系統一之上,作出所謂的理性判斷,即便是這樣的判斷,有時也遠不如簡單的機器準確。

舉個最簡單的例子,只要把所有人的面孔調轉一百八十度,人腦立馬就會產生臉盲,而對于機器來說,這只是變換坐標系的簡單操作,更不用說處理一些高維數據模型了。因此,這個看似信息極大豐富乃至爆炸的時代,其實是對人類大腦極其不友好的時代,得到的信息越多,其中的噪聲、錯謬、變形、誤差,我們并沒有辦法通過某種程序自我消化糾正,它們沉淀下來,成為所謂的認知盈余與信息過載,成為我們的焦慮本身,影響著每一個人對于未來的判斷,對于行動的選擇。

如果說這是技術時代對于人腦認知不確定性的放大,那另一個方面的不確定則更事關重大,那就是對這個世界解釋的不確定性。在這件事情上,不僅僅普通人焦慮,科學家也焦慮。

谷歌的資深工程師在頒獎典禮上說過一句話,這句話一石激起千層浪。他說:“人工智能就是煉金術?!边@句話的意思是,在當下的人工智能研究領域里,大家用著許多看起來非常有效的技巧,能夠提升機器解決問題的能力,但是我們對于背后的原理,如何運作一無所知,一切都像是煉金術一樣,或者更直接點——玄學,但是大家仍然在不計后果地狂飆突進中。

從這場AI界關于真理標準的大討論中,我們也能深深體會到科學家們在這個時代的焦慮。技術發展得太快,以至于每一個人都無法完全理解。

而在當下這個技術時代,任何對于技術的言說都只能借助于圖像、比喻乃至文字,而技術核心本身是無法言說的,是純粹的數與理念的存在,人工智能、引力波、量子物理、石墨烯,這些技術即便經過科普,對于大眾仍然存在認知門檻,仍然是霧里看花,甚至會帶來更深的誤解。曾經有一個導演告訴我,讀到《三體》里“整個宇宙為我閃爍”,頓時腦補出好萊塢大片般的炫酷場景,后來經過專家指點,了解到宇宙微波背景輻射根本不是他想象的那么回事。

真實與虛擬、現實與科幻、歷史與未來、技術與人性、奧威爾和赫胥黎,在我們所處的這個時代無縫銜接、水乳交融。這種“超真實”時代的現實想象力,讓很多虛構文學作者深感無力,也給寫作者設下了種種不友好的障礙。

比方說,大家以前想象AI也許能夠替代一些藍領或者體力勞動者的工作,但現在卻發現它其實更容易替代的是一些白領的工作,比如說各類創意人才,包括文案、設計、插畫、動畫制作、配樂等。我覺得這是創意的民主化。以前我們可能需要去上非常專業的課程,經過很多年的培訓,甚至要有從業的經驗,才能成為一個專業創意人才。但現在不需要了,用一個AI工具,每個人都能很快地做出一個像模像樣的作品來。

但從商業角度來講,創意的民主化會讓很多人類的創意勞動貶值。以前可能一個文案做到了70分就可以有飯吃,但現在做不到95分,都會面臨著失業的風險。等于AI把所有創意勞動的價格全都打下來了。

所以這是一個巨大的沖擊。這個沖擊以后會變成什么樣?我現在也不敢斷言。比如好萊塢的工會有比較完善的工會制度,它今年組織起來的罷工能夠逼迫資方去簽訂一些讓步協議來延緩這個趨勢。但用AI去替代人這個過程在未來一定會發生,只是快慢的問題。

我覺得對于個體的創作者來講,會變得跟那個笑話里一樣:你在森林里遇到了一頭熊,要做的不是比熊跑得更快,你只要比另一個人跑得快,就能保證不被熊吃掉。

我們只能去理解AI,學習AI,然后努力讓AI成為提升你創作效率跟質量的一個杠桿,讓自己能成為不可替代的創作者,這樣的人就是頭部創作者了。

對于頭部創作者來說,在這個時代,他的價值可能不是單純由作品的質量來決定的,他更多的議價能力是在創作者個人的身份。他要把自己打造成一個品牌,一個帶有一定傳奇色彩的精神符號。這樣的一種身份角色的轉換,可能是很多創作者都沒有準備好的。但這個趨勢來得非???,我感覺可能三年之內,就會改變整個創意行業。

人工智能生成內容最后肯定會成為數字媒介最核心的部分,或者說流量最大的部分。當它的成本降到足夠低的時候,各大平臺就會把生成人工智能工具作為一個默認設置,將它直接嵌入到各種創作平臺上,幫助用戶更好地去生成他們想要的內容。

這樣的好處是所有人都能創作,壞處可能是絕大部分人創作出來的東西都千篇一律。審美風格效果都是我們能預見的趨于同質化。

因為要讓內容變得不一樣,創作者自己首先要有審美判斷力。判斷力是需要經過長時間學習和實踐才有的。這個經驗可能是很多基礎用戶不具備的。這就會導致在某一個時間段里,生成式人工智能輔助出來了特別單一模板化的風格。這種風格反過來會變成一種主流,它又會去侵蝕掉很多異質的市場,甚至它在所有的媒介上都變成了一種新潮流。

當這種時尚到達一定的極限時,可能就會有一些新的嘗試要去突破潮流,這些乍一看怪異的東西也會不斷涌現,不斷迭代。整個過程中可能AI會起到一個非常主導的作用。

當你看到一個由代碼組成的算法機器,以如此簡單粗暴的訓練方式,也能寫出讓你覺得“有一些東西”的文字時,就會開始回過頭想,那么多作家、畫家、詩人,他們的藝術創作過程到底有什么人類的獨特性?我現在的答案是,可能并沒有那么獨特,也沒有那么不可替代。

隨著AI不斷以這種指數級的速度自我進化、自我迭代,接下來,非常多人類本體的定義、人本主義的基礎會被動搖,這是一個更深刻的東西,可能現在還沒有被討論得特別充分。我觀察到人文學者,包括一些傳統作家,他們面對新的事物還是比較保守,甚至很多會有一種拒斥心理。他會覺得這東西無非就是排列、組合、拼貼,從那么多東西里這兒抄一點、那兒抄一點,但我覺得這個東西可能沒有他們想象得那么簡單。原來大家會質疑AI無法創造新的東西,但現在意識到,人類創造的東西,很多也是通過原有的知識經驗打碎重組,放到新的場景里去運用。

我相信在3~5年之內,機器輔助寫作會成為普遍現象,這里指的是人類利用算法來輔助自己進行普遍意義上的寫作,包括應用寫作及創意寫作,而那些更容易被結構化的數據比如財經新聞、醫療報告、法律文書等則將早于此被AI全面接管,因為那是機器擅長的領域,更加準確、高效、實時。

AI能做到的將會更多,比如說能幫助創作者打破媒介的邊界。

之前,寫青少年科幻的楊鵬老師,一直在找我談,能不能把他的小說通過AI快速地變成漫畫或者繪本。其實AI完全能做到,它可以讓創作者高效完成這件事情。文字變成靜態圖片的下一步就是怎樣把它變成動態的影視作品?,F在有這樣的公司,它可以幫我們快速地風格化。把實拍的真人場景視頻在幾分鐘內“渲染”成新海城或宮崎駿的動畫風格,也能夠把靜態圖片經過運算變成流暢連貫的動態視頻。相當于你自己可以是編劇,可以是攝影,可以是導演,可以是特效,甚至連音樂、配音、字幕都可以用AI去生成。等于說原本可能需要數十人甚至上百人的專業團隊才能做到的事情,現在一個人就可以用非常低的成本來實現所有效果,只要你愿意去學習鉆研一些工具。

從未來講,每個人都可能是電影導演,每個人都可以去拍一部自己的大片,制造一個游戲,排演一臺完全由AI或者機器人出演的音樂劇。到時候,我們擁有的是一個全民創作的海量內容市場,自然也需要有相應的平臺渠道、推薦機制去讓人看到,去獲得相應的商業化的收益分成,讓它變成一個可持續的行業生態。

于此,我認為我們正在進入一個“人機共生”的創作時代。我自己作為創作者在使用AI的過程中,通過重新理解人類與機器兩種不同智能形態的優劣勢,體會到的迭代式的共生關系是:從學習機器的創作邏輯,然后反推去提升自己作為人的創作邏輯。這樣才能跟機器共同成長進化。比如,對于我來說,現在寫作中最花力氣的地方反而是從前最不花力氣的地方。這么說可能有點玄,它不在收集信息、理解科技、編排人物與拿捏故事原型,而在于不經過理性思考判斷,從潛意識層面涌現的直覺、具身經驗、情感與記憶,也就是人類意識中“非計算性”的部分。你無法控制它的到來,很多時候只能等待,只能祈禱。這或許是AI尚未通過語言模型學會的一課。

最新的ChatGPT及各種變體已經能夠以超乎想象的流暢程度與人類進行對話和特定領域的寫作,比如財經新聞、體育報道、法律文書、論文摘要……甚至模仿歷史上不同的作家風格進行創作。盡管生成內容的質量還不夠穩定,且時常會犯一些常識性的錯誤,但目前已有科學家嘗試教會機器理解我們所身處的“世界模型”??梢哉f,我們已經生活在這樣的科幻現實中。如果科技真的到了我們無法分辨人類與機器的地步,哪怕只是語言層面上,都足以顛覆絕大部分行業及社會生活的面貌,因為人類無法離開語言進行思考、表達與交流。而隨著AI技術的發展,基礎大模型將進入各行各業,能幫助人類尋找最佳工程問題的方案,不管是土建、化學、生物、電路、芯片、機械等各種工程難題都能通過新的解題工具更快更準確地找到最佳方案。許多人類的職業會被替代,企業會高度自動化。新一代兒童會更習慣與機器進行交流,相比之下,人類的交流笨拙而低效,充滿了誤解。

當有朝一日我們抵達那樣一個超越科幻的世界,機器能夠無窮盡地生產出供人類娛樂的個性化內容,不輸歷史上任何經典的文學、影像或游戲,我們是否將迎來真正意義上的“文學已死”?

或許,文學本身的定義與邊界也將被不斷深挖拓寬。如果將人類類比為一部機器,那么閱讀、寫作無疑是極其重要的輸入、輸出模式。通過閱讀、寫作我們可以理解個體的認知與學習過程,甚至是跨個體間的情感如何傳遞并引發共鳴,不同語境下概念與符號系統如何傳承流變,這是文學、語言學與認知科學的交叉領域??茖W家們在研究如何通過光遺傳學和視覺刺激將信息“寫入”生物大腦,同樣對于機器來說,理解自然語言指令就是這樣的一個輸入過程,那么在一個集成化程度足夠高的智能時代,比如30年之后,我們真的可以通過語言,通過書寫,通過文學,改變現實或者虛擬世界的運行秩序,所謂呼風喚雨,喝山開道,畫符為馬,撒豆成兵。那時就真的到了如克拉克所說“一切足夠先進的科技都與魔法無異”的時代了。

那么到了那樣的時代,文學的位置何在,文學又應該怎樣去“讀”和“寫”呢?

責任編輯????袁???媛

猜你喜歡
機器人類
機器狗
顫抖吧,人類
機器狗
人類能否一覺到未來?
人類會成長起來嗎?
無所不能的機器
人類第一殺手
神奇的寫作機器
1100億個人類的清明
未來機器城
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合