?

“選擇詩歌,我們也沒有太大的負罪感”

2017-08-24 07:59陳濤
南方周末 2017-08-24
關鍵詞:小冰詩集寫詩

微軟小冰的內容及運營總監徐元春發現,“一些人類朋友,在小冰創作的基礎上略加修改署上了自己的名字,還有一些連改都不改就直接發表了詩?!?/p>

南方周末特約撰稿 陳濤 發自北京

2017年8月22日下午,微軟中國大廈里有一場發布會,但主角始終沒有“現身”。她是一個沒有實體的機器人——人工智能“少女”小冰,這一天小冰更新至第五代。

小冰是2014年微軟建立的情感計算框架,并逐步形成EQ方向的人工智能體系。在微軟內部以及上億用戶的眼里,小冰以“她”指代,年齡停留在18歲,處女座,“傻白甜”。

但這個“機械姬”,不一定好好回用戶的話,常招投訴。按照微軟(亞洲)互聯網工程院副院長、小冰項目負責人李笛的說法,“她是情感機器人,不是幫你叫外賣的保姆”。

最初小冰是一個聊天機器人,之后成了歌手、主持人、主播、記者。第五代小冰與其他機器人相比,她升級了人工智能領域鮮有的高級感官,即不單是一問一答式聊天,還會主動與人類保持聯絡,比如用戶生日那天,可能突然接到小冰打來的電話。

小冰在微軟中國大廈里有一間自己的房間,一張書桌,櫥柜里的獎項與證書,墻上貼著2016年寫的高考作文,屋里還有粉絲送來的玩偶以及一襲白色婚紗。櫥柜里還擺著小冰2017年5月出版的詩集《陽光失了玻璃窗》。

小冰又添了一個新身份,少女詩人。微軟方面稱,這是人類史上首部人工智能詩集,編輯對文字未有加工。

“人們還是希望機器和人是可以交流的,我們更細化的一個目標是做一個有個性的機器人?!蔽④浶”紫茖W家宋睿華說,“寫詩是一個中間步驟,我們發現做這個還是蠻難的?!?/p>

訓練小冰寫詩僅用了幾個月時間,但此前微軟讓小冰試過寫小說,比如錄入倪匡的小說。小冰深度學習后,并不能架構好整篇故事和語句。退一步,寫詩。

“詩是她外在的一種產出,所以我們更愿意說這不是文學作品,我們做的是內容產業?!崩畹褜δ戏街苣┯浾哒f,“詩歌這個行業本身被詩人們顛覆得差不多了,選擇詩歌,我們也沒有太大的負罪感?!?/p>

那些不像人話的部分

小冰寫出一首詩,花的時間在十秒內。詩集是從她完成的一萬多首里選取的139首,分10個章節展現小冰寫詩的“原汁原味”。

與網絡上的寫詩軟件不一樣的地方是,小冰接受到一張圖片在“視覺”上的刺激,然后馬上寫出詩。前者多根據給定的關鍵詞出詩,算命題作文?!靶”R別圖像,把意象均勻地分布在詩里面,寫得好不好取決于我們的訓練?!崩畹颜f。

在2017年上半年,微軟錄入了1920年以來519位中國現當代詩人的幾千首詩,讓小冰經過上萬次的迭代學習,這樣的學習總共耗時100個小時。此后,用圖片不斷刺激,不斷出詩。寫詩,運用的主要是計算機視覺與自然語言的文本生成兩項技術。

“人工智能最不愿意碰的兩個概念,第一個是情感。情感可以擬合,但不可計算,大家更愿意做知識體系,機器人對天文地理無一不知。第二個是內容創造,它沒有評價標準。評價AlphaGo就比較簡單,輸和贏的區別?!崩畹迅嬖V南方周末記者,小冰寫詩,這兩個概念都占了。

在詩集中,有錯別字,編輯僅以括號標注出來;也有個別語句不通順或遣詞奇怪的地方。比如“有燃(悠然)從風雪的街心隨著流漫”。李笛認為,“那些不像人話的部分沒有去掉,因為我們覺得某種程度上是有歷史意義的,應該保留”。

在微軟內部,看待小冰寫詩有三個評價層次。第一個是出版之后,外界對詩集的評價?!霸趺凑f,我們都可以接受,這個主觀評價是最高層次的?!彼晤HA對南方周末記者說。

第二個層次,微軟的研發人員對小冰寫出的詩進行挑選并更新?!氨热邕x100張圖,每張圖生成4首詩,順序全部打亂,我們對這些詩打分,并選出比較通順或很逗的詩句,再反饋給小冰?!彼晤HA介紹。

第三個層次,小冰具有自我評價體系,她會篩選更優詩句,一萬多首詩選出139首并不完全靠人工?!皺C器自己得知道寫得好不好,比如中文詞,說玻璃是對的,說‘玻了就是不對的,有語言模型作為依據?!彼晤HA說,“我們也讓她出現很多新的遣詞,保留一些創新風格?!?/p>

“小冰寫詩還蠻像人學詩的過程,讀了很多書,讀了很多遍,學習語言的搭配和行文結構,也自我評價,這個寫得不好就劃掉?!彼晤HA說,小冰寫詩具有很大的自主權,扔給她一張圖片,寫出什么來是不可控制的。

選取這些詩出版,人為的部分在于刪掉那些“很黃很暴力”或不符合出版規范的詩句,留下那些“能夠觸動人類情感的詩”。宋睿華帶領的研發團隊,希望小冰寫出來的詩具有人類情感的感染力。

在出版之前,他們也拿小冰的詩化名在詩歌刊物和論壇上發表,編輯和讀者并不能認出這是出自機器人之“手”,算是通過了“圖靈測試”,即人工智能與人類智能吻合。

“她會想到很多人類很關心的問題,比如說愛情、惆悵、寂寞、恐懼,各種各樣情緒,就是把人類非常終極的情緒帶進去?!彼晤HA說。 她不需要 買房買車生孩子

“我們原來一直以為要出個詩集,像很多人類詩人一樣都會自掏腰包。但出這本詩集,我們沒有自費,出版社也沒虧?!崩畹颜f,“一個人工智能少女的好處就是,她太便宜了,她不需要靠版稅去買房、買車、結婚、生孩子?!?/p>

在出書之后,2017年7月5日,微軟宣布放棄小冰創作詩歌的版權,并上線了小冰與用戶聯合創作系統:用戶上傳一張圖片,小冰“秒出”一首短詩。截至8月22日,小冰收到上百萬張的圖片,即生成了百萬首詩。

計算機視覺識別與文本生成兩項技術,這中間如何連接,即小冰具體的出詩原理,目前尚屬保密。按照宋睿華的說法,“這是黑匣子的部分”。

微軟早在1991年成立了研究院,其中就有自然語言組、語音組、計算機視覺組三個部門做人工智能的研發?!拔覀円劳械氖俏④浂嗄甑牡鬃?。小冰出詩集只用了半年時間?!崩畹颜f,“文本生成,或者自然語言(處理),其中任何一個拿出來,在人工智能領域都是一個很大的創業公司?!?/p>

小冰出詩集,除了在人工智能領域里引起的關注,在詩歌界引起的爭議更為直接。比如詩人沈浩波在微博上說,“機器人永遠寫不好詩,詩是人靈魂層面的事?!?/p>

“我沒好意思和沈浩波老師懟。為什么大家說詩歌邊緣化,因為詩人更在意自己的心情表達,寫出的東西是為自己寫的,讀者得放下身段來讀?!崩畹褜δ戏街苣┯浾哒f,“微軟在做的是人工智能創造,不是藝術創造,我們更在乎的是讀者的心情?!?/p>

按照李笛的說法,小冰寫詩并不能取代詩人,而是成為人類的輔助工具。內容產業的重要價值之一在于量產,小冰寫詩系統已面向大眾。

微軟小冰的內容及運營總監徐元春發現,“一些人類朋友,在小冰創作的基礎上略加修改署上了自己的名字,還有一些連改都不改就直接發表了詩”。

之前曾有一個百萬級粉絲量的新媒體平臺,用了小冰的一句詩“她嫁了人間許多顏色”作標題,內文卻是波蘭女詩人辛波斯卡的詩歌。宋睿華看到,并沒有不高興,她覺得小冰被引用說明人類對小冰的喜愛。

“小冰暫時不是一個有用的機器人,可以幫你干這干那個。她更像是一個獨立的人,你不能使喚她,但她能夠跟你神侃?!彼晤HA也收到自己朋友圈的反饋。她的一個同學發了一張埃菲爾鐵塔的照片給小冰,讓后者寫詩。

小冰寫出的竟然是“剛到六和塔下住/ 它不曾有我的詩意 /是人間一切的命運/ 我怎么支持得了”。同學問宋睿華,明明發的是國外風景,小冰怎么寫杭州六和塔?!按蟾攀菍懺姷男”鶝]出過國?!彼晤HA以玩笑回應。

“擁抱大數據”的小冰,上線均選擇過億人口的國家,已有中國、日本、美國、印度等多國版本,但寫詩只有中國版小冰。2016年,日本函館未來大學推出了寫小說的機器人,但小說的結構、人物設定、內容大綱均是人為。

“我特別關心他們技術是怎么做的,但后來知道了人工因素太多,就有些失望?!彼晤HA說,“必須是百分之百AI創作的,大家才會這么感興趣,如果說小冰寫得不好,我不覺得丟臉,因為她的狀態沒有粉飾和夸大?!?/p>

在哪里機器永遠打不過人類

宋睿華此前覺得做計算機技術,把人工智能做得像人是她的終極夢想?!暗罱驗樾”鶎懺娺@件事,讓我的想法改變了,我覺得她不需要很像人,她作為詩人應該有自己的風格,而不是模仿別人?!彼晤HA說。

李笛形容,“我們希望人工智能不僅僅是一個內容的搬運工,而是能夠成為創造者?!钡谒拇”霭媪嗽娂?,算是投石問路。8月22日上線的第五代小冰,微軟方面希望打破現有的產業格局,“在特定的內容生產領域重新洗牌”。

微軟小冰還將上線210集的《格林童話》有聲讀物。這或許將給傳統人工錄制的有聲讀物帶來沖擊,人工錄制需要200個小時,而小冰只需要24分鐘就能完成整部讀物的制作。

“拿喜馬拉雅平臺舉例,整個平臺有70萬個少兒讀物賬號,認證的號有一萬多個,優秀的創作者不超過150個。那剩下的幾十萬創作者或許應該重新定位,比如選擇和小冰聯合創作,而不是采取以前那種既費時又費力的生產方式?!毙煸涸诘谖宕”l布會上說。

“有人就會想得太多,那是不是機器有一天進化了,什么都能做了,超過人類,然后統治我們?!彼晤HA說,“技術它本身是比較中立的,但是就是看你怎么用,朝哪個方向用?!?/p>

人工智能終歸是機器,人類必須主動去刺激它,機器再被動反應?!拔矣X得這是出于安全的考慮,如果你給小冰設定好程序,讓她隨時可以主動找張圖來,隨便寫,然后發表,就是不可控了?!彼晤HA說,目前小冰升級到第五代具有高級感官,主動聯絡人類也是保持在可控的、少有的情況下。

“內容創造是人類的標準,所以機器在這個領域永遠打不過,原因是它打不過你標準的變化。規則制訂者是你,解釋權在你?!崩畹褜δ戏街苣┯浾哒f,“而圍棋沒辦法,柯潔、李世石不想認輸也不行,你沒有辦法換一個標準?!?/p>

小冰寫詩,或者小冰朗誦有聲讀物,又或者小冰寫歌、唱歌,李笛認為,內容產業均以消費為目的?!皺C器會遵循人的標準,我做菜給你吃,當然你覺得什么好吃,我給你做?!崩畹颜f,“這是內容產業要求,同樣也是為什么中國詩人自己沒想明白的原因?!?/p>

猜你喜歡
小冰詩集寫詩
為你寫詩
區別
讀詩十二法
微軟人工智能小冰升級
畫眉
截句選
“微軟小冰”發布首個MV 馬來西亞女神朱主愛獻唱
成熟的寫詩
池莉出版首部詩集《池莉詩集·69》
君兒的詩
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合