?

AI浪潮下的版權風暴

2024-04-24 07:46林煒鑫
記者觀察 2024年3期
關鍵詞:畫師模型

林煒鑫

01畫師與AI的抗爭

在大部分人為AI技術進步歡欣鼓舞時,有一群人開始反抗AI。

過去一年,生成式AI不斷擠壓著原畫師的生存空間。入行五年的游戲原畫師石露說,去年的變化要超過以往任何一年。許多游戲開發公司都在使用AI,縮減美術團隊。AI“狂飆”的幾個月內,原畫師的稿費從2萬元/張降到了4千元/張。在石露看來,導致畫師處境艱難的元兇便是AI。

人與AI的矛盾正在激化。許多畫師擔心被AI侵權。他們認為,文生圖的原理就是“碎片拼接”——開發者提供了大量人類創作的畫作給AI模型,模型將其打碎,再拼接,最后生成新的圖。在他們看來,AI作圖沒有靈魂。以普通人的直覺來看,AI生圖的過程已經涉及侵權。

推廣AI的大公司們也陷入爭議的漩渦。

2023年11月29日,四位畫師聯合起訴小紅書AI模型庫侵權,理由是小紅書的AI圖像創作工具Trik,疑似用了他們的作品去訓練AI模型。

其中一位名叫“正版青團子”的畫師曬出兩張插畫,分別是她的作品和Trik AI生成的圖?!盁o論是配色元素還是畫面風格都和我的圖很像,感覺心血被剽竊了?!彼谏缃黄脚_呼吁道,“希望大家一起維權?!?/p>

畫師“是雪魚啊”也將Trik AI生成的圖與自己的作品對比,發現兩者相似度很高,甚至有類似的元素。他通過在小紅書上停更來表達自己的憤怒,理由是小紅書未經允許,擅自將他的作品提供給AI,以及平臺近乎霸王條約的用戶協議,引起了他的不安。

四位畫師聯合起訴小紅書的案件已在北京互聯網法院立案。據了解,這是國內第一起針對AIGC(生成式人工智能)訓練數據集侵權問題的案件。

小紅書方面以案件進入司法程序為由,拒絕發表評論。據“正版青團子”透露,立案之前,小紅書曾找過四位畫師,希望與他們協商。但他們已經約定不接受調解,堅持立案?!罢媲鄨F子”說,希望這起案例能為AI繪圖的版權糾紛提供參考。

網易旗下的LOFTER是畫師與粉絲常用的交流平臺,插畫師高悅經常在LOFTER分享自己的作品,積累了一定的粉絲。去年她注意至ULOFTER正在內測一項AI功能“老福鴿畫畫機”,用戶只需使用關鍵詞就能生成繪畫作品。她懷疑平臺會暗自將他們的作品變成AI的訓練素材。

“我對這個平臺的信任度瞬間驟減?!备邜傉f。

眼看越來越多的用戶表達不滿,LOFTER官方幾天后刪除了新功能的活動通告,并且聲明訓練數據來自開源,并未使用用戶的作品數據。然而這項功能并沒有第一時間下線,這也是無法讓用戶信服和放心的重要原因。

一番糾結之后,高悅選擇響應部分創作者的號召,清空自己的賬號,隨后注銷,以此表示抗爭。在高悅看來,從平臺撤退,是目前為數不多的自我保護的方式。

播畫師馬群回憶,早在2022年AI繪畫就曾出圈,但當時AI生成的畫經常翻車,比如將人畫成狗或馬。后來AI進步的速度超出想象,但仍然有跡可循,比如AI還不懂如何畫人的手。

然而,這些漏洞短時間內也被攻克了。馬群認為,鑒別一張圖是手繪還是AI生成越來越依靠人的主觀感受了,比如“是否有靈性”。

馬群也抵制AI,因為AI讓她失去了對繪畫的熱情。她不是科班出身,靠熱情去自學繪畫,大學畢業后,她成為一名全職畫手。繪畫的過程有時很折磨人,但看到成果的那一刻,她的喜悅蓋過一切。

而現在,AI抹掉了大多數繪畫步驟,一切都在自動化,這意味著馬群花贊幾年習得的技巧與經驗,在高效、強大的算法面前黯然失色。

“創作變得廉價了?!瘪R群說道。

02到法院去

創作者將AI公司告上法庭,幾乎貫穿了2023年一整年。

生成式AI之所以能在短時間內掀起聲浪,是因為它看起來真的有用,并對某些行業產生了威脅,比如手握版權的內容創作者。

率先向AI發難的是一位名叫卡拉·奧爾蒂斯的插畫師。她也是“拼接論”的支持者,面對在繪畫領域攻城略地并讓她失去一些工作機會的StabilityAi(英國的一家人工智能企業),她陷入焦慮,繼而決定反抗。

她向律師馬修·巴特里克求助。2022年冬天,巴特里克開始為一群程序員提供法律幫助,這些程序員認為微軟的GitHub Copilot(一款AI輔助開發工具)涉嫌侵犯他們的版權。巴特里克指責GitHub Copilot“竊取了程序員的工作”。2023年1月,巴特里克代理了奧爾蒂斯起訴Stability Ai的案子。

類似的訴訟屢見不鮮。圖片公司Getty Images分別在美國和英國起訴了Stability AI,指控其非法復制和處理了1200萬張Getty Images的圖片;以喬治·馬丁、喬納森·弗蘭岑為首的小說家們向OpenAI發難,而一群非虛構作家則把矛頭對準OpenAI和微軟;環球音樂等一眾音樂廠牌聲稱Antropic在訓練過程中非法使用了他們的版權作品,并且在模型生成內容中非法分發了歌詞。

2023年12月27日,《紐約時報》正式起訴微軟和OpenAI,宣稱報社數百萬篇文章被用作AI的訓練數據,而AI正作為新聞消息源與報社競爭。

一場圍繞AI版權的全面戰爭已經打響,難題紛紛拋給了各國的法院。

在中國,一樁AI繪圖侵權案,從立案到判決,持續了數月,是其他圖片侵權案處理時長的數倍。

2023年2月,原告李昀鍇在百家號的某篇文章中發現自己用AI創作的圖片被用作配圖,但文章作者使用時未經許可,并且裁掉了李昀鍇的署名水印。于是李昀鍇以侵犯署名權和信息網絡傳播權為由,向北京互聯網法院起訴該作者。

案件本身并不復雜,但是,由于被侵權的圖片是AI模型Stable Diffusion生成的,所以引起了大量關注,被網友稱為“AI繪圖第一案”。

挪用李昀鍇圖片的人即此案的被告,是位五六十歲的女性,自稱身患重病,收到法院通知時一頭霧水。在庭審上,她解釋那張圖片是通過網絡搜索獲得,具體來源已經無法提供。

她還說,AI繪圖是人類智慧的結晶,不能算是原告的作品。這也是該案爭論的焦點,AI生成的圖片是否構成作品,以及李昀鍇是否享有該圖片的著作權。

對各國來說,這都是一個懸而未決的法律問題。去年8月,美國一家法院判決,機器創作的內容沒有版權,原因是“人類作者身份是版權的基本要求”。但這個結論很快受到質疑。有人指出,同樣是使用機器,如果用手機拍照,照片就能受版權保護,用AI模型生成圖片,理應也有版權保護。

針對該問題,北京互聯網法院則作出了截然相反的判決。

審理此案的法官要求李昀鍇詳細演示用AI生成圖片的全過程,包括下載軟件、寫提示詞等。為了讓法官了解AI技術,李昀鍇查閱了很多資料,盡力向法官解釋AI繪畫的原理和創作過程。

法官最終認為,李昀鍇在涉案AI圖片的創作過程中,做了很多智力介入,這體現了作品的獨創性。因此這幅AI圖片被認定為是李昀鍇的作品,享有著作權保護。

李昀鍇表示,這個判決讓國內一些正在觀望的AI公司“喜憂參半”,開心的是AI生成的圖擁有版權,憂愁的則是,版權歸屬于用戶。

03 AI公司保持沉默

作為版權爭議的另一端,AI公司則始終回避這一話題??陀^上說,版權爭議短期內吵不出結果,所以,回避甚至保持沉默是最穩妥的辦法。

2023年12月,美圖公司推出新一代大模型,號稱具備更強大的視頻生成功能。盡管公司高層強調,AI是一種輔助工具,不是要取代專業人士,但許多從業者相信,這些新功能假以時日會進一步威脅他們的工作。

“關于AIGC生成圖片的版權問題,實踐中有爭論,有賴于法律的進一步規范”,一位業內人士說,“雖然目前這方面的法律不是很清晰,但我們總體上會保護用戶,尤其是專業人士的版權?!?/p>

另一位業內人士也表示認同“AI繪畫第一案”的判決結果。

OpenAI在今年開發者大會上,高調宣布將為使用GPT而遭到法律糾紛的人承擔訴訟費用。在部分創作者看來,這卻像是在挑釁。

某種程度上,AI公司有恃無恐。起訴AI最核心的主張是AI模型在使用訓練數據時就已經構成侵權行為,但這一主張并非無懈可擊。一些AI公司把AI訓練比作人類的學習過程,一個新學徒需要閱讀,甚至模仿老師的作品,才能掌握技術。如果法院采納這一觀點,那就不構成侵權。

一位律師表示,AI公司很有可能會采用“合理使用原則”來作辯護?!昂侠硎褂迷瓌t”大概是指,雖然某些行為嚴格來說算侵權,但這種行為是一種可以接受的借用,用來促進創造性的表達。例如,學者可以在自己的作品中引用摘錄他人內容;作者可以出版改編圖書;普通人可以截取電影片段做影評。

換句話說,如果對版權限制過嚴,文明的創造力將可能停滯。

科技公司長期利用這一原則來規避版權爭議。2013年,谷歌因為復制數百萬冊圖書并在線上傳書里的片段,遭到作家協會的起訴,法官基于“合理使用原則”,裁決谷歌這一行為合法,因為它為公眾創建了可搜索的索引,創造了公共價值。

在大模型時代,“合理使用原則”仍可能發揮關鍵作用。支持AI不侵權的人認為,大模型生成內容的過程,跟人類創作相差無幾——當你嘗試畫一幅畫或拍一支視頻,你的腦海里也會有你看過的畫或電影。人類的創作在前人的基礎上進步,大模型也是如此。

更重要的是,AI的戰略地位和商業價值在不斷上升,AI技術的支持者普遍擔心,如果版權限制過嚴,將制約AI技術的發展。

另一個障礙在于,AI公司在模型訓練數據方面幾乎沒有透明度。

例如,2023年12月7日,谷歌發布了一份長達60頁的報告,其中反復強調訓練數據的關鍵性,但幾乎沒有提供關于數據的來源、篩選以及具體內容的任何信息。

一位算法工程師表示,他們尋找訓練數據的方式無非是:用爬蟲將互聯網的內容爬一遍;找一些開源的數據集;實在不行就去購買,“總能買得到”。

有學者對此表示,AI公司與其去競爭模型在評測榜單的性能分數,不如比拼一下誰可以擁有最合法的訓練數據。

不過,批評AI公司訓練數據不透明,也有些苛責。畢竟訓練數據將極大左右模型性能,是各家AI公司的商業機密。在現有法律條文下,AI公司也沒有義務和動力去公開訓練數據。

李昀鍇表示,國內沒有“證據開示制度”(該制度規定,只要與案件事實具有關聯性的證據,當事人有權要求掌握該證據的其他當事人對其進行出示、披露),這意味著AI公司可以不披露模型的訓練數據?!艾F在這個制度下,只要企業不披露,就沒人知道有沒有拿用戶數據去訓練。這是一個死結?!彼f。

所以,創作者要想在這場版權戰爭大獲全勝,可能性微乎其微。

但這不代表AI公司可以完全不顧一切。輿論的影響也很重要。2023年11月,金山辦公開啟AI功能公測,很快有人發現,產品隱私政策提到,為提升AI功能準確性,將對用戶主動上傳的文檔材料,經脫敏處理后作為AI訓練的基礎材料使用。這一條款引起大量用戶不滿。

幾天后,金山辦公作出回應,承諾“所有用戶文檔不會被用于任何AI訓練目的”,以此平息這場風波。其CEO章慶元接受采訪時說,條款是舊的,只是針對PPT板式的美化,并不涉及用戶文檔,沒來得及更新,導致用戶誤解。

李昀鍇說,AI相關的知識版權界定,目前只能在司法實踐的個案探索,“普遍的共識是尊重商業實踐,即法律不會過度介入企業的自主行為。如果有知識產權,一般原則是歸屬于開發者進行分配?!?/p>

騰訊混元模型在相關條款中約定,生成內容的版權歸用戶所有,但“僅供個人學習、娛樂使用,不得將其用于任何商業化用途”。李昀鍇說,“其他公司就不是這么‘大方?!?/p>

目前呼聲較大的一種折中方案是,AI公司應該有一套解決方案去補償內容創作者,如果作品被用作AI訓練數據,創作者可以獲得一定的費用。短期來看,這將保護創作者的利益。至于更長遠會發生什么,誰也不能保證。

(應訪談對象要求,文中石露、高悅、馬群為化名)

摘自微信公眾號“智能涌現”

猜你喜歡
畫師模型
適用于BDS-3 PPP的隨機模型
p150Glued在帕金森病模型中的表達及分布
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
一位洋畫師的步步驚心大劇
小小畫師本領大
敦煌畫師,I服了YOU
3D打印中的模型分割與打包
萌娃遇上插畫師
插畫師筆下的時髦
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合