編者按:本文來(lái)自微信公眾號(hào) 騰訊研究院(ID:cyberlawrc),作者:李豐 童祁,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
人類藝術(shù)家與人工智能的交鋒日益激烈,糾葛纏繞如火如荼。
去年,游戲設(shè)計(jì)師杰森·艾倫借助Midjourney模型生成了《太空歌劇院》,這是首個(gè)獲得獎(jiǎng)項(xiàng)的AI生成藝術(shù)作品,也是生成式人工智能在藝術(shù)界引發(fā)巨大震蕩的導(dǎo)火索。
從游戲到動(dòng)畫(huà),許多行業(yè)的畫(huà)師們,都感受到前所未有的壓力。與此同時(shí),好萊塢編劇與演員的全面罷工,也與人類藝術(shù)家拒絕用自己的影像、聲音和文字作品去訓(xùn)練AI,有著莫大關(guān)聯(lián)。而近期,當(dāng)代最著名的藝術(shù)家之一大衛(wèi)·霍克尼宣布加入了使用生成式人工智能作畫(huà)的隊(duì)伍,他即將推出的AIGC作品,必將掀起新一輪的討論熱潮。
《太空歌劇院》成為首個(gè)獲獎(jiǎng)的AI生成藝術(shù)作品
層出不窮的應(yīng)用讓AIGC成為了藝術(shù)創(chuàng)作領(lǐng)域的風(fēng)口與焦點(diǎn)。
在圖像領(lǐng)域,如果說(shuō)曾經(jīng)利用GAN網(wǎng)絡(luò)進(jìn)行圖像生成、圖像修復(fù)、風(fēng)格遷移,只是少部分專業(yè)人士的專屬工具,那以Midjourney為代表的LLMs新興應(yīng)用的進(jìn)化,讓普羅大眾可以用自然語(yǔ)言、通過(guò)在用戶框輸入文字的方式,生成圖像作品,極大降低了藝術(shù)的門(mén)檻。
在視頻制作領(lǐng)域,以GEN-2為代表的多模態(tài)人工智能系統(tǒng),激發(fā)了用文本、圖像或視頻片段來(lái)生成嶄新視頻的可能;網(wǎng)上出現(xiàn)很多創(chuàng)作者,先用Midjourney生成圖片,再用GEN-2生成鏡頭,將其剪輯成為視頻。
在設(shè)計(jì)領(lǐng)域,AIGC也表現(xiàn)出強(qiáng)大潛力,比如在建筑領(lǐng)域已經(jīng)開(kāi)始出現(xiàn)各種應(yīng)用,其在各個(gè)設(shè)計(jì)領(lǐng)域的廣泛鋪開(kāi)只是個(gè)時(shí)間問(wèn)題。
這些成果給人們帶來(lái)了很多新奇與震撼,并被嗅覺(jué)敏銳的藝術(shù)從業(yè)者迅速轉(zhuǎn)換為生產(chǎn)工具,也引發(fā)了人們的豐富聯(lián)想與熱切討論,AI會(huì)不會(huì)徹底取代人類藝術(shù)家?本文試圖將這個(gè)疑問(wèn)轉(zhuǎn)化為一個(gè)更具體的問(wèn)題,即AIGC應(yīng)用于藝術(shù)領(lǐng)域的“限度”在哪里:AI在藝術(shù)領(lǐng)域中能做什么,不能做什么?這涉及到幾個(gè)要點(diǎn):深度學(xué)習(xí)的原理機(jī)制所決定的AI的能力范圍是什么?藝術(shù)概念在本文背景下有哪些相關(guān)內(nèi)涵,以及心智哲學(xué)對(duì)AI主體地位的認(rèn)定等。
在這些思考框架內(nèi),再來(lái)探討AI能否改寫(xiě)藝術(shù)、取代人類藝術(shù)家,才更有指涉和反思的意義。
深度學(xué)習(xí)的原理機(jī)制
我們自AlphaGo開(kāi)始熱議的AI,其實(shí)都是基于深度學(xué)習(xí)技術(shù)的。深度學(xué)習(xí)的最大優(yōu)勢(shì)在于能讓機(jī)器自己去發(fā)現(xiàn)海量數(shù)據(jù)中的規(guī)律和結(jié)構(gòu)。它的實(shí)現(xiàn)機(jī)制,簡(jiǎn)單來(lái)說(shuō),是由訓(xùn)練者提供某個(gè)復(fù)雜領(lǐng)域里的大量樣本,讓機(jī)器用萬(wàn)能函數(shù)來(lái)擬合這些樣本,以獲得編碼了樣本特征的參數(shù)集,從而實(shí)現(xiàn)對(duì)樣本的模式構(gòu)建和結(jié)構(gòu)刻畫(huà),建立起模型用以處理與訓(xùn)練樣本同類的新樣本。[1]
由此,我們可以看到關(guān)鍵的一點(diǎn),訓(xùn)練的目的在于找到給定樣本中的共同模式與結(jié)構(gòu),那么對(duì)于樣本范圍內(nèi)的重復(fù)性問(wèn)題,深度學(xué)習(xí)所建立的模型可以有效處理。但對(duì)于完全超出訓(xùn)練樣本范圍的新情況,這個(gè)模型就失效了。就像原初的AlphaGo可以從海量棋譜中擬合出圍棋的取勝之道,卻不能用來(lái)下五子棋。所以深度學(xué)習(xí)式AI擅長(zhǎng)以“模仿”的方式處理那些并非簡(jiǎn)單重復(fù)的重復(fù)性工作。
我們生活中大部分工作都屬于這種性質(zhì),AI得以被廣泛應(yīng)用也正是因?yàn)槿绱?。但深度學(xué)習(xí)的原理又決定了AI很難進(jìn)行從無(wú)到有的創(chuàng)造性活動(dòng),因?yàn)樗陌l(fā)揮空間并不能超出給定的樣本范圍,做出范式性突破。正是這個(gè)技術(shù)特性構(gòu)成了AI在藝術(shù)領(lǐng)域的應(yīng)用的根本限制。
深度學(xué)習(xí)被定義為基于人工神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)和人工智能的子集。[2]
另一方面,這些原理也決定了AI注定采用一種“外延式”處理方式。AI對(duì)于處理以結(jié)果為導(dǎo)向的問(wèn)題非常有效,但并不像人類那樣理解一個(gè)操作背后的含義。塞爾的中文屋思想實(shí)驗(yàn)很好地展現(xiàn)了這一點(diǎn)。假設(shè)一個(gè)完全不懂中文的英語(yǔ)人士被關(guān)在一個(gè)房間里,手邊有一本用英文寫(xiě)的關(guān)于如何排列中文符號(hào)的規(guī)則書(shū)。房外一個(gè)懂中文的人通過(guò)一個(gè)小窗口向房間里傳遞用中文寫(xiě)的問(wèn)題。房間里的人則按照規(guī)則書(shū)的指示,從一堆中文符號(hào)中組合適當(dāng)?shù)姆?hào)作為答案?jìng)鬟f出去。在房外的人看來(lái)房間里的人是懂中文的,但實(shí)際上房里的人只是在機(jī)械地執(zhí)行規(guī)則書(shū)上的指令。后面我們將看到,這個(gè)技術(shù)特性也構(gòu)成AI應(yīng)用在藝術(shù)領(lǐng)域的限制。[3]
藝術(shù)概念的內(nèi)涵
提到藝術(shù),我們首先會(huì)想到的可能是畫(huà)作。但一幅“畫(huà)作”并不等同于作為物理物的畫(huà)布與顏料,也并非色塊的位置關(guān)系,甚至不是單純的圖像本身,而是前面這些因素疊加創(chuàng)作者和欣賞者特定的主觀意向。
一個(gè)典型的例子是阿瑟·丹托在《尋常物的嬗變》中提到的。他設(shè)想了九塊物理性質(zhì)完全相同的紅色畫(huà)布,分別由九位不同的藝術(shù)家在不同時(shí)期以不同目的創(chuàng)作,并展示給不同的觀眾。因?yàn)樘幱诓煌恼Z(yǔ)境,作者與觀者對(duì)同樣圖像有著不同賦義,因此這些紅色塊有的是肖像畫(huà),有的是風(fēng)景畫(huà),有的是靜物畫(huà),有的是抽象畫(huà)……盡管它們?cè)谕庥^上看起來(lái)相同,但它們的藝術(shù)意義卻完全不同。
甚至寫(xiě)實(shí)類作品也是如此。寫(xiě)實(shí)畫(huà)作并不是機(jī)械復(fù)制,也并不存在一個(gè)客觀標(biāo)準(zhǔn)來(lái)決定一幅寫(xiě)實(shí)畫(huà)作的好壞,而依然依賴于作者和觀者的主觀評(píng)判,依賴于一個(gè)賦義的過(guò)程。也就是說(shuō),一幅畫(huà)作不僅是物理和圖像層面的,還與作者和觀者的意向所指有關(guān),而AI生成圖像這個(gè)過(guò)程卻不存在這個(gè)維度。
而在當(dāng)代藝術(shù)中,這個(gè)特征更加明顯。當(dāng)代藝術(shù)突破了傳統(tǒng)平面繪畫(huà)形式,結(jié)合多種媒介和技術(shù)創(chuàng)造出豐富多樣的藝術(shù)新形式。相比傳統(tǒng)繪畫(huà)注重畫(huà)面形象的表現(xiàn),當(dāng)代藝術(shù)天然更注重于表達(dá)藝術(shù)家的思想,作品的意義和觀念常常比其物理載體更加重要。最極端的如現(xiàn)成物藝術(shù),其作為藝術(shù)作品的實(shí)現(xiàn)完全依賴于作者與觀眾在超越實(shí)物層面上的意領(lǐng)神會(huì)。藝術(shù)家傾向于借作品去探討社會(huì)、政治、文化和哲學(xué)等議題,引發(fā)觀眾的思考與反響。當(dāng)代藝術(shù)還往往以反傳統(tǒng)為取向,不斷打破既有藝術(shù)傳統(tǒng)和固有觀念的束縛而追求創(chuàng)新性和獨(dú)特性。
媒介和形式的多樣性以及對(duì)作品背后觀念的強(qiáng)調(diào)都使得當(dāng)代藝術(shù)極難從外延上被定義和把握。那么按照我們上面對(duì)深度學(xué)習(xí)原理的描述,這個(gè)關(guān)鍵的意義產(chǎn)生過(guò)程是AIGC所不涉及的。
換言之,AIGC的作品借助符號(hào)和圖像的排列甚至可以對(duì)人類情感進(jìn)行表征,但作品所傳達(dá)出的情感卻只是來(lái)自對(duì)人類情感表征方式的模仿,而不是人類情感的內(nèi)涵本身。
2022年底,紐約現(xiàn)代藝術(shù)博物館(MoMA)展示了特別展覽項(xiàng)目《無(wú)人監(jiān)控》(Unsupervised),呈現(xiàn)藝術(shù)家雷菲克·阿納多爾利用人工智能演繹的館藏藝術(shù)、設(shè)計(jì)和攝影作品,這些作品經(jīng)過(guò)分析、數(shù)字化、輸入算法后,在巨大的LED墻中呈現(xiàn)出來(lái),被認(rèn)為是機(jī)器的幻覺(jué)和夢(mèng)境。[4]
心智哲學(xué)問(wèn)題
我們可以發(fā)現(xiàn),前面所強(qiáng)調(diào)的賦義能力和創(chuàng)造力與人類作者和觀眾作為意識(shí)主體有著密切聯(lián)系,而AI缺失了這兩種能力。這就關(guān)涉到一個(gè)更深層次的經(jīng)典哲學(xué)問(wèn)題,即AI是否可能具有意識(shí)并成為人類這樣的意識(shí)主體,或者說(shuō),強(qiáng)人工智能目標(biāo)能否實(shí)現(xiàn)?
一種流行的心智哲學(xué)觀點(diǎn)——功能主義/計(jì)算主義——認(rèn)為答案是肯定的,它們主張人類心智可以還原為擁有特定功能的計(jì)算結(jié)構(gòu);反之,如果特定計(jì)算結(jié)構(gòu)能夠?qū)崿F(xiàn)人類心智的全部功能,那么也就可以認(rèn)為這個(gè)程序具有了意識(shí)以及相應(yīng)的倫理主體資格。很多科幻作品正是基于這個(gè)前提展開(kāi)的。
但這個(gè)預(yù)設(shè)本身是富有爭(zhēng)議的。如果計(jì)算主義為真,那么AI就能成為硅基的意識(shí)主體,并憑借其強(qiáng)大智能在藝術(shù)領(lǐng)域全面超越人類藝術(shù)家。那么在此討論AI的應(yīng)用限度就變成了一個(gè)偽問(wèn)題。對(duì)計(jì)算主義的主要質(zhì)疑和反對(duì)意見(jiàn)在于,除了計(jì)算等特定智能功能,人類意識(shí)的其他方面如情感、感覺(jué)、創(chuàng)造力等能不能被還原為計(jì)算結(jié)構(gòu)?或如塞爾的中文屋思想實(shí)驗(yàn)想表明的那樣,即使一臺(tái)計(jì)算機(jī)能夠在外在表現(xiàn)上像人類一樣完美——譬如通過(guò)了圖靈測(cè)試(圖靈測(cè)試作為標(biāo)準(zhǔn)在目前的技術(shù)發(fā)展下已經(jīng)過(guò)時(shí)),也不能證明它像人類一樣真正理解了語(yǔ)言或具有相同的意識(shí)內(nèi)容。當(dāng)然,這又會(huì)引發(fā)計(jì)算主義者的反駁和批評(píng)……
在此我們并不打算展開(kāi)心智哲學(xué)討論。我們姑且認(rèn)為,至少基于深度學(xué)習(xí)的AI暫時(shí)無(wú)法具有與人類等同的心智能力,特別是創(chuàng)造能力。這也是本文的立足點(diǎn)所在。基于這個(gè)前提,我們就可以去考察下AIGC在藝術(shù)領(lǐng)域的應(yīng)用限度。
AIGC能做什么
我們可以確定,像很多其他領(lǐng)域一樣,如工程領(lǐng)域,AI可以替代藝術(shù)實(shí)踐中大部分的重復(fù)性工作。事實(shí)上,正如我們?cè)陂_(kāi)頭提到的那樣,AIGC已經(jīng)得到了廣泛應(yīng)用或展現(xiàn)了強(qiáng)大潛力,由AI在這些領(lǐng)域承擔(dān)大部分工作的愿景指日可待,同時(shí)作為工具助手,提高生產(chǎn)力。
我們完全可以想見(jiàn)AI如何廣泛參與到當(dāng)代藝術(shù)的創(chuàng)作中去。因?yàn)榇蟛糠之?dāng)代藝術(shù)作品都由基于語(yǔ)言描述的作品方案轉(zhuǎn)化而來(lái),而ChatGPT這樣的通用語(yǔ)言模型完全可以參與到作品方案的生成中去。雖然我們已經(jīng)指出,當(dāng)代藝術(shù)注重顛覆性而深度學(xué)習(xí)無(wú)法提供真正的突破,但在實(shí)踐中,大部分當(dāng)代藝術(shù)作品并不總是跳出既有藝術(shù)范式,所以AI依然可以為藝術(shù)家提供很大的幫助。
總的來(lái)說(shuō),AI在藝術(shù)領(lǐng)域的作用可以體現(xiàn)在三個(gè)方面:一是一些非創(chuàng)意性的技術(shù)性工作,替代藝術(shù)家的體力或低級(jí)腦力勞動(dòng),類似于藝術(shù)家的執(zhí)行助手;二是為藝術(shù)家提供輔助性參考,無(wú)論是視覺(jué)圖像還是文字方案,AI都可以提供一些前期材料,幫助藝術(shù)家擴(kuò)展思路,激發(fā)靈感;三是降低了藝術(shù)門(mén)檻,使之前被認(rèn)為是“外行”的人也可以參與進(jìn)來(lái),譬如讓沒(méi)有造型能力但有想法的愛(ài)好者用提示詞來(lái)創(chuàng)作一幅畫(huà),或讓沒(méi)有拍攝條件的普通人自主生成一部電影。
AIGC的應(yīng)用限度
另一方面,根據(jù)前述原理與概念分析,特別是基于深度學(xué)習(xí)式AI無(wú)法擁有人類所有心智能力的前提,我們可以看到AI在藝術(shù)領(lǐng)域的局限性所在。
我們提到,深度學(xué)習(xí)本質(zhì)上是經(jīng)驗(yàn)回溯式的,其在重復(fù)性工作領(lǐng)域的高效恰恰注定意味著其在創(chuàng)新領(lǐng)域的失效,其對(duì)既有藝術(shù)作品的充分模仿也意味著如此產(chǎn)生的作品注定失去了藝術(shù)強(qiáng)調(diào)的創(chuàng)新性。一件藝術(shù)作品只有不能被深度學(xué)習(xí)根據(jù)藝術(shù)史經(jīng)驗(yàn)建立的模型所擬合,才算得上“創(chuàng)新之作”。因此深度學(xué)習(xí)式AI無(wú)論如何也無(wú)法產(chǎn)生出杜尚的《泉》這樣劃時(shí)代的作品。這種失效內(nèi)在于深度學(xué)習(xí)原理機(jī)制和藝術(shù)概念本身,不可能隨著算法改進(jìn)而解決。
AI或可以完成一部作品中的很多步驟,但仍只是作為工具手段而存在,而無(wú)法承擔(dān)作者責(zé)任,擁有作者權(quán)利。如同藝術(shù)家的助手參與了一件作品的制作卻并不會(huì)因此成為作品的作者一樣,那個(gè)確定了主題方向、下達(dá)了指令并敲定了作品最終效果的人才被認(rèn)為是作品的作者。在借助AI進(jìn)行的藝術(shù)創(chuàng)作中,AI可能能夠提供出現(xiàn)成的圖像或多個(gè)參考方案,而使用者只需略作修改甚至只需做出選擇即可,但正是使用者提供的提示詞以及做出的篩選和敲定才是讓一幅圖像成為他的一件作品的關(guān)鍵。正是這個(gè)過(guò)程實(shí)現(xiàn)了“創(chuàng)造”與“賦義”。
因?yàn)闆Q定著作品質(zhì)量依然是人為的選定,所以AI的鋪開(kāi)看似降低了操作層面的藝術(shù)門(mén)檻,但對(duì)于使用者的藝術(shù)素質(zhì)要求并沒(méi)有降低。AI能夠產(chǎn)出什么樣的作品,依然取決于使用者的藝術(shù)水平。缺乏專業(yè)素養(yǎng)的使用者并不能很好駕馭AI持續(xù)產(chǎn)出高質(zhì)量作品,正如照相機(jī)本身并不會(huì)讓照相機(jī)的使用者都成為攝影師。
AI與藝術(shù)的未來(lái)?
在現(xiàn)階段,只要AI不被成為意識(shí)主體,那么AI的意義就仍在于作為工具將人從重復(fù)性腦力勞動(dòng)中解放出來(lái)。在藝術(shù)創(chuàng)作過(guò)程中存在著的低創(chuàng)意要素藝術(shù)活動(dòng)對(duì)于AI就具有很強(qiáng)的可替代性。但AI的介入并不會(huì)損害人類藝術(shù)家整體的主體地位,猶如藝術(shù)家借助助手創(chuàng)作并不會(huì)否定藝術(shù)家的成就,AI在此所做的始終是輔助工作,一部作品最有價(jià)值的部分依然有賴于人類藝術(shù)家完成。
AI技術(shù)的普及也可以讓藝術(shù)家擺脫低級(jí)腦力活動(dòng)而集中精力于作為核心的創(chuàng)意本身,從而拓展能力范圍,提升創(chuàng)作效率。長(zhǎng)期來(lái)看,AI介入藝術(shù)會(huì)加快藝術(shù)史的進(jìn)化速度。每當(dāng)進(jìn)入一個(gè)新的藝術(shù)范式,AI就可以以已有作品為樣本庫(kù)而將相關(guān)的各種可能性迅速挖掘出來(lái),從而加快藝術(shù)范式成熟,促使藝術(shù)家們更早開(kāi)始新突破,打開(kāi)新的維度。
同時(shí)應(yīng)該看到,當(dāng)AI快速模仿從古至今的藝術(shù)作品,生成出關(guān)于藝術(shù)也是現(xiàn)實(shí)的擬象。當(dāng)人類的創(chuàng)造力受桎梏于人工智能時(shí),當(dāng)AI的訓(xùn)練素材已經(jīng)窮竭,新的藝術(shù)范式如何誕生,也是無(wú)法回避的問(wèn)題。
參考資料來(lái)源:
[1]Hornik, K., Stinchcombe, M., & White, H. (1989). Multilayer feedforward networks are universal approximators. Neural networks, 2(5), 359-3663
[2]Deep learning vs. Machine learning vs. Artificial Intelligence, https://www.javatpoint.com/deep-learning-vs-machine-learning-vs-artificial-intelligence.
[3]Boden, M. A. (2018). Creativity and artificial intelligence. Artificial Intelligence, 257, 1-15.
[4]澎湃新聞,以人工智能呈現(xiàn)的MoMA館藏,除了夢(mèng)境還有什么?https://k.sina.cn/article_5044281310_12ca99fde02001xnay.html?from=tech.
本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn),不代表創(chuàng)業(yè)邦立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問(wèn),請(qǐng)聯(lián)系editor@cyzone.cn。