作者丨劉楊楠
編輯丨海腰
圖源丨Facebook
從前段時(shí)間的“三只羊”錄音事件到“AI雷軍”,AI的陰暗面再次引起熱議。
如今,“三只羊”事件水落石出,AI雷軍罵人的視頻也幾乎已被清理完畢,但大量AI生成的真假難辨、頗具魔幻現(xiàn)實(shí)主義的內(nèi)容卻是春風(fēng)吹又生。
很多人都發(fā)現(xiàn),抖音、快手、小紅書等平臺(tái)上的“抽象”內(nèi)容越來(lái)越多,很多甚至已經(jīng)違反了自然規(guī)律和常識(shí),有些內(nèi)容更是在道德和法律紅線上反復(fù)橫跳。然而,在時(shí)長(zhǎng)僅數(shù)秒的短視頻里,屏幕前的我們通常來(lái)不及反應(yīng)其是真是假,就已經(jīng)順手劃到了下一段視頻,或隨手轉(zhuǎn)發(fā)給一起搞抽象的朋友們。
在這個(gè)過(guò)程中,一個(gè)老生常談的問(wèn)題又出現(xiàn)了——質(zhì)量參差不齊的AI生成內(nèi)容病毒病毒式擴(kuò)散,互聯(lián)網(wǎng)似乎難逃“劣幣驅(qū)逐良幣”的宿命。
詭異的AIGC
今天的互聯(lián)網(wǎng)上,“眼見”和“耳聽”都不一定為實(shí)。AI加持下,劣質(zhì)內(nèi)容已經(jīng)變著花樣深入互聯(lián)網(wǎng)世界。
比如近期,在Facebook上搜索“蝦耶穌”,就會(huì)看到數(shù)十張類似下圖的詭異組合。
此外,F(xiàn)acebook上還流傳著大量詭異圖片:多頭、巨胸的“農(nóng)場(chǎng)女孩”;在泥濘的河流中跋涉的女乘務(wù)員又或是截肢乞丐舉著牌子上寫著“今天是我的生日”。
類似的內(nèi)容在國(guó)內(nèi)平臺(tái)也很常見,比如這條“悟空”沖出電視摟著奶奶,騎著電視柜變的電動(dòng)二輪瀟灑離去,只留“八戒”在畫面里無(wú)所適從的視頻。
在生成式AI加持下,Deepfake已經(jīng)進(jìn)化到全新的階段。
深度學(xué)習(xí)技術(shù)出現(xiàn)后,Deepfake便成為互聯(lián)網(wǎng)內(nèi)容世界的主流“病毒”。
其雛形最早可追溯至在上世紀(jì)90年代,當(dāng)時(shí)的研究人員嘗試使用CGI(Computer Generated Imagery / 計(jì)算機(jī)生成圖像)創(chuàng)建逼真的人像。但由于技術(shù)不成熟,社交網(wǎng)絡(luò)也不發(fā)達(dá),這些圖像并未引起太大社會(huì)關(guān)注。
直到2014年,深度學(xué)習(xí)技術(shù)來(lái)到一個(gè)關(guān)鍵轉(zhuǎn)折點(diǎn)。Ian Goodfellow及其團(tuán)隊(duì)引入了稱為生成對(duì)抗網(wǎng)絡(luò) (GAN) 的機(jī)器學(xué)習(xí)概念。GAN可用于生成逼真的數(shù)據(jù),增強(qiáng)現(xiàn)有數(shù)據(jù)集,以及進(jìn)行圖像、語(yǔ)音等多種類型的數(shù)據(jù)轉(zhuǎn)換和風(fēng)格遷移。
Goodfellow團(tuán)隊(duì)首次提出后,其他團(tuán)隊(duì)也在陸續(xù)改進(jìn)GAN。2017年,英偉達(dá)的研究人員開發(fā)出了“分階段訓(xùn)練網(wǎng)絡(luò)”(Progressive GANs),這種技術(shù)能夠生成高分辨率的人臉圖像。
正是這種功能被不當(dāng)使用,催生了病毒一般的Deepfake風(fēng)潮。同年,一位名為“deepfakes”的Reddit用戶開始用GAN制作情色視頻,足以以假亂真。此后,基于GAN生成或操縱音視頻的內(nèi)容造假事件,都被統(tǒng)稱為“Deepfake”。
今天,生成式AI讓互聯(lián)網(wǎng)上的Deepfake內(nèi)容越來(lái)越隱蔽,生產(chǎn)成本也越來(lái)越低。例如在“三只羊”錄音事件與惡搞雷軍的AI視頻中,網(wǎng)友只需在言域科技的Reecho睿聲平臺(tái)上傳5~8s語(yǔ)音素材,即可體驗(yàn)免費(fèi)的聲音克隆服務(wù);支付198元即可解鎖專業(yè)級(jí)聲音克隆。
低成本,高效率的生產(chǎn)模式,已經(jīng)讓一群人靠著AI生成內(nèi)容的副業(yè)賺得盆滿缽滿。
最近,外媒Intelligencer報(bào)道稱,YouTube、TikTok上,很多創(chuàng)作者在視頻中教粉絲們?nèi)绾斡肅hatGPT開展副業(yè)。
對(duì)于催生這種現(xiàn)象的原因,Intelligencer分析稱,像Facebook和TikTok這樣的網(wǎng)站對(duì)內(nèi)容的需求幾乎是無(wú)限的、不加選擇的,它們需要吸引用戶的誘餌和廣告商的地盤;另一方面,像ChatGPT、Midjourney等生成式AI應(yīng)用在投資人的大量資金支持下,將產(chǎn)品低成本或免費(fèi)提供給消費(fèi)者,以獲取更多用戶。
而在這些大平臺(tái)數(shù)十億的生意往來(lái)中,就藏著普通人的財(cái)富密碼。例如用AI生成一些食譜書,在亞馬遜上賣給不知情的顧客,或是建立一個(gè)由大語(yǔ)言模型生成文章的網(wǎng)站,拉一些廣告主簡(jiǎn)單包裝,并試圖讓它們?cè)诠雀栊侣勆吓琶芨摺?/p>
今年6月,國(guó)內(nèi)一位男性互聯(lián)網(wǎng)大廠技術(shù)員便運(yùn)用AI技術(shù)中的“一鍵去衣”功能,生成近7000張不良圖片,每張1.5元賣出,獲取了近1萬(wàn)元非法收益。
此外,一種更便捷、更直接的方式是,用類似“蝦耶穌”這類堆疊敏感元素的粗糙內(nèi)容收割流量,從而獲得平臺(tái)獎(jiǎng)金。
對(duì)于明顯的犯罪內(nèi)容,法律能夠約束,但對(duì)于一些畫風(fēng)詭異,不觸犯法律卻令人不適的AI內(nèi)容,人們只能寄希望于平臺(tái)能夠出手管一管。
平臺(tái)的反擊
“AI雷軍”熱度暴漲后,抖音快速清理了相關(guān)視頻。
一鍵刪除無(wú)疑是平臺(tái)治理違規(guī)內(nèi)容最有效的手段。但這種方法往往有滯后性,平臺(tái)采取行動(dòng)時(shí),相關(guān)內(nèi)容產(chǎn)生的負(fù)面影響可能已經(jīng)一發(fā)不可收拾。
長(zhǎng)期來(lái)看,內(nèi)容平臺(tái)們也試圖用一些監(jiān)管和技術(shù)手段,更及時(shí)地預(yù)防、檢測(cè)并處理隱患。
以抖音為例,很多“AI雷軍”罵人視頻和畫風(fēng)詭異的視頻下方都有一行小字:“疑似使用了AI生成技術(shù),請(qǐng)謹(jǐn)慎甄別?!?/p>
其實(shí)從去年開始,抖音便發(fā)布了一系列文件,包括《抖音關(guān)于人工智能生成內(nèi)容標(biāo)識(shí)的水印與元數(shù)據(jù)規(guī)范》《關(guān)于人工智能生成內(nèi)容的平臺(tái)規(guī)范暨行業(yè)倡議》《 AI生成虛擬人物治理公告》,全方位圍堵AI生成的違法內(nèi)容。
目前,國(guó)內(nèi)很多平臺(tái)都針對(duì)AIGC內(nèi)容出臺(tái)了相應(yīng)的監(jiān)管規(guī)范。除抖音外,B站、抖音、快手、微信公眾號(hào)、小紅書等平臺(tái)均在去年就發(fā)布相應(yīng)規(guī)范,要求創(chuàng)作者對(duì)AI創(chuàng)作內(nèi)容做出顯著標(biāo)識(shí)。
今年9月14日,國(guó)家網(wǎng)信辦也正式發(fā)布了《人工智能生成合成內(nèi)容標(biāo)識(shí)辦法(征求意見稿)》(下稱《標(biāo)識(shí)辦法》),擬細(xì)化網(wǎng)絡(luò)平臺(tái)和用戶的AI內(nèi)容標(biāo)識(shí)義務(wù),避免公眾混淆誤解。其中要求提供生成合成服務(wù)的網(wǎng)絡(luò)信息服務(wù)提供者,如果提供相關(guān)法規(guī)提及的深度合成服務(wù)類型,必須對(duì)生成合成內(nèi)容添加顯式標(biāo)識(shí)和不易被用戶明顯感知到的隱式標(biāo)識(shí)。
然而,要讓數(shù)以億計(jì)的創(chuàng)作者主動(dòng)約束自身行為,無(wú)疑比登天還難。更何況,很多時(shí)候創(chuàng)作者很難精準(zhǔn)預(yù)判內(nèi)容發(fā)布后的傳播走向,很可能在無(wú)意中就走向了風(fēng)口浪尖。
因此,一種不依賴于廣大用戶主觀能動(dòng)性的手段被頻繁提起,即“用AI檢測(cè)AI”。
2024年9月,YouTube便在一篇博客中透露,正在開發(fā)新工具來(lái)保護(hù)藝術(shù)家和創(chuàng)作者,能夠使創(chuàng)作者、演員、音樂家、運(yùn)動(dòng)員等任何人都可以檢測(cè)YouTube上關(guān)于自己的AI生成內(nèi)容,并對(duì)其進(jìn)行管理。
YouTube還在開發(fā)Content ID的新技術(shù),將允許藝術(shù)家和音樂家發(fā)現(xiàn)和管理模仿他們歌聲的AI 生成內(nèi)容。目前,YouTube的合作伙伴正在完善這項(xiàng)技術(shù),并計(jì)劃于明年初推出一項(xiàng)試點(diǎn)計(jì)劃。
Facebook官網(wǎng)上也有關(guān)于AI配合內(nèi)容審查的操作,官網(wǎng)博客寫道:“人工智能團(tuán)隊(duì)首先會(huì)構(gòu)建一個(gè)機(jī)器學(xué)習(xí)模型,該模型可執(zhí)行識(shí)別照片中的具體內(nèi)容或分析帖子文本等操作。例如,他們可以構(gòu)建人工智能模型,并利用此模型了解某項(xiàng)內(nèi)容中是否包含裸露內(nèi)容或血腥內(nèi)容。然后,這些模型可以確定是否需要對(duì)相應(yīng)內(nèi)容采取操作,例如將其從平臺(tái)中移除或減少其傳播?!?/p>
今年2月,Meta(Facebook的母公司)也透露已經(jīng)開始在Facebook、Instagram和Threads上標(biāo)記使用人工智能工具創(chuàng)建的圖像,并對(duì)不披露AI生成視頻或音頻的用戶進(jìn)行懲罰。
但相比之下,國(guó)內(nèi)平臺(tái)對(duì)于AI生成虛假內(nèi)容的檢測(cè)似乎并沒有太多主動(dòng)措施。此前也有業(yè)內(nèi)人士對(duì)媒體表示,出于自身成本及監(jiān)管力度等綜合原因,目前互聯(lián)網(wǎng)平臺(tái)對(duì)AI偽造內(nèi)容的管理意愿還不高。而現(xiàn)在對(duì)于發(fā)布者沒有主動(dòng)標(biāo)識(shí)的AI生成內(nèi)容,平臺(tái)并不會(huì)自動(dòng)檢測(cè)。
畢竟,在這場(chǎng)AIGC的角逐中,大廠們都還是競(jìng)技場(chǎng)中的主要玩家,更多的精力還投入在如何將新技術(shù)融入自身業(yè)務(wù)體系上。
例如去年9月,B站多媒體實(shí)驗(yàn)室算法負(fù)責(zé)人成超便在訪談中表示:“我們正在采用AI換臉制作個(gè)性化的直播虛擬禮物”,“采用AI換臉,我們能夠整體替換掉主播人臉建模這一生產(chǎn)環(huán)節(jié),并且AI換臉?biāo)秩境鰜?lái)的微表情、妝容甚至比建模還具有真實(shí)感。完整的個(gè)性化禮物制作周期與成本也被極大地壓縮,在同樣資源條件下,我們能夠?yàn)橛脩籼峁└喔幸馑嫉耐娣ê蛢?nèi)容。”
AIGC正在“摧毀”AI?
對(duì)于這些互聯(lián)網(wǎng)上瘋狂彌漫的AI生成內(nèi)容,很多聲音擔(dān)心AI會(huì)快速污染互聯(lián)網(wǎng)內(nèi)容生態(tài)。
事實(shí)上,這已經(jīng)在發(fā)生。亞馬遜研究人員今年6月發(fā)布的一項(xiàng)研究結(jié)果顯示,目前已有57%的網(wǎng)絡(luò)內(nèi)容都由AI生成。
由此帶來(lái)的問(wèn)題是,當(dāng)AI生成的劣質(zhì)內(nèi)容越來(lái)越多,模型訓(xùn)練廠商抓取公開數(shù)據(jù)訓(xùn)練模型時(shí),AI生成劣質(zhì)內(nèi)容的含量也越來(lái)越高,無(wú)形之中就可能讓模型誤入歧途。
近期已有國(guó)外研究團(tuán)隊(duì)發(fā)現(xiàn),AI生成內(nèi)容不僅在加速互聯(lián)網(wǎng)崩塌,甚至還有“自我摧毀”的風(fēng)險(xiǎn)。
今年8月,牛津大學(xué)的Ilia Shumailov博士和研究團(tuán)隊(duì)在《Nature》上發(fā)表研究發(fā)現(xiàn),當(dāng)生成式人工智能軟件僅僅依賴于AI生成的內(nèi)容訓(xùn)練時(shí),最終表現(xiàn)就會(huì)開始下降。
這項(xiàng)研究中的一個(gè)案例是,研究人員用一個(gè)模型來(lái)學(xué)習(xí)識(shí)別不同品種的狗,每一次問(wèn)答之后,都將模型自己生成的答案作為新的數(shù)據(jù)投入模型訓(xùn)練,多個(gè)回合后,模型開始表現(xiàn)出一種難以解釋的“偏見”——在模型生成的答案中,金毛等更常見的品種出現(xiàn)頻次越來(lái)越高,而相對(duì)小眾的品種逐漸被排除在外。
圖源:福布斯
研究人員將這種現(xiàn)象稱為“模型崩潰”,即AI生成內(nèi)容不斷污染模型訓(xùn)練數(shù)據(jù)集,最終會(huì)導(dǎo)致模型對(duì)現(xiàn)實(shí)世界的理解能力直線下降,生成大量扭曲現(xiàn)實(shí)的劣質(zhì)內(nèi)容。
目前研究人員還無(wú)法解釋為什么會(huì)出現(xiàn)“模型崩潰”現(xiàn)象,但由此得出的結(jié)論是,人工智能長(zhǎng)期可持續(xù)發(fā)展的唯一途徑,是確保其能夠持續(xù)獲取人類生成的原始數(shù)據(jù)。
而另一方面,已有的人類生成內(nèi)容也正在互聯(lián)網(wǎng)上消失。皮尤研究中心的最新分析顯示,截至2023年10月,2013年至2023年期間存在的所有網(wǎng)頁(yè)中,已有四分之一無(wú)法再訪問(wèn)。
這便形成了一個(gè)悖論:AI需要人類提供源源不斷的原始數(shù)據(jù),但人類生成的內(nèi)容正在逐漸消失,AI生成內(nèi)容卻在互聯(lián)網(wǎng)上病毒式擴(kuò)散。
當(dāng)然,隨著模型性能不斷提升,模型生成內(nèi)容將越來(lái)越接近現(xiàn)實(shí)世界,這項(xiàng)研究的結(jié)論或許終將被推翻,但這些模糊了真與假、虛擬與現(xiàn)實(shí)邊界的內(nèi)容所帶來(lái)的影響,或許是不可逆的。
這種影響可能并非是一場(chǎng)驚天動(dòng)地的“內(nèi)容革命”,而是無(wú)形之中啟動(dòng)的“蝴蝶效應(yīng)”,將所有人推向一個(gè)混沌的超現(xiàn)實(shí)世界,沒有人能置身事外。
本文為創(chuàng)業(yè)邦原創(chuàng),未經(jīng)授權(quán)不得轉(zhuǎn)載,否則創(chuàng)業(yè)邦將保留向其追究法律責(zé)任的權(quán)利。如需轉(zhuǎn)載或有任何疑問(wèn),請(qǐng)聯(lián)系editor@cyzone.cn。