OpenAI最近又推出新王炸產(chǎn)品——Sora,將文生視頻推向了新高度。
相信不少朋友最近都被Sora生成的內(nèi)容驚艷掉。在各大短視頻平臺(tái)和社交媒體,文生視頻模型Sora成為人們熱議的焦點(diǎn),諸如“顛覆影視、廣告行業(yè)”“通用人工智能時(shí)代即將到來(lái)”以及“人類要完!”等等評(píng)價(jià)Sora的驚爆言論層出不窮。
(圖:Sora生成視頻截圖 一位20多歲的年輕人坐在天空中一片云讀上讀著一本書)
無(wú)論是東京街頭漫步的皮夾克女士,還是紐約街頭成為群鯨遨游的"亞特蘭蒂斯",亦或是戴著紅色針織帽的宇航員。無(wú)論從畫面的光影感、細(xì)節(jié)還是想象力與合理性,Sora生成的視頻都足夠以假亂真。不知道的人一定認(rèn)為是某個(gè)廣告公司或者影視公司的作品。有媒體文章稱其為AI版的“神筆馬良”可謂毫不夸張。
(圖:Sora生成視頻截圖 一位時(shí)尚女士穿著一件黑色皮夾克,一條長(zhǎng)紅裙和黑色靴子,收納一個(gè)黑色手袋,戴著太陽(yáng)鏡和紅色口紅在一個(gè)充滿溫暖霓虹燈光和動(dòng)態(tài)城市標(biāo)志的東京街道上走著,她走路既自信又隨意,街道潮濕且有反光效果,創(chuàng)造出五彩斑斕燈光的鏡面效果,許多行人來(lái)來(lái)往往)
(圖:Sora生成視頻截圖 紐約市像亞特蘭蒂斯一樣沉默,鯨魚、海龜和鯊魚在紐約街道游泳)
和Sora生成的視頻內(nèi)容相比,此前的文生視頻就顯得很幼稚低級(jí)。按照Sora的發(fā)展速度,通過語(yǔ)言就能指揮AI創(chuàng)作電影級(jí)、廣告級(jí)視頻,這對(duì)很多行業(yè)都帶來(lái)巨大的顛覆比如自動(dòng)駕駛。
Sora為什么讓世人如此震撼?在于她的進(jìn)化的速度太快了,大大超乎了人們的想象。特別是對(duì)物理世界的理解和模擬。
此前文生圖就經(jīng)常被用戶詬病結(jié)果不符合常識(shí),比如想要生成一張佛跳墻的菜,結(jié)果生成了佛祖跳墻的圖。這個(gè)情況在文生視頻方面是更大的阻礙。比如符合物理世界規(guī)律的跳躍和下落;以及咬了一口的食物會(huì)少一部分,且會(huì)出現(xiàn)咬痕;相互碰撞的汽車會(huì)有碰撞的痕跡等等。
而從目前Sora的表現(xiàn)來(lái)看,她已經(jīng)解決了這個(gè)難題。這意味著Sora能通過大量的視頻學(xué)習(xí),理解和模擬現(xiàn)實(shí)世界,生成符合現(xiàn)實(shí)世界規(guī)律的視頻內(nèi)容,進(jìn)化下去不可想象。OpenAI方面表示,Sora將成為實(shí)現(xiàn)AGI的重要里程碑。
(圖:Sora生成視頻截圖 一個(gè)巨大、高聳的云朵形成了一個(gè)男人的形狀籠罩在地球上方,云男發(fā)射閃電擊向地球)
那么問題來(lái)了,Sora真的會(huì)顛覆影視、廣告行業(yè)嗎?短期內(nèi)看,技術(shù)的進(jìn)步將帶來(lái)行業(yè)的變革是毋庸置疑的。首先是效率和成本方面,至少用Sora去出Demo,去完成部分場(chǎng)景會(huì)讓整個(gè)視頻的制作效率大大提升,成本也會(huì)下降很多。
但是,相比人工智能生成的內(nèi)容而言,人們更喜歡看真實(shí)的表演,AI可以模擬很多場(chǎng)景,卻模擬不了不同演員的個(gè)性化表演。很多知名影視IP比如金庸老先生的武俠劇被一再重拍,就在于各個(gè)版本都可以詮釋自己對(duì)人物的理解,甚至這些不同的詮釋還成為人們談?wù)摰慕裹c(diǎn),比如黃日華版的郭靖,胡軍版的肖峰都深入人心。
現(xiàn)在國(guó)內(nèi)3D動(dòng)畫發(fā)展的突飛猛進(jìn),優(yōu)秀作品層出不窮,比如斗羅大陸、吞噬星空、斗破蒼穹、少年歌行。但是真人拍攝影視作品仍然令人期待,甚至有時(shí)真人拍攝在制作周期,和口碑評(píng)價(jià)上甚至能與3D作品一較高下,甚至更勝一籌。
Sara的出現(xiàn),對(duì)影視、廣告業(yè)是一種加持,甚至?xí)?lái)變革。善于應(yīng)用的仍然是懂得光影技術(shù)、懂得導(dǎo)演、懂得美學(xué)的專業(yè)人士。在Sora時(shí)代,視頻制作方面將會(huì)崛起更多的個(gè)人IP。過去憑借一個(gè)團(tuán)隊(duì)才能干的事,現(xiàn)在可能小團(tuán)隊(duì)就能干了,而且效率很高。
不得不說,AI內(nèi)容很多時(shí)候能幫忙打開思路,甚至給到驚喜。但是按照要求生成自己預(yù)期內(nèi)的視頻這一最基本的需求卻往往不能很好地實(shí)現(xiàn)。至少目前來(lái)說,還做不到。今后能否讓Sora生成風(fēng)格、故事邏輯、人物都連續(xù)的影視級(jí)視頻還將是一個(gè)不小的挑戰(zhàn)。
當(dāng)然也有一種擔(dān)心,就是對(duì)Sora的濫用。比如有了ChatGPT以后,出現(xiàn)了大量AI撰寫的小說,和AI文生圖、AI配音的小說推薦視頻,以及充斥在今日頭條、百度百家等各大媒體平臺(tái)的AI生成內(nèi)容。這些內(nèi)容能以吸眼球的標(biāo)題獲得平臺(tái)推薦,賺取流量,但是內(nèi)容卻十分不耐讀,和人寫的內(nèi)容還是有比較明顯的差別。甚至一度出現(xiàn)了內(nèi)容方面的劣幣驅(qū)逐良幣的效果。
因?yàn)槲艺J(rèn)真撰寫的深度報(bào)道可能流量還不如這些沒有靈魂的AI內(nèi)容。這倒逼很多優(yōu)質(zhì)創(chuàng)作者也紛紛放棄精耕細(xì)作,也使用AI來(lái)批量生產(chǎn)內(nèi)容,這對(duì)整個(gè)內(nèi)容生態(tài)其實(shí)是一種破壞。
從系統(tǒng)的角度,AI內(nèi)容的出現(xiàn),對(duì)于現(xiàn)實(shí)世界的內(nèi)容生態(tài)其實(shí)某種意義上是一種生物入侵。秩序一旦被打破,將會(huì)出現(xiàn)一段時(shí)間的混亂,再重新形成新的平衡。混亂期,也許我們很難分清現(xiàn)實(shí)與虛擬。而現(xiàn)在就是那個(gè)混亂階段。需要構(gòu)建新的制度來(lái)規(guī)范AI內(nèi)容的發(fā)展。
另外,在很多科幻小說和影視作品中提出的,AI自主意識(shí)覺醒問題也值得關(guān)注,AI會(huì)不會(huì)擁有自主意識(shí),目前Sora已經(jīng)具備了物理世界的認(rèn)知,如果AI能理解人的情感和精神世界,那么AI就幾乎擁有了人的靈魂和認(rèn)知。AI自主意識(shí)覺醒后會(huì)不會(huì)與人類爭(zhēng)奪這個(gè)世界的主導(dǎo)權(quán)?人類創(chuàng)造AI,會(huì)不會(huì)是打開潘多拉的盒子,最后自己被反噬。這些問題細(xì)思極恐,但是現(xiàn)在可能到了要正視這些問題的時(shí)候。
過去幾百年,人類科技的發(fā)展速度如此之快,特別是最近20年,物聯(lián)網(wǎng)技術(shù)、人工智能、生物技術(shù)、能源技術(shù)、材料技術(shù)、太空技術(shù),真可謂突飛猛進(jìn),而這短短的幾百年甚至人類幾千年的歷史對(duì)于地球存在的時(shí)間而言不過是滄海一粟,那么地球上是否經(jīng)歷過多次高級(jí)文明,那些文明是如何湮滅的?當(dāng)人類文明發(fā)展到非常高級(jí)的形態(tài),是否會(huì)經(jīng)歷一次系統(tǒng)的崩壞和重啟。這就又回到了那個(gè)關(guān)于毀滅與創(chuàng)造的古老問題。
對(duì)此,各位怎么看,歡迎留言,參與互動(dòng)。(文/知頓 小賢)
(圖:Sora生成視頻截圖 一個(gè)色彩繽紛的紙質(zhì)世界,珊瑚礁的精美渲染充滿了各種魚類和海洋生物)
(圖:Sora生成視頻截圖 一段攝影逼真的視頻特寫,兩艘海盜船在一杯咖啡內(nèi)相互戰(zhàn)斗)