春節(jié)期間橫空出世的Sora,引爆了人們關(guān)于AGI(通用型人工智能)的大討論。跟一年前出道即破圈的ChatGPT不同,人們對Sora的態(tài)度除了盛贊,似乎還有恐懼。Sora強(qiáng)大的視頻生成能力表明,相比文生文而言,文生視頻具備更廣闊的的應(yīng)用場景,將給視頻產(chǎn)業(yè)鏈帶來變革。
Sora推出后的第一個工作日,VC界空前熱情。一位投資領(lǐng)域的博主稱,“一天內(nèi)已經(jīng)有三個項目方找過來說要做中國版Sora,但聽起來,心態(tài)都是看看能不能騙點錢”。今天加入戰(zhàn)隊,提出要做“中國版Sora”顯然不靠譜,真正可以吃到“Sora紅利”的或許是視頻產(chǎn)業(yè)鏈上下游,以及早已出發(fā)的視頻大模型玩家。
Sora浪潮澎湃,視頻大模型百花齊放
在AGI視頻生成領(lǐng)域,Sora并非孤軍奮戰(zhàn)。1 月 2 日,以 文生圖工具聞名的 Midjourney 宣布在未來幾個月加快訓(xùn)練文生視頻模型;1 月 23 日,谷歌推出了文生視頻模型 Lumiere;Runway 的文生視頻模型 Gen-2 在 2023 年年末完成了一 次重要更新,大幅度提升視頻生成質(zhì)量。
2024年,視頻大模型賽道無疑會更加熱鬧,2023年ChatGPT掀起“的百模大戰(zhàn)”主戰(zhàn)場或?qū)淼揭曨l生成領(lǐng)域。在美國視頻大模型風(fēng)起云涌時,中國似乎也并未缺席。
技術(shù)的顛覆從不遵循論資排輩的邏輯,“顛覆者”隨時可能出現(xiàn)。
其中一個視頻AIGC的重磅玩家是新壹科技,前身是曾打造秒拍、小咖秀和一直播的國民級短視頻直播應(yīng)用的一下科技。2023年7月,新壹科技推出了國內(nèi)首款聚焦視頻領(lǐng)域的大模型,公開信息顯示,其基于視頻大模型的平臺及服務(wù),已在保險金融、數(shù)字政務(wù)、傳媒營銷等多個垂直場景實現(xiàn)商業(yè)化落地,服務(wù)B端和C端用戶。
值得關(guān)注的是其旗下定位于智能內(nèi)容輔助創(chuàng)作平臺的一幀秒創(chuàng),致力于為用戶提供全流程AI生成視頻服務(wù),通過對文案素材、AI語音、字幕等進(jìn)行智能分析解構(gòu),助力創(chuàng)作者快速成片,零門檻產(chǎn)出視頻,目前已擁有超300萬用戶,每天產(chǎn)出數(shù)十萬分鐘AI視頻。
隨著Runway、Sora在內(nèi)的產(chǎn)品給AI生成視頻素材帶來質(zhì)和量的提升,這類定位于整合前沿AIGC技術(shù),提供“傻瓜式”解決方案的平臺,或許更符合國情選擇。
Sora并非鯊魚,而是海洋,Sora掀起的AGI浪潮,也將催生大量的巨頭公司、創(chuàng)新應(yīng)用以及產(chǎn)業(yè)變革。
據(jù)不完全統(tǒng)計顯示, 2023 年全球誕生的視頻模型已達(dá)數(shù)十個,平均視頻生成能力為3-4 秒。Sora問世后,AI生成單個視頻的最長時長可達(dá)一分鐘。
“從公開演示Demo來看,Sora的整體生成質(zhì)量高度逼真,物理運動軌跡也已十分自然,整體效果超出了市場同類產(chǎn)品。不過現(xiàn)在視頻AI生成仍是素材級別,不能生成完整作品。而通常情況下,一個完整的視頻作品需要幾個~幾十個素材構(gòu)成;借助一幀秒創(chuàng),用戶可通過已有素材、AI素材的組合完成作品級的視頻呈現(xiàn),某種程度上,素材生成技術(shù)的進(jìn)步對行業(yè)是極大的利好,Sora生成的素材同樣可以為秒創(chuàng)所用?!毙乱伎萍糃EO雷濤的展望十分樂觀。
Sora拓寬道路,哪些視頻業(yè)態(tài)率先受益?
最先受益于Sora浪潮的無疑會是移動視頻領(lǐng)域。Sora前的Runway等視頻大模型只能生成幾秒的視頻, Sora最多可連續(xù)生成 60 秒高清視頻,這正是互聯(lián)網(wǎng)短視頻的主流時長。
隨著Sora徹底開放,用戶短視頻創(chuàng)作成本更低、門檻更低、效率更高,短視頻將進(jìn)一步迎來質(zhì)和量的井噴潮。作為短視頻商業(yè)化兩架馬車的廣告與短劇,均將受益于Sora,自動生成視頻與程序化AI廣告結(jié)合,將進(jìn)一步提高營銷效率,AIGC短視頻質(zhì)量提升也會對短劇產(chǎn)生積極影響。
影視傳媒行業(yè)同樣會迎來“Sora紅利”。雖然Sora當(dāng)前只能生成“素材”級短視頻,但假以時日,隨著生成內(nèi)容時長與水準(zhǔn)不斷提升,“丟給Sora一部小說就能輸出電視劇/電影”也可能并非癡人說夢;如果搭載ChatGPT寫的小說,Sora或許能成就新一代智能“夢工廠”。
Sora還將在很多行業(yè)扮演魔術(shù)師的角色。
在廣告營銷行業(yè),TVC、宣傳片制作成本高、流程長,基于Sora的生成能力,廣告營銷視頻的制作效率將大幅提高,成本將大幅降低,特別是一些低創(chuàng)造性、重復(fù)性較高的營銷視頻。
在新聞傳媒行業(yè),Sora更是降本增效的利器,甚至能在許多領(lǐng)域直接輸出可發(fā)布的視頻,比如科技類媒體的科普視頻、生活類媒體的小貼士視頻、商業(yè)類媒體的解讀類視頻……“剪刀手”類搬運剪輯、素材整合與資料歸納類視頻基本都將由Sora主宰。
截至目前,芒果超媒已表態(tài)將探索文生視頻等AI技術(shù)在傳媒領(lǐng)域的落地。包括人民日報、新浪財經(jīng)等媒體也已與新壹科技開展合作,通過視頻生成平臺服務(wù)為新聞采集、制作、傳播高效賦能。
在游戲行業(yè),Sora可與游戲場景高度適配生成更個性化的地圖、畫面甚至角色,《蛋仔派對》爆紅離不開UGC地圖模式,利用AIGC增加可玩性已是游戲產(chǎn)業(yè)的大勢所趨。
在教育行業(yè)Sora可被用于創(chuàng)建生動有趣的教育視頻,強(qiáng)化互動提升效率。
在醫(yī)療行業(yè)Sora可智能生成視頻來實現(xiàn)醫(yī)患溝通,比如向醫(yī)美患者傳遞術(shù)后效果。
在健身行業(yè)Sora可智能生成自然視頻應(yīng)用到跑步機(jī)等設(shè)備提升用戶體驗。
……
當(dāng)前,互聯(lián)網(wǎng)大約有80%的流量是視頻貢獻(xiàn)的,但只有20%的內(nèi)容是視頻化的。Sora爆發(fā)后,隨著更多視頻大模型以及視頻大模型驅(qū)動的工具應(yīng)用出現(xiàn),視頻內(nèi)容將出現(xiàn)井噴潮,互聯(lián)網(wǎng)也將進(jìn)一步被視頻化。
與其做中國版Sora,不如發(fā)揮落地優(yōu)勢
對于中國視頻大模型玩家來說,最現(xiàn)實的機(jī)會或許不是打造“中國版Sora”,而是如何有效整合尖端技術(shù),孵化出中國式爆款應(yīng)用。
跟一般技術(shù)不同,大模型的強(qiáng)弱很大程度取決于“出發(fā)時間”。大模型一直在被填喂海量數(shù)據(jù)訓(xùn)練,且在這一過程消耗不菲的算力與能源,進(jìn)而具備更強(qiáng)的智能水平,后來者很難單純地靠大手筆投資“大力出奇跡”填平時間差。
在Sora橫空出世時,中國視頻大模型的佼佼者,一定是早已蓄勢多年的玩家。
在國內(nèi)推出首個視頻大模型的新壹科技也并非天降黑馬。一下科技旗下的秒拍與一直播當(dāng)年曾分別是滲透率第一的國民級短視頻與直播產(chǎn)品。在更早前,韓坤創(chuàng)辦的酷六網(wǎng)也是國內(nèi)首家在納斯達(dá)克上市的視頻網(wǎng)站。這些年來,韓坤和他的團(tuán)隊一直在視頻賽道耕耘潛伏,2018年就開始探索AI技術(shù)與視頻的結(jié)合。
在一下科技與抖音、快手的競爭中落敗后接受現(xiàn)實,其很早就All In AIGC視頻業(yè)務(wù),著手推進(jìn)視頻大模型釋放AIGC視頻生產(chǎn)力?;谠缙诤A恳粢曨l數(shù)據(jù)和視頻業(yè)務(wù)經(jīng)驗的積累,以及AI視頻的多年探索,新壹科技成了視頻大模型賽道一個不容忽視的玩家。
在ChatGPT面世后,中國市場一夜之間出現(xiàn)了許多“類ChatGPT”應(yīng)用,百模大戰(zhàn)如火如荼,不過視頻大模型研發(fā)顯然更具門檻:數(shù)據(jù)質(zhì)量和場景落地都是關(guān)鍵元素。
數(shù)據(jù)的量與質(zhì)直接左右著視頻大模型的效果。Sora的核心基石是“理解真實世界”,要做到這一點必須要對大量的視覺內(nèi)容進(jìn)行學(xué)習(xí)。Sora對比其早前的PixelDance、Stable Video Diffusion等雛形期的視頻大模型有顯著提升,數(shù)據(jù)量不容忽視;國內(nèi),新壹科技的視頻大模型表現(xiàn)相對成熟,也離不開秒拍、小咖秀、一直播等業(yè)務(wù)多年來積攢的視頻內(nèi)容底子。
場景落地或許中國視頻大模型廠商的機(jī)遇突破口。一直以來,本土科技企業(yè)都很接地氣,善于洞察用戶需求進(jìn)行產(chǎn)品落地,在互聯(lián)網(wǎng)應(yīng)用層出現(xiàn)小程序、移動支付、共享單車、共享充電寶、短視頻、直播帶貨等創(chuàng)新應(yīng)用,都足以說明這一點。
正如新壹科技CEO雷濤公開采訪時所言,Sora的誕生無疑會改變AI視頻生成市場格局。“就國內(nèi)而言,要看哪些企業(yè)能結(jié)合、利用新技術(shù),完善符合國情的產(chǎn)品,比如提供定制化的視頻生成服務(wù)、跨業(yè)態(tài)合作等。像企業(yè)營銷視頻、企業(yè)宣傳片、教育培訓(xùn)、微短劇,甚至個人娛樂領(lǐng)域,用戶都可以根據(jù)自身需求,通過文本描述進(jìn)行視頻內(nèi)容個人定制?!?/p>
或許,在Sora的素材級視頻生成大模型外,行業(yè)還需要一個強(qiáng)大的視頻內(nèi)容輔助創(chuàng)作工具,將優(yōu)質(zhì)的AI素材和現(xiàn)實素材進(jìn)行整合,為創(chuàng)作者提供整體解決方案,這可能是類似新壹科技團(tuán)隊努力的方向。
另一個角度,Sora模型底層設(shè)計是英文邏輯,這意味著在其他語種上存在較多本地化機(jī)會?;叵氪饲埃⑽陌嫖纳鷪D工具在面對“胸有成竹”“汗牛充棟”“熊熊烈火”等成語時全都鬧了笑話,視頻生成同樣面臨這樣的挑戰(zhàn)。
再比如英文語境邏輯訓(xùn)練下,大模型往往默認(rèn)男人、女人、小孩都是白人,生成內(nèi)容很少會有黃種人。類似這樣的差異意味著視頻大模型需要被“漢化”,中國大模型開發(fā)者更理解本土文化,大模型生成的內(nèi)容也更能滿足本土用戶需求。
整體而言,相較于打造“中國版Sora”,將Sora背后的AGI能力完美延伸,打造to C/to B的創(chuàng)新應(yīng)用,或?qū)⑹侵袊萍脊靖F(xiàn)實的機(jī)會。
看得更遠(yuǎn)一些,視頻產(chǎn)業(yè)只是Sora改變的冰山一角。Sora背后的AGI技術(shù)以及“理解與模擬現(xiàn)實世界”的能力,可能催生AI手機(jī)、AI汽車、AI XR、AI機(jī)器人等新興產(chǎn)業(yè),在重構(gòu)科技產(chǎn)業(yè)秩序的進(jìn)程中,賦予人類全新的力量,而這顯然是比“Sora是否取代影像工作者”更值得關(guān)注的事情。