編者按:本文來(lái)自微信公眾號(hào) 新智元(ID:AI_era),編輯:編輯部,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
斯坦福天才少女的這家公司,依然在繼續(xù)它的傳奇。
成立一年之際,Pika迎來(lái)最好的生日禮物——新一輪約8000萬(wàn)美元的融資。
至此,公司估值較上一輪融資已經(jīng)整整翻了一番,接近5億美元。
Pika聯(lián)合創(chuàng)始人郭文景(Demi Guo)和孟辰霖(Chenlin Meng)
本輪融資由Spark Capital領(lǐng)投,而參與投資的,涵蓋了科技和娛樂(lè)領(lǐng)域各大投資公司,以及個(gè)人投資者,包括Greycroft、Lightspeed、Neo、Makers Fund、著名演員Jared Leto和大西洋唱片公司CEO Craig Kallman等。
此外,這次的名單中還包括了去年11月就參與投資的「老熟人」,比如前Github CEO Nat Friedman、Quora創(chuàng)始人Adam D'angelo、Perplexity CEO Aravind Srinivas、HuggingFace CEO Clément Delangue、ElevenLabs聯(lián)創(chuàng)Mateusz Staniszewski,以及AI大牛Andrej Karpathy等。
這一切無(wú)不表明,市場(chǎng)對(duì)生成式AI的未來(lái)信心巨大,科技、影視、文娛……要被AI視頻「改造」的領(lǐng)域,還數(shù)不勝數(shù)!
回想7個(gè)月前,剛剛發(fā)布的Pika 1.0就效果炸裂,以電影般的質(zhì)感、動(dòng)畫級(jí)的特效,掀起了AI生視頻領(lǐng)域的大地震。
雖然如今經(jīng)過(guò)Sora的洗禮,我們對(duì)AI視頻的視效閾值已經(jīng)一再被拉高,但當(dāng)時(shí)橫空出世的Pika 1.0,相比Gen-2等競(jìng)品,堪稱一句「劃時(shí)代」。
值得一提的是,Adobe在4月的時(shí)候欽定了三大視頻AI合作商:Pika、Runway,以及估值860億美元的OpenAI。
Sora、Pika、Gen-2三個(gè)工具同時(shí)登陸Premiere Pro
如今,「每個(gè)人都能成為自己的視頻導(dǎo)演」,這句口號(hào)聽來(lái)依舊震撼。
成為視頻領(lǐng)域的Anthropic
在一周年之際,創(chuàng)始人郭文景對(duì)新智元表示——
「Pika想要構(gòu)建更強(qiáng)大的視頻大模型。而此次融資的目的,就是希望能夠更加積極地訓(xùn)練大模型?!?/p>
是的,Pika希望成為的,就是AI視頻領(lǐng)域的Anthropic。
這一輪Pika的新領(lǐng)投Yasmin Razavi,此前也是Anthropic的領(lǐng)投。
在Anthropic還沒(méi)公開模型和產(chǎn)品時(shí),Yasmin就選擇相信這個(gè)團(tuán)隊(duì),領(lǐng)投了Anthropic,并成為董事會(huì)成員。
現(xiàn)在,Yasmin也成為Pika最新的董事會(huì)成員。
6位IOI金牌得主,包攬9塊金牌
今天,我們要講的除了創(chuàng)始人故事之外,還有團(tuán)隊(duì)背后鮮有人知的內(nèi)容。
工程團(tuán)隊(duì)
在Pika的團(tuán)隊(duì)中,共有6位IOI金牌得主,包攬9塊國(guó)際奧賽金牌,其中3位還是IOI世界第一。
這一數(shù)字,甚至超過(guò)了前段時(shí)間爆火的AI工程師Devin,背后的初創(chuàng)Cognition Al的「金牌程序員」——5位金牌得主,10塊金牌。
其中,創(chuàng)始人郭文景摘取了IOI銀牌,是美國(guó)隊(duì)十幾年來(lái)唯一的女國(guó)家隊(duì)隊(duì)員,也是美國(guó)國(guó)家隊(duì)教練。
另一位創(chuàng)始人陳思禹(Karli Chen)更是鮮有的雙料國(guó)家集訓(xùn)隊(duì)成員,曾在IOI集訓(xùn)隊(duì)獲得國(guó)內(nèi)前12名,也是全國(guó)物理競(jìng)賽金牌獲得者。
而且,Pika工程團(tuán)隊(duì)中還有兩個(gè)人獲得了美國(guó)大學(xué)最高數(shù)學(xué)獎(jiǎng)項(xiàng),被認(rèn)定為Putnam Fellow。
Putnam Fellow是被認(rèn)為特難的數(shù)學(xué)競(jìng)賽,每年選出5位個(gè)人成績(jī)最好的人,將由美國(guó)數(shù)學(xué)協(xié)會(huì)頒發(fā)。
科研團(tuán)隊(duì)
在科研方面,Pika團(tuán)隊(duì)的實(shí)力也不容小覷。
他們紛紛來(lái)自世界最好的大學(xué)和科研機(jī)構(gòu),斯坦福、MIT、谷歌、Meta、OpenAl等等。
既有有連發(fā)幾十篇論文的科研大牛,也有著名開源項(xiàng)目的主要開發(fā)者。
創(chuàng)始孟辰霖是DDIM、Img2Img、Model Distillation的作者。
這些方法,直接將擴(kuò)散模型的推理速度提高了數(shù)百倍。也是GenAI editing方法的基石算法。
團(tuán)隊(duì)的研究科學(xué)家,Omer Bar-Tal,是谷歌CEO吹捧的AI視頻大模型Lumiere項(xiàng)目的一作,有一線大模型訓(xùn)練的經(jīng)驗(yàn)。
論文地址:https://arxiv.org/pdf/2401.12945
另外,Pika團(tuán)隊(duì)還擁有Hugging Face的Diffusers代碼庫(kù)的聯(lián)創(chuàng)和最核心開發(fā)者。
Diffusers是Hugging Face最大的項(xiàng)目之一,訓(xùn)練GenAI模型的Default Library,現(xiàn)已擁有超過(guò)23k星。
顧問(wèn)團(tuán)隊(duì)
此外,這家體量雖小的初創(chuàng)公司,還有著非常強(qiáng)大的顧問(wèn)團(tuán)隊(duì)。
斯坦福AI實(shí)驗(yàn)室的主任,NLP大師Christopher Manning,是將深度學(xué)習(xí)應(yīng)用于自然語(yǔ)言處理(NLP)的早期領(lǐng)導(dǎo)者之一。
Manning還是ACM院士、AAAI院士和ACL院士。截至目前,他個(gè)人被引數(shù)近25萬(wàn),成為NLP領(lǐng)域引用量第一人。
兩屆奧斯卡得主,斯坦度大學(xué)工程學(xué)院的Canon教授Ron Fedkiw,曾參與制作了很多著名電影,比如加勒比海盜、星球大戰(zhàn)的技術(shù)特效。
Fedkiw一直以來(lái)專注于計(jì)算機(jī)圖形學(xué)的研究,曾設(shè)計(jì)了一個(gè)平臺(tái),首次應(yīng)用在《終結(jié)者3:機(jī)器的崛起》中的T-X角色,現(xiàn)已被用來(lái)創(chuàng)造電影節(jié)最先進(jìn)的特效。
Fedkiw的技術(shù)幫助《加勒比海盜2》獲得了第79屆奧斯卡最佳視覺(jué)效果獎(jiǎng)
他個(gè)人在計(jì)算物理、圖形學(xué)、機(jī)器學(xué)習(xí)和視覺(jué)方面,發(fā)表了140+篇論文,并出版了一本名為「Level Set Methods and Dynamic lmplicit Surfaces」的計(jì)算圖形學(xué)書籍。
斯坦福大學(xué)計(jì)算機(jī)科學(xué)系的教授Stefano Ermon,在機(jī)器學(xué)習(xí)領(lǐng)域發(fā)表300+篇論文。并在擴(kuò)散模型研究領(lǐng)域發(fā)表過(guò)著名的Score Matching以及「Denoising Diffusion Implicit Models」。
近期,Pika榮幸被選為福布斯Top AI 50公司,與Abridge、Harvey、Mistral并稱為四個(gè)「New and Noteworthy」公司之一。同時(shí),Business Insider將其評(píng)為Top 44最值得工作的創(chuàng)業(yè)公司。
5月初的時(shí)候,郭文景還被被彭博社評(píng)選為The People in Tech to Watch。
靈活的架構(gòu),「超神」的速度
除了坐擁陣容如此豪華的團(tuán)隊(duì),Pika成功的另一個(gè)秘訣,就是快到令對(duì)手完全反應(yīng)不過(guò)來(lái)的速度!
去年年初,AI視頻領(lǐng)域早已在硅谷紅了大半邊天。
以Gen-2為代表的背后初創(chuàng)Runway成為當(dāng)時(shí)最具競(jìng)爭(zhēng)力、最受歡迎的公司,并坐擁100+員工,是估值1.5B美元的獨(dú)角獸。
彼時(shí),Pika還未誕生。
如今,僅用一年的時(shí)間,Pika已經(jīng)成為了Runway的最大競(jìng)爭(zhēng)對(duì)手。
,時(shí)長(zhǎng)01:05
其實(shí),Pika的速度,從它成立緣由的那一點(diǎn)「小火苗」,就可以窺見。
2023年初,郭文景和同學(xué)參加Runway的首屆AI電影節(jié)時(shí),發(fā)現(xiàn)Runway和Adobe Photoshop的工具并不好用。
2023年4月底,為了開發(fā)更好用的AI視頻工具,讓「每個(gè)人都能成為自己的視頻導(dǎo)演」,郭文景決定從斯坦福退學(xué),Pika由此誕生。
一次失敗的參賽經(jīng)歷,卻讓一家估值近5億美元的公司誕生,這不啻是一段傳奇。
某天下午,天使投資人Friedman向團(tuán)隊(duì)提出了一個(gè)想法:在視頻中嵌入文本。
凌晨3點(diǎn),他收到了一條短信,告知這項(xiàng)功能已經(jīng)準(zhǔn)備就緒。
Friedman被團(tuán)隊(duì)的高效震驚了,立刻決定進(jìn)行下一輪投資。
論文成果斐然
Pika的能力之所以可以不斷迭代,完全是基于團(tuán)隊(duì)在研究領(lǐng)域取得的諸多成果。
Pika在全球范圍內(nèi)有超過(guò)20個(gè)研究合著者,來(lái)自清華姚班、北大、斯坦福、MIT、加州理工等知名高校以及科研機(jī)構(gòu)。
Pika下一步計(jì)劃是,將在今年晚些時(shí)候,發(fā)布文本到視頻模型重大更新。
郭文景透露,包括支持生成更高質(zhì)量、更長(zhǎng)時(shí)間的視頻(目前只能生成3秒的視頻,不過(guò)用戶可以在視頻生成之后再延長(zhǎng))。
郭表示,「我們正在努力打造最佳的視頻模型,同時(shí)也在打造一款真正服務(wù)于創(chuàng)造者的產(chǎn)品」。
AI電影,究竟還有多遠(yuǎn)
從創(chuàng)立的第一天起,Pika對(duì)于產(chǎn)品就是這樣構(gòu)想的——
成為一個(gè)幫助用戶把「想法」做成「視頻」的平臺(tái),因此,團(tuán)隊(duì)需要?jiǎng)?chuàng)造全新的模型,實(shí)現(xiàn)這個(gè)「將任何人的概念變?yōu)楝F(xiàn)實(shí)」的功能。
如何讓每個(gè)人都能成為自己故事的導(dǎo)演?Pika決定從最底層構(gòu)建產(chǎn)品,讓整個(gè)過(guò)程更有趣、更有挑戰(zhàn),也更容易理解。
距離我們能從電影院看到一部AI電影,究竟還需要多久?
在電影制作人Paul Trillo看來(lái),從孤立的剪輯到制作一種以故事形式運(yùn)行的工具,并且能讓觀眾在觀看時(shí)不會(huì)脫離其中,還有一段路。
AI能讓電影實(shí)現(xiàn)到某種程度,取決于它能在多大程度上,執(zhí)行使用者的真實(shí)意圖和愿景。
,時(shí)長(zhǎng)00:43
如今用Pika,可以將視頻中的對(duì)象改變各種風(fēng)格
Pika希望自己的模型可以理解各種不同的輸入,這無(wú)疑對(duì)模型的能力提出了很高的要求。
從某種意義上,OpenAI的Sora也采用了類似的根本性「拔高」。
Sora對(duì)世界上事物的物理運(yùn)行方式,有著深刻的理解。這,就能讓視頻的主體能夠直接做出正確的互動(dòng)和反應(yīng)。
而讓AI視頻更接近電影的另一個(gè)因素,就是長(zhǎng)度。
如今,我們已經(jīng)達(dá)到了用3到8秒的鏡頭所能講述故事類型的極限,而更長(zhǎng)時(shí)間的視頻,則會(huì)開啟我們講述更復(fù)雜故事的能力。
不過(guò),即使能生成60秒視頻,也并不意味著AI能創(chuàng)作一部連貫的電影。
這也就意味著,如今的視頻AI,還有許多潛在的全新方向可以開卷。
對(duì)此,制作人Trillo預(yù)測(cè)道:「或許兩年后的模型會(huì)有極強(qiáng)的控制力,為電影制作人提供任何所需的細(xì)節(jié)」。
而Pika,無(wú)疑是該領(lǐng)域被寄托了最多希望的選手之一。
因?yàn)樗鼜?qiáng)大的執(zhí)行力,意味著很多可能。
短短一年時(shí)間里,Pika已經(jīng)初始的3人公司,組建了世界級(jí)的研究人員和科學(xué)家團(tuán)隊(duì),還集結(jié)了一批創(chuàng)作力爆棚的創(chuàng)作者。
難以想象,下一步他們將如何利用AI,推動(dòng)視頻生成領(lǐng)域的最前沿。
參考資料:
https://www.bloomberg.com/news/articles/2024-06-05/spark-capital-jared-leto-back-ai-video-startup-pika
https://www.washingtonpost.com/technology/2024/06/04
/pika-funding-openai-sora-google-video/
https://www.forbes.com/lists/ai50/?sh=80bf8b4290f4
https://pika.art/blog
本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn),不代表創(chuàng)業(yè)邦立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問(wèn),請(qǐng)聯(lián)系editor@cyzone.cn。