編者按:本文來(lái)自微信公眾號(hào) 新智元(ID:AI_era),編輯:編輯部,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
1條指令生成整段動(dòng)畫(huà),2分鐘內(nèi)部署一款游戲!
Grok 4發(fā)布僅僅12小時(shí)后,AI開(kāi)發(fā)者M(jìn)ckay Wrigley體驗(yàn)之后,直呼「強(qiáng)得瘋狂」!
在一次請(qǐng)求中,Grok 4 Heavy就生成了完整動(dòng)畫(huà),從人群行走到鳥(niǎo)瞰鏡頭無(wú)縫切換,展現(xiàn)驚人理解與執(zhí)行力,而其他模型完全無(wú)法匹敵。
提示詞:Create an animation of a crowd of people walking to form 「Hello world, I am Grok」 as camera changes to birds-eye.
還能表現(xiàn)得像閱兵一樣,整齊劃一地行進(jìn):
這款3D視頻,全網(wǎng)爆火,瀏覽量破350萬(wàn)。
AI初創(chuàng)Replit的matt palme則2分鐘內(nèi)部署了一款游戲!
使用Grok 4編寫(xiě)代碼,通過(guò)Three.js及GLSL著色器,網(wǎng)友Techartist實(shí)現(xiàn)了黑洞的交互式3D模擬與可視化。
在事件視界、星場(chǎng)和吸積盤(pán)方面,呈現(xiàn)出驚人的細(xì)節(jié),效果令人難以置信!
Demo/源代碼鏈接:https://codepen.io/VoXelo/full/wBKvJxd
20萬(wàn)塊GPU訓(xùn)練出的Grok 4是真的強(qiáng)!
發(fā)布會(huì)之后,Grok 4的官方技術(shù)報(bào)告也終于公開(kāi)了。
全球最聰明AI,百倍算力Scaling強(qiáng)化學(xué)習(xí)
作為全球最聰明的AI模型,xAI團(tuán)隊(duì)認(rèn)為,Grok 4已具備完全理解宇宙的基礎(chǔ)。
這背后,是Scaling強(qiáng)化學(xué)習(xí)的結(jié)果。
眾所周知,Grok 4的算力是Grok 2的100倍,在20塊GPU組成的Colossus集群上完成了RL訓(xùn)練。
此前,在Grok 3上,xAI團(tuán)隊(duì)實(shí)現(xiàn)了將下一個(gè)token預(yù)訓(xùn)練擴(kuò)展到前所未有的的規(guī)模。
并且,在開(kāi)發(fā)Grok 3 Reasoning實(shí)踐中,證明了接下來(lái)完全有可能大幅擴(kuò)展強(qiáng)化學(xué)習(xí)的訓(xùn)練規(guī)模。
如今,Grok 4的誕生,恰恰證明了團(tuán)隊(duì)的方向是正確的。
整個(gè)技術(shù)棧的創(chuàng)新,讓Grok 4訓(xùn)練計(jì)算效率暴漲了6倍。
與此同時(shí),研究團(tuán)隊(duì)還開(kāi)展了大規(guī)模數(shù)據(jù)收集工作,將可用于驗(yàn)證的訓(xùn)練數(shù)據(jù)從以數(shù)學(xué)、編程為主,擴(kuò)展到了更多的領(lǐng)域。
不僅如此,Grok 4通過(guò)RL學(xué)會(huì)了使用原生工具,在代碼解釋器、網(wǎng)頁(yè)瀏覽工具加持下,大幅提升了思考能力。
可以看到,在人類最后考試(HLE)上,Grok 4用上工具的得分刷爆SOTA,創(chuàng)下50.7%新紀(jì)錄。
Grok 4 Heavy刷爆HLE
Grok 4 Heavy被稱作是多智能體版,在Scaling測(cè)試時(shí)計(jì)算后,性能得到大幅提升。
一個(gè)模型,可以同時(shí)思考多種假設(shè),最終匯總出一個(gè)可靠準(zhǔn)確的答案。
在多項(xiàng)基準(zhǔn)測(cè)試中,Grok 4系模型全部刷新了SOTA。
尤其是,在ARC-AGI V2上,它以15.9%的成績(jī)碾壓所有閉源頂尖模型,是Claude Opus 4的兩倍。
在智能體 Vending-Bench基準(zhǔn)測(cè)試中,Grok 4賺錢能力遙遙領(lǐng)先,遠(yuǎn)超所有模型和人類。
在IQ方面,Grok 4相對(duì)來(lái)說(shuō)還是弱一些,在門(mén)薩智商測(cè)試中,拿下了136分,僅次于Claude 4。
在第三方編程基準(zhǔn)Aider測(cè)試中,Grok 4位列第四,正確率為79.6%,成本近60美金。
從2023年7月13日,xAI正式官宣至今,已經(jīng)過(guò)去了兩年。
在這期間,從Grok 1,到Grok 1.5、Grok 2、Grok 3,再到如今「地表最強(qiáng)」的Grok 4,馬斯克xAI迅速登上了AI頂峰。
聯(lián)創(chuàng)Toby Pohlen再次發(fā)文,慶祝xAI的兩周年生日。
SpaceX投20億美元把Grok送上火星
就在剛剛,WSJ爆料稱,SpaceX已同意向xAI投資20億美元。
這幾乎是xAI最近一輪股權(quán)融資的一半。
這不是馬斯克第一次這么干了。
長(zhǎng)期以來(lái)他一直利用自己的各個(gè)企業(yè)來(lái)推動(dòng)xAI。
比如,今年早些時(shí)候,他就將xAI與X合并——一個(gè)是AI初創(chuàng),另一個(gè)則是擁有廣泛影響力的社交媒體平臺(tái)。
這次合并使新公司的估值達(dá)到了1130億美元!
此次SpaceX的投資是xAI 50億美元股權(quán)融資的一部分。
這不僅是SpaceX首次投資xAI,也是SpaceX史上最大的投資之一。
不僅如此,SpaceX還支持過(guò)早期的特斯拉,以及馬斯克的隧道公司The Boring Company。
在收購(gòu)Twitter(X)時(shí),馬斯克向SpaceX申請(qǐng)了10億美元的貸款。
SpaceX最近手頭有超過(guò)30億美元現(xiàn)金。
該公司很少投資外部企業(yè)。最近一次大投資發(fā)生在2021年,當(dāng)時(shí)SpaceX以5.24億美元收購(gòu)了一家衛(wèi)星通信公司。
華爾街日?qǐng)?bào)報(bào)道,Grok為SpaceX的衛(wèi)星互聯(lián)網(wǎng)服務(wù)Starlink提供了客戶支持功能。
有投資者稱,SpaceX和xAI之間未來(lái)還會(huì)有更多商業(yè)合作。網(wǎng)友預(yù)測(cè),Grok模型或許某天被送上火星。
xAI估值2000億?馬斯克否認(rèn)
在這場(chǎng)融資爆料之前,外媒彭博昨日發(fā)文稱,xAI正在進(jìn)行融資談判,估值高達(dá)2000億美元。
在此之前,xAI就籌集了100億美元,其中債務(wù)和股權(quán)各占一半。
目前,xAI正計(jì)劃再次籌集100億美元。之所以著急籌集這么大量的資金,是因?yàn)閤AI太燒錢了。彭博此前報(bào)道,xAI在訓(xùn)練Grok時(shí),每月會(huì)燒掉10億美元。
對(duì)此,馬斯克本人進(jìn)行了否認(rèn),「我們有充足的資金,并未尋求新一輪融資」。
參考資料:
https://x.com/mckaywrigley/status/1943385794414334032https://x.com/amasad/status/1943419526433145334
https://x.com/techartist_/status/1943716076329558181 https://x.ai/news/grok-4
https://www.wsj.com/tech/spacex-to-invest-2-billion-into-elon-musks-xai-413934de
本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn),不代表創(chuàng)業(yè)邦立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問(wèn),請(qǐng)聯(lián)系editor@cyzone.cn。