編者按:本文來自微信公眾號 新智元(ID:AI_era),編輯:編輯部,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
1條指令生成整段動畫,2分鐘內(nèi)部署一款游戲!
Grok 4發(fā)布僅僅12小時后,AI開發(fā)者Mckay Wrigley體驗之后,直呼「強得瘋狂」!
在一次請求中,Grok 4 Heavy就生成了完整動畫,從人群行走到鳥瞰鏡頭無縫切換,展現(xiàn)驚人理解與執(zhí)行力,而其他模型完全無法匹敵。
提示詞:Create an animation of a crowd of people walking to form 「Hello world, I am Grok」 as camera changes to birds-eye.
還能表現(xiàn)得像閱兵一樣,整齊劃一地行進:
這款3D視頻,全網(wǎng)爆火,瀏覽量破350萬。
AI初創(chuàng)Replit的matt palme則2分鐘內(nèi)部署了一款游戲!
使用Grok 4編寫代碼,通過Three.js及GLSL著色器,網(wǎng)友Techartist實現(xiàn)了黑洞的交互式3D模擬與可視化。
在事件視界、星場和吸積盤方面,呈現(xiàn)出驚人的細節(jié),效果令人難以置信!
Demo/源代碼鏈接:https://codepen.io/VoXelo/full/wBKvJxd
20萬塊GPU訓(xùn)練出的Grok 4是真的強!
發(fā)布會之后,Grok 4的官方技術(shù)報告也終于公開了。
全球最聰明AI,百倍算力Scaling強化學(xué)習
作為全球最聰明的AI模型,xAI團隊認為,Grok 4已具備完全理解宇宙的基礎(chǔ)。
這背后,是Scaling強化學(xué)習的結(jié)果。
眾所周知,Grok 4的算力是Grok 2的100倍,在20塊GPU組成的Colossus集群上完成了RL訓(xùn)練。
此前,在Grok 3上,xAI團隊實現(xiàn)了將下一個token預(yù)訓(xùn)練擴展到前所未有的的規(guī)模。
并且,在開發(fā)Grok 3 Reasoning實踐中,證明了接下來完全有可能大幅擴展強化學(xué)習的訓(xùn)練規(guī)模。
如今,Grok 4的誕生,恰恰證明了團隊的方向是正確的。
整個技術(shù)棧的創(chuàng)新,讓Grok 4訓(xùn)練計算效率暴漲了6倍。
與此同時,研究團隊還開展了大規(guī)模數(shù)據(jù)收集工作,將可用于驗證的訓(xùn)練數(shù)據(jù)從以數(shù)學(xué)、編程為主,擴展到了更多的領(lǐng)域。
不僅如此,Grok 4通過RL學(xué)會了使用原生工具,在代碼解釋器、網(wǎng)頁瀏覽工具加持下,大幅提升了思考能力。
可以看到,在人類最后考試(HLE)上,Grok 4用上工具的得分刷爆SOTA,創(chuàng)下50.7%新紀錄。
Grok 4 Heavy刷爆HLE
Grok 4 Heavy被稱作是多智能體版,在Scaling測試時計算后,性能得到大幅提升。
一個模型,可以同時思考多種假設(shè),最終匯總出一個可靠準確的答案。
在多項基準測試中,Grok 4系模型全部刷新了SOTA。
尤其是,在ARC-AGI V2上,它以15.9%的成績碾壓所有閉源頂尖模型,是Claude Opus 4的兩倍。
在智能體 Vending-Bench基準測試中,Grok 4賺錢能力遙遙領(lǐng)先,遠超所有模型和人類。
在IQ方面,Grok 4相對來說還是弱一些,在門薩智商測試中,拿下了136分,僅次于Claude 4。
在第三方編程基準Aider測試中,Grok 4位列第四,正確率為79.6%,成本近60美金。
從2023年7月13日,xAI正式官宣至今,已經(jīng)過去了兩年。
在這期間,從Grok 1,到Grok 1.5、Grok 2、Grok 3,再到如今「地表最強」的Grok 4,馬斯克xAI迅速登上了AI頂峰。
聯(lián)創(chuàng)Toby Pohlen再次發(fā)文,慶祝xAI的兩周年生日。
SpaceX投20億美元把Grok送上火星
就在剛剛,WSJ爆料稱,SpaceX已同意向xAI投資20億美元。
這幾乎是xAI最近一輪股權(quán)融資的一半。
這不是馬斯克第一次這么干了。
長期以來他一直利用自己的各個企業(yè)來推動xAI。
比如,今年早些時候,他就將xAI與X合并——一個是AI初創(chuàng),另一個則是擁有廣泛影響力的社交媒體平臺。
這次合并使新公司的估值達到了1130億美元!
此次SpaceX的投資是xAI 50億美元股權(quán)融資的一部分。
這不僅是SpaceX首次投資xAI,也是SpaceX史上最大的投資之一。
不僅如此,SpaceX還支持過早期的特斯拉,以及馬斯克的隧道公司The Boring Company。
在收購Twitter(X)時,馬斯克向SpaceX申請了10億美元的貸款。
SpaceX最近手頭有超過30億美元現(xiàn)金。
該公司很少投資外部企業(yè)。最近一次大投資發(fā)生在2021年,當時SpaceX以5.24億美元收購了一家衛(wèi)星通信公司。
華爾街日報報道,Grok為SpaceX的衛(wèi)星互聯(lián)網(wǎng)服務(wù)Starlink提供了客戶支持功能。
有投資者稱,SpaceX和xAI之間未來還會有更多商業(yè)合作。網(wǎng)友預(yù)測,Grok模型或許某天被送上火星。
xAI估值2000億?馬斯克否認
在這場融資爆料之前,外媒彭博昨日發(fā)文稱,xAI正在進行融資談判,估值高達2000億美元。
在此之前,xAI就籌集了100億美元,其中債務(wù)和股權(quán)各占一半。
目前,xAI正計劃再次籌集100億美元。之所以著急籌集這么大量的資金,是因為xAI太燒錢了。彭博此前報道,xAI在訓(xùn)練Grok時,每月會燒掉10億美元。
對此,馬斯克本人進行了否認,「我們有充足的資金,并未尋求新一輪融資」。
參考資料:
https://x.com/mckaywrigley/status/1943385794414334032https://x.com/amasad/status/1943419526433145334
https://x.com/techartist_/status/1943716076329558181 https://x.ai/news/grok-4
https://www.wsj.com/tech/spacex-to-invest-2-billion-into-elon-musks-xai-413934de
本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個人觀點,不代表創(chuàng)業(yè)邦立場,轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問,請聯(lián)系editor@cyzone.cn。