五月天成人小说,中文字幕亚洲欧美专区,久久妇女,亚洲伊人久久大香线蕉综合,日日碰狠狠添天天爽超碰97

梁文鋒,準(zhǔn)備戰(zhàn)斗

下一個引領(lǐng)浪潮的人是誰?或許連DeepSeek與梁文鋒,都在等待下一個強(qiáng)如o1的對手。

編者按:本文來自微信公眾號“鳳凰網(wǎng)科技”(ID:ifeng_tech),作者:Dale 姜凡,編輯:董雨晴,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。

7月底的上海,疲勞與抓狂并存。疲憊在于一場聲勢浩大的國際性盛會剛在這里落幕。這是WAIC(世界人工智能大會)舉辦以來規(guī)模最大的一次,不僅參展商數(shù)量暴漲了60%。連從未現(xiàn)身中國的AI教父辛頓也驚喜閃現(xiàn),會場門票直接炒到了“單日千元”。抓狂則在于,人人都想拿出看家本領(lǐng),試圖復(fù)刻下一個“炸裂”時刻。

圖片

參展到半程,有大模型企業(yè)半夜還在調(diào)試模型參數(shù),“深夜突然決定發(fā)布,第二天全班人馬拉足火力”,有現(xiàn)場的參展企業(yè)向鳳凰網(wǎng)科技透露,和往年不同,今年WAIC吸引了不少外國的觀眾,其中包括外媒這樣的專業(yè)觀眾,這是中國大模型企業(yè)難得有機(jī)會最近距離復(fù)刻DeepSeek效應(yīng)的時候。

圖片

但過分追求結(jié)果的人們往往會忽略一個真相,技術(shù)可以復(fù)制,顛覆太難模仿。 想重走DeepSeek之路,一切沒那么簡單。

01重走DeepSeek之路

就在外界用誤讀的方式唱衰DeepSeek之際,又一個DeepSeek時刻最先從海外爆出。

7月中旬,英國《自然》雜志網(wǎng)站發(fā)表文章稱,中國人工智能(AI)模型Kimi K2發(fā)布后引發(fā)轟動,世界迎來“又一個DeepSeek時刻”。

圖片

Kimi在7月11日正式發(fā)布K2模型,其采用了一套經(jīng)過精心優(yōu)化的萬億參數(shù)混合專家架構(gòu),總參數(shù)量達(dá)到1.04萬億,但激活參數(shù)僅為320億。很快人們就發(fā)現(xiàn),K2采用了和DeepSeek-V3相似的架構(gòu),即多頭注意力的頭數(shù)更少,MoE的專家數(shù)更多,因此可以在提高上下文效率的同時提升token使用的效率?!癒imi K2基本上是DeepSeek V3,但擁有更少的頭腦和更多的專家?!庇袕臉I(yè)者如此表述。

圖片架構(gòu)相似,也走開源路線。Kimi的一位內(nèi)部員工后來也很坦誠的表示,“在啟動K2訓(xùn)練之前,我們進(jìn)行了大量模型結(jié)構(gòu)相關(guān)的scaling實驗,結(jié)果是,所有當(dāng)時propose的、與DSv3不同的結(jié)構(gòu),沒有一個能真正打敗他的(頂多旗鼓相當(dāng))。因此,問題就變成了,我們要不要為了與DeepSeek不同,強(qiáng)行選擇一個沒有優(yōu)勢但不一樣的結(jié)構(gòu),最終的答案是no。”。所以Kimi只做了一件創(chuàng)新,就是在同樣的架構(gòu)里,把參數(shù)拉到爆表。考慮到Kimi仍舊是一家創(chuàng)業(yè)公司,沒有無限子彈,而目前大家能看到的K2實現(xiàn)的結(jié)果,已經(jīng)是Kimi所能承受的算力上限。

盡管K2沒有到大爆的程度,但其在海外的確在短時間內(nèi)吸納了極大的關(guān)注度。7月中旬,據(jù)OpenRouter公布的數(shù)據(jù),Kimi K2調(diào)用量與馬斯克剛發(fā)布的Grok4登上增長榜前兩名,日調(diào)用量超過 100 億 token,而Kimi K2的API價格僅為Claude Sonnet的五分之一。

這也就有了前文開頭的一幕,海外媒體報道,又一個DeepSeek時刻涌現(xiàn)。

緊接著在7月28日凌晨,智譜帶來了其自身迄今為止最大參數(shù)的開源模型GLM-4.5,雖然彭博在援引知情人士表述時寫的是“該公司正試圖在全球范圍內(nèi)挑戰(zhàn)OpenAI”,但一樣走開源路線,一樣希望在海外引爆的思路,實際上也是在重走DeepSeek之路。

圖片

更早之前,無論是Kimi、階躍星辰還是MiniMax,都重提堅持基礎(chǔ)模型研發(fā)。這與梁文鋒追求AGI的理念如出一轍。

02下一個o1也很重要

AI行業(yè)從業(yè)者“AI Dance”形容當(dāng)前的AI發(fā)展是“草灰蛇線,伏脈千里”,“如OpenAI在探索出RL(強(qiáng)化學(xué)習(xí))范式后(指發(fā)布o(jì)1),又被DeepSeek R1揭示秘密,所有從業(yè)者一擁而上”。而如今的coding Agent(編碼智能體)與大參數(shù)的MoE模型,則全部在DeepSeek-V3的架構(gòu)之上,可以說,當(dāng)前這一輪風(fēng)潮皆是因為DeepSeek。

正如另一位Kimi員工所言,“K2還是先狠狠地致敬DeepSeek了,而不是刻意標(biāo)新立異,更多的想法和創(chuàng)意,我們把它們做得更扎實之后,在K3、K4再見了。”

圖片

然而下一個引領(lǐng)浪潮的人是誰?當(dāng)前仍未有答案?;蛟S甚至連DeepSeek與梁文鋒,都在等待下一個強(qiáng)如o1的對手。

此前有消息稱,GPT-5將于2025年8月發(fā)布。作為GPT-4的迭代升級,這不僅是簡單的版本更新,更是一次全方位的技術(shù)躍遷,將從推理能力、多模態(tài)交互、智能代理到開放生態(tài)等多個維度重新定義AI的可能性。

目前,OpenAI的GPT系列與o3推理引擎處于分立狀態(tài),用戶需根據(jù)不同任務(wù)手動切換模型。而GPT-5將徹底打破這一界限,首次實現(xiàn)語言生成、邏輯推理、數(shù)學(xué)計算、多步規(guī)劃等功能的深度融合,構(gòu)建真正的“統(tǒng)一智能”系統(tǒng)。

GPT-5無需手動切換模式,能智能判斷任務(wù)需求,在需要深度推理的復(fù)雜場景(如代碼調(diào)試、數(shù)學(xué)證明、商業(yè)決策)與快速響應(yīng)的簡單場景間自動切換。在復(fù)雜任務(wù)處理上表現(xiàn)應(yīng)該會有很大一部分提升,尤其在代碼優(yōu)化、數(shù)學(xué)推導(dǎo)、戰(zhàn)略決策等領(lǐng)域。

OpenAI CEO山姆·奧特曼則在X上透露:“早上,我正在測試我們最新的大模型,輸入了一個我自己都不太理解的問題,它卻給出了完美的回答?!?/p>

圖片

外部用戶也陸續(xù)捕捉到GPT-5的早期跡象。網(wǎng)友Yacine在社交平臺表示,自己剛試用了一款A(yù)I公司的大模型,體驗“震撼到難以置信”,并斷言“沒有人能預(yù)料即將到來的風(fēng)暴”。

圖片

更有用戶反饋,在使用OpenAI模型時被“灰度”到一個全新AI:無需提示,該模型可連續(xù)思考3分鐘,并同步進(jìn)行大量搜索操作。當(dāng)用戶選擇“4o”模型時,ChatGPT直接進(jìn)入思考狀態(tài),這一現(xiàn)象引發(fā)猜測——OpenAI是否已在悄然過渡至GPT-5?

GPT-5的發(fā)布,會不會成為下一輪國產(chǎn)模型的引爆點(diǎn)也尚未得知?;叵雘1發(fā)布之際,全球陷入算力內(nèi)卷,DeepSeek以算法革命對沖硬件依賴。許多大模型在預(yù)訓(xùn)練階段幾乎都選擇了不計成本地投入,而DeepSeek選擇劍走偏鋒,把重點(diǎn)放在了上崗之后的強(qiáng)化學(xué)習(xí)。用反復(fù)高強(qiáng)度地訓(xùn)練,倒逼自身不斷地調(diào)整姿勢,理解邏輯,自我反思,直到結(jié)果令人滿意。

03 DeepSeek改變了什么?

在正式發(fā)布R1之前,DeepSeek一直在圈內(nèi)有著不錯的口碑,“業(yè)內(nèi)很早之前就比較看好DeepSeek,甚至最早的價格戰(zhàn)就起源于DeepSeek”,一位算法工程師告訴鳳凰網(wǎng)科技。但在大眾層面上,DeepSeek一直沒有感知。因為沒有融資需求,DeepSeek也鮮少對接投資機(jī)構(gòu),甚至沒有設(shè)置專門的公共溝通部門。

到今天,梁文鋒依舊幾乎不在公開場合露面。只存在于一些CEO的講述中,比如rokid創(chuàng)始人祝銘明會在不經(jīng)意間提起梁文鋒在他家聚餐,羅永浩也在近期的一次公開活動中談到其在今年春節(jié)前與梁文鋒的會面,“我們在酒店大堂見面時,他從遠(yuǎn)處走來,就像一個在讀學(xué)生?;蛟S因為年紀(jì)稍長,感覺像個碩士或博士?!?/p>

圖片

DeepSeek也在不經(jīng)意間影響了很多同行。

比如讓曾經(jīng)堅定的閉源派,如百度等企業(yè),走上了開源之路,正式開啟了開源模型的中國時間。

相比于過去希望成為“中國版OpenAI”,越來越多人想做下一個DeepSeek,鳳凰網(wǎng)科技早先了解到,Kimi已徹底轉(zhuǎn)向“研究為重”的內(nèi)部氛圍,楊植麟已幾乎不參與公開活動。階躍星辰在多模態(tài)技術(shù)上有著全球頂尖的人才儲備,也正信心滿滿的押注下一個范式。

字節(jié)的大模型研究團(tuán)隊目前也在重點(diǎn)攻克技術(shù),甚至張一鳴本人頻繁往返于北京和新加坡,和不同的技術(shù)從業(yè)人士交流。

本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個人觀點(diǎn),不代表創(chuàng)業(yè)邦立場,轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問,請聯(lián)系editor@cyzone.cn。

反饋
聯(lián)系我們
推薦訂閱