梁文鋒，準備戰(zhàn)斗

鳳凰網(wǎng)科技·2025-07-31

下一個引領(lǐng)浪潮的人是誰？或許連DeepSeek與梁文鋒，都在等待下一個強如o1的對手。

編者按：本文來自微信公眾號“鳳凰網(wǎng)科技”（ID:ifeng_tech），作者：Dale 姜凡，編輯：董雨晴，創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。

7月底的上海，疲勞與抓狂并存。疲憊在于一場聲勢浩大的國際性盛會剛在這里落幕。這是WAIC（世界人工智能大會）舉辦以來規(guī)模最大的一次，不僅參展商數(shù)量暴漲了60%。連從未現(xiàn)身中國的AI教父辛頓也驚喜閃現(xiàn)，會場門票直接炒到了“單日千元”。抓狂則在于，人人都想拿出看家本領(lǐng)，試圖復(fù)刻下一個“炸裂”時刻。

參展到半程，有大模型企業(yè)半夜還在調(diào)試模型參數(shù)，“深夜突然決定發(fā)布，第二天全班人馬拉足火力”，有現(xiàn)場的參展企業(yè)向鳳凰網(wǎng)科技透露，和往年不同，今年WAIC吸引了不少外國的觀眾，其中包括外媒這樣的專業(yè)觀眾，這是中國大模型企業(yè)難得有機會最近距離復(fù)刻DeepSeek效應(yīng)的時候。

但過分追求結(jié)果的人們往往會忽略一個真相，技術(shù)可以復(fù)制，顛覆太難模仿。想重走DeepSeek之路，一切沒那么簡單。

01重走DeepSeek之路

就在外界用誤讀的方式唱衰DeepSeek之際，又一個DeepSeek時刻最先從海外爆出。

7月中旬，英國《自然》雜志網(wǎng)站發(fā)表文章稱，中國人工智能（AI）模型Kimi K2發(fā)布后引發(fā)轟動，世界迎來“又一個DeepSeek時刻”。

Kimi在7月11日正式發(fā)布K2模型，其采用了一套經(jīng)過精心優(yōu)化的萬億參數(shù)混合專家架構(gòu)，總參數(shù)量達到1.04萬億，但激活參數(shù)僅為320億。很快人們就發(fā)現(xiàn)，K2采用了和DeepSeek-V3相似的架構(gòu)，即多頭注意力的頭數(shù)更少，MoE的專家數(shù)更多，因此可以在提高上下文效率的同時提升token使用的效率。“Kimi K2基本上是DeepSeek V3，但擁有更少的頭腦和更多的專家?！庇袕臉I(yè)者如此表述。

架構(gòu)相似，也走開源路線。Kimi的一位內(nèi)部員工后來也很坦誠的表示，“在啟動K2訓(xùn)練之前，我們進行了大量模型結(jié)構(gòu)相關(guān)的scaling實驗，結(jié)果是，所有當(dāng)時propose的、與DSv3不同的結(jié)構(gòu)，沒有一個能真正打敗他的（頂多旗鼓相當(dāng)）。因此，問題就變成了，我們要不要為了與DeepSeek不同，強行選擇一個沒有優(yōu)勢但不一樣的結(jié)構(gòu)，最終的答案是no?！薄Ｋ訩imi只做了一件創(chuàng)新，就是在同樣的架構(gòu)里，把參數(shù)拉到爆表?？紤]到Kimi仍舊是一家創(chuàng)業(yè)公司，沒有無限子彈，而目前大家能看到的K2實現(xiàn)的結(jié)果，已經(jīng)是Kimi所能承受的算力上限。

盡管K2沒有到大爆的程度，但其在海外的確在短時間內(nèi)吸納了極大的關(guān)注度。7月中旬，據(jù)OpenRouter公布的數(shù)據(jù)，Kimi K2調(diào)用量與馬斯克剛發(fā)布的Grok4登上增長榜前兩名，日調(diào)用量超過 100 億 token，而Kimi K2的API價格僅為Claude Sonnet的五分之一。

這也就有了前文開頭的一幕，海外媒體報道，又一個DeepSeek時刻涌現(xiàn)。

緊接著在7月28日凌晨，智譜帶來了其自身迄今為止最大參數(shù)的開源模型GLM-4.5，雖然彭博在援引知情人士表述時寫的是“該公司正試圖在全球范圍內(nèi)挑戰(zhàn)OpenAI”，但一樣走開源路線，一樣希望在海外引爆的思路，實際上也是在重走DeepSeek之路。

更早之前，無論是Kimi、階躍星辰還是MiniMax，都重提堅持基礎(chǔ)模型研發(fā)。這與梁文鋒追求AGI的理念如出一轍。

02下一個o1也很重要

AI行業(yè)從業(yè)者“AI Dance”形容當(dāng)前的AI發(fā)展是“草灰蛇線，伏脈千里”，“如OpenAI在探索出RL（強化學(xué)習(xí)）范式后（指發(fā)布o1），又被DeepSeek R1揭示秘密，所有從業(yè)者一擁而上”。而如今的coding Agent（編碼智能體）與大參數(shù)的MoE模型，則全部在DeepSeek-V3的架構(gòu)之上，可以說，當(dāng)前這一輪風(fēng)潮皆是因為DeepSeek。

正如另一位Kimi員工所言，“K2還是先狠狠地致敬DeepSeek了，而不是刻意標(biāo)新立異，更多的想法和創(chuàng)意，我們把它們做得更扎實之后，在K3、K4再見了。”

然而下一個引領(lǐng)浪潮的人是誰？當(dāng)前仍未有答案?；蛟S甚至連DeepSeek與梁文鋒，都在等待下一個強如o1的對手。

此前有消息稱，GPT-5將于2025年8月發(fā)布。作為GPT-4的迭代升級，這不僅是簡單的版本更新，更是一次全方位的技術(shù)躍遷，將從推理能力、多模態(tài)交互、智能代理到開放生態(tài)等多個維度重新定義AI的可能性。

目前，OpenAI的GPT系列與o3推理引擎處于分立狀態(tài)，用戶需根據(jù)不同任務(wù)手動切換模型。而GPT-5將徹底打破這一界限，首次實現(xiàn)語言生成、邏輯推理、數(shù)學(xué)計算、多步規(guī)劃等功能的深度融合，構(gòu)建真正的“統(tǒng)一智能”系統(tǒng)。

GPT-5無需手動切換模式，能智能判斷任務(wù)需求，在需要深度推理的復(fù)雜場景（如代碼調(diào)試、數(shù)學(xué)證明、商業(yè)決策）與快速響應(yīng)的簡單場景間自動切換。在復(fù)雜任務(wù)處理上表現(xiàn)應(yīng)該會有很大一部分提升，尤其在代碼優(yōu)化、數(shù)學(xué)推導(dǎo)、戰(zhàn)略決策等領(lǐng)域。

OpenAI CEO山姆·奧特曼則在X上透露：“早上，我正在測試我們最新的大模型，輸入了一個我自己都不太理解的問題，它卻給出了完美的回答。’”

外部用戶也陸續(xù)捕捉到GPT-5的早期跡象。網(wǎng)友Yacine在社交平臺表示，自己剛試用了一款A(yù)I公司的大模型，體驗“震撼到難以置信”，并斷言“沒有人能預(yù)料即將到來的風(fēng)暴”。

更有用戶反饋，在使用OpenAI模型時被“灰度”到一個全新AI：無需提示，該模型可連續(xù)思考3分鐘，并同步進行大量搜索操作。當(dāng)用戶選擇“4o”模型時，ChatGPT直接進入思考狀態(tài)，這一現(xiàn)象引發(fā)猜測——OpenAI是否已在悄然過渡至GPT-5？

GPT-5的發(fā)布，會不會成為下一輪國產(chǎn)模型的引爆點也尚未得知。回想o1發(fā)布之際，全球陷入算力內(nèi)卷，DeepSeek以算法革命對沖硬件依賴。許多大模型在預(yù)訓(xùn)練階段幾乎都選擇了不計成本地投入，而DeepSeek選擇劍走偏鋒，把重點放在了上崗之后的強化學(xué)習(xí)。用反復(fù)高強度地訓(xùn)練，倒逼自身不斷地調(diào)整姿勢，理解邏輯，自我反思，直到結(jié)果令人滿意。

03 DeepSeek改變了什么？

在正式發(fā)布R1之前，DeepSeek一直在圈內(nèi)有著不錯的口碑，“業(yè)內(nèi)很早之前就比較看好DeepSeek，甚至最早的價格戰(zhàn)就起源于DeepSeek”，一位算法工程師告訴鳳凰網(wǎng)科技。但在大眾層面上，DeepSeek一直沒有感知。因為沒有融資需求，DeepSeek也鮮少對接投資機構(gòu)，甚至沒有設(shè)置專門的公共溝通部門。

到今天，梁文鋒依舊幾乎不在公開場合露面。只存在于一些CEO的講述中，比如rokid創(chuàng)始人祝銘明會在不經(jīng)意間提起梁文鋒在他家聚餐，羅永浩也在近期的一次公開活動中談到其在今年春節(jié)前與梁文鋒的會面，“我們在酒店大堂見面時，他從遠處走來，就像一個在讀學(xué)生?；蛟S因為年紀稍長，感覺像個碩士或博士。”

DeepSeek也在不經(jīng)意間影響了很多同行。

比如讓曾經(jīng)堅定的閉源派，如百度等企業(yè)，走上了開源之路，正式開啟了開源模型的中國時間。

相比于過去希望成為“中國版OpenAI”，越來越多人想做下一個DeepSeek，鳳凰網(wǎng)科技早先了解到，Kimi已徹底轉(zhuǎn)向“研究為重”的內(nèi)部氛圍，楊植麟已幾乎不參與公開活動。階躍星辰在多模態(tài)技術(shù)上有著全球頂尖的人才儲備，也正信心滿滿的押注下一個范式。

字節(jié)的大模型研究團隊目前也在重點攻克技術(shù)，甚至張一鳴本人頻繁往返于北京和新加坡，和不同的技術(shù)從業(yè)人士交流。

本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表，版權(quán)歸原作者所有。文章系作者個人觀點，不代表創(chuàng)業(yè)邦立場，轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問，請聯(lián)系editor@cyzone.cn。