大模型瘋狂12月，卷出五個關(guān)鍵趨勢

財經(jīng)無忌·2024-12-25

興奮與失落

編者按：本文來自微信公眾號硅基研究室（ID：gh_cef05ac13977），作者：kiki，編輯：山核桃，創(chuàng)業(yè)邦經(jīng)授權(quán)發(fā)布。

如果對比去年同期，你會發(fā)現(xiàn)今年12月是大模型行業(yè)的一個熱鬧峰值。

從11月中旬開始，OpenAI、微軟、谷歌、字節(jié)跳動、百度和智譜等科技公司都召開了與大模型相關(guān)的發(fā)布會，推出了一系列新模型、新應(yīng)用和新產(chǎn)品，其中OpenAI的12天連續(xù)直播更是開啟了科技公司發(fā)布會的新流行。

熱鬧之下，比起去年技術(shù)層和競爭層的種種不確定性，當下模型廠商們的心態(tài)和預(yù)期好很多。一方面，在技術(shù)側(cè)，一場推理AI競賽已經(jīng)開打；另一方面，應(yīng)用層包括AI Agent、搜索等方向也已經(jīng)明確。

我們整理了12月大模型行業(yè)里的五個趨勢，記錄這個瘋狂月份里的興奮和失落。

01OpenAI扣動板機，開啟推理AI競賽

隨著OpenAI相繼發(fā)布o1和o3模型，一場推理競賽正在模型廠商間展開。

據(jù)OpenAI發(fā)布的o3系列時給出的評測數(shù)據(jù)，在數(shù)學、編碼、博士級科學問題等復(fù)雜問題上的表現(xiàn)，o3均展現(xiàn)出了強大的實力，例如在陶哲軒等60余位全球數(shù)學家共同推出的最強數(shù)學基準的EpochAI Frontier Math中，o3 創(chuàng)下新紀錄，準確率高達25.2%，而其他模型都沒有超過2.0%。

而在OpenAI沒放出o3前，國內(nèi)外科技公司的目標無疑是追趕o1，谷歌此前發(fā)布全新測試模型Gemini 2.0 Flash Thinking。

今年11月，月之暗面Kimi的新一代數(shù)學推理模型k0-math、DeepSeek的推理模型DeepSeek-R1-Lite預(yù)覽版、阿里云通義的QwQ-32B-Preview也相繼發(fā)布，在一些數(shù)學和編碼評估表現(xiàn)中，它們的分數(shù)比o1還要高。

但一個問題是，目前尚不清楚o3是否會為普通用戶帶來很大幫助，從模型能力來看更適合推編碼、數(shù)學和科學領(lǐng)域的研究人員，除此以外，推理模型也很昂貴。在Keras之父Fran?ois Chollet發(fā)起的ARC-AGI基準測試顯示，盡管o3在高計算模式下得分率為 87.5%，但研究人員在該模式下每個任務(wù)花費達到數(shù)美元，任務(wù)成本很高。

ARC-AGI測試標準圖源：X@arcprize

但成本也只是一個相對的概念。近期，清華NLP實驗室劉知遠教授團隊提出了大模型的密度定律（densing law），該定律表明，大約每過3.3個月（100天），就能用參數(shù)量減半的模型達到當前最先進模型的性能水平，這意味未來推理成本還會快速降低。

但至少從技術(shù)端來看，至少OpenAI再度驗證了Scaling Law沒有消失，只不過是從預(yù)訓(xùn)練端轉(zhuǎn)向了推理端，通過強化學習和更多的思考時間，提升模型的復(fù)雜推理能力，這條路是可行的。

對國內(nèi)外基礎(chǔ)模型廠商而言，它們需要追趕的新目標又出現(xiàn)了。

02降價還在繼續(xù)，甚至卷到了視頻模型

繼5月、9月后的兩輪大模型「價格戰(zhàn)」后，OpenAI和火山引擎（字節(jié)跳動旗下云廠商）又掀開了第三輪「價格戰(zhàn)」。

在OpenAI第九天的發(fā)布會上，針對GPT-4o音頻模型，4o音頻價格降低了 60%，降至輸入40美元/百萬tokens、輸出80美元/百萬tokens，文本價格為輸入2.5美元/百萬tokens、輸出10美元/百萬tokens。

OpenAI 12天直播圖源：官網(wǎng)

為了討好開發(fā)者，OpenAI還把價格戰(zhàn)打到了更有性價比的小模型GPT-4o mini上，音頻費用是4o的四分之一?！拔覀兟牭搅碎_發(fā)者關(guān)于成本的反饋，我們正在降低成本”。OpenAI開發(fā)者平臺負責人Olivier Godement在直播中這樣說。

另一邊的火山引擎則是把「價格戰(zhàn)」帶到了視頻模型上，其發(fā)布的豆包視覺理解模型輸入價格為0.003元/每千tokens，比行業(yè)平均價格降低85%，火山引擎稱將視覺理解模型帶入了「厘時代」。

「厘時代」的說法并不陌生，今年5月火山引擎就宣布豆包主力模型將推理輸入價格降至「厘時代」，打響大模型推理算力價格戰(zhàn)，此后阿里云、百度智能云和騰訊云均迅速跟進，大模型推理算力價格下降了90%以上。

降價并不是國內(nèi)模型廠商的獨有特色，OpenAI也曾多次降價。但區(qū)別于國外廠商，國內(nèi)大模型玩家的特點是：降價幅度更狠，且多為云廠商主導(dǎo)。

降價的原因主要有三：首先，以價換量，以價格帶動推理算力消耗量增長，這也是為什么降價主要集中在云廠商的原因。

火山引擎方面，5月豆包通用模型的日均tokens使用量為1200億，截至12月中旬，日均tokens使用量已超過4萬億，較七個月前首次發(fā)布時增長了33倍。百度5月日均Token消耗量是2500億，截至11月初，百度文心大模型的日均處理Tokens文本數(shù)超過1.7萬億，不到半年增長了6.8倍。

其次，隨著底層大模型成本、價格的降低，吸引開發(fā)者，加速AI進入外部企業(yè)，搶占應(yīng)用生態(tài)。

零一萬物創(chuàng)始人李開復(fù)在近期的一場采訪中對比去年和今年的模型價格，這樣說：“一年半的時間內(nèi)，價格差了500倍，同時模型能力還有很大程度的提升。今天如果你還覺得貴，明年99%的概率就不貴了，再過一年可能不但不貴，而且能夠支撐你做想要的應(yīng)用?！?/strong>

最后，技術(shù)本身的優(yōu)化也帶來降本的空間。譚待提到，降價是算法、軟件、工程和硬件結(jié)合的結(jié)果，例如模型結(jié)構(gòu)的優(yōu)化，在工程手段上，針對不同客戶場景集中規(guī)?；幚砟Ｐ驼{(diào)用任務(wù)以及采用多種工程化手段，還有通過以異構(gòu)資源池化的解決方案，提升芯片利用率等。

譚待談到驅(qū)動兩次降價的兩個內(nèi)部決策因素，提到兩個核心因素，一方面會了解開發(fā)者、企業(yè)在使用過程中對成本痛點，價格降到多少，他們就能用起來，另一方面，火山引擎也在通過技術(shù)優(yōu)化能把成本打到多低：“這兩個值的中間段就是火山引擎可以定下的價格”。

據(jù)華泰證券此前預(yù)測，降價或還會蔓延，且已呈現(xiàn)出向主力模型降價的趨勢。但降價是面子，模型能力才是里子，模型廠商需要回答的核心問題有兩個：一是以價換量是否會影響利潤表現(xiàn)（國內(nèi)云廠商這些年均強調(diào)利潤），二是模型效果是否能真正讓客戶買單，因為一切競爭的原點都還會回歸模型的推理能力上。

03大模型應(yīng)用爆發(fā)了，但能用到好用間還有鴻溝

計算成本的下降和基礎(chǔ)模型選項的增加，讓大模型應(yīng)用層進入了一個飛速發(fā)展的時期，風險投資公司Lerer Hippeau管理合伙人Ben Lerer甚至這樣說：

“如果你是一家初創(chuàng)公司，你可以選擇當下流行的方案，不僅僅是做ChatGPT包裝器、Claude包裝器、Gemini包裝器，或者隨便什么，你可以將所有這些包裝器組合起來，以優(yōu)化功能、結(jié)果和這些結(jié)果的成本。”

「套殼與否」已經(jīng)不再成為市場關(guān)注的重點，國外應(yīng)用層玩家的「通用大模型套垂直小模型」的「雞尾酒打法」也已復(fù)制到中國。

以國內(nèi)AI玩具廠商躍然創(chuàng)新為例，創(chuàng)始人李勇就提到，在通用大模型上和MiniMax、豆包、智譜均有合作，“各家效果都挺好，兒童場景也夠用”，現(xiàn)階段使用MiniMax比較多是因為“給了躍然創(chuàng)新早期用戶很多免費tokens”。

比起外界對「何時出現(xiàn)殺手級應(yīng)用」的追問，各家廠商有自己的判斷，此前字節(jié)管理層判斷AI對話類產(chǎn)品可能只是AI產(chǎn)品的「中間態(tài)」，而百度創(chuàng)始人李彥宏則對外反復(fù)談到，Agent是他最看好的AI應(yīng)用發(fā)展方向。

整個12月，大模型玩家們圍繞應(yīng)用層的探索形成了「2+X」的確定性方向，其中「2」指的是AI Agent（智能代理）和AI搜索，而「X」則是包括AI玩具、AI耳機、AI眼鏡等諸多AI軟/硬件產(chǎn)品。

在AI搜索上，姍姍來遲的OpenAI終于在12天直播中宣布在ChatGPT新增了搜索功能，而據(jù)外媒報道，谷歌在推出AI Overviews后，近期也在考慮在Chrome瀏覽器中增加「AI模式」選項。而在不久前，AI搜索領(lǐng)域的巨頭Perplexity AI也完成了新一輪5億美元的融資，估值已升至90億美元。

搜索這塊「舊蛋糕」一直是大模型應(yīng)用的必爭之地，如今戰(zhàn)火更盛的原因一是大模型推理技術(shù)能力的提升，二是對商業(yè)化的迫切需求讓玩家們加大了對搜索這一「離錢更近」場景的爭奪。

而與AI搜索關(guān)系「曖昧」的AI Agent也在12月成為最火的應(yīng)用落地方向。

Anthropic推出的Computer Use功能和智譜近期發(fā)布的AutoGLM都展示了端側(cè)Agent的交互性、自動化和主動性等特點，國內(nèi)外科技大廠也幾乎都有自己的 Agent平臺。

在科技企業(yè)的各種演示中，AI Agent似乎已經(jīng)能融入用戶的工作和生活，不僅在手機端能執(zhí)行預(yù)定酒店、點外賣等指令，還可以成為用戶的工作助理，智譜AI CEO張鵬將AI Agent比作大模型通用操作系統(tǒng)LLM-OS的雛形，它的潛力在于大模型公司可以以此搭建自己的生態(tài)圈，在手機、PC等端側(cè)找到落地的入口。

“（AI Agent）實現(xiàn)大模型的互聯(lián)互通，理論是沒有邊界的”。張鵬表示。

但也請對科技公司的理想保持冷靜?，F(xiàn)階段，他們尚未解決的問題還有很多。比如商業(yè)模式，在C端，智能體目前尚沒有形成新的商業(yè)模式，依舊靠高流量帶來的付費轉(zhuǎn)化，百度、字節(jié)等大廠的智能體還需要靠自己已有的流量陣地完成分發(fā)。

而在B端，紅杉在近期一份報道中指出，隨著代理（Agent）應(yīng)用很快變得更加復(fù)雜，對于任何給定的領(lǐng)域，收集現(xiàn)實世界的數(shù)據(jù)、編碼領(lǐng)域和應(yīng)用特定的認知架構(gòu)也將成為更多玩家擺在眼前的挑戰(zhàn)。

當然，在「X」上也涌現(xiàn)出更多的嘗試。除了我們已熟悉的AI手機、AI PC外，紅極一時的AI Pin不見了，新的風口屬于AI玩具和AI耳機。

字節(jié)的顯眼包，已經(jīng)開賣的AI毛絨玩具，究竟是風口，還是剛需，銷量和復(fù)購數(shù)字會給出答案。

一句話總結(jié)，在強調(diào)「應(yīng)用優(yōu)先」的共識里，從能用到好用，還有許多鴻溝。

04資金大分裂繼續(xù)，窮人富人已經(jīng)出現(xiàn)

熱鬧的年終發(fā)布月里，久違的大模型融資熱又來了。

上個月底，在OpenAI和Anthropic完成新一筆融資后，據(jù)我們不完全統(tǒng)計，12月初，又一批國內(nèi)外的明星AI企業(yè)們拿到了「過冬錢」。

國內(nèi)大模型企業(yè)中，面壁智能、智譜AI、階躍星辰完成新一輪融資，至此也將國內(nèi)基座大模型的估值抬升至200億元門檻，隨著單筆融資的提升，我們發(fā)現(xiàn)接住國內(nèi)大模型公司已經(jīng)變成了老股東、國資和科技大廠。

國外企業(yè)中，模型層、應(yīng)用層和幾基座層均有新融資出現(xiàn)，Perplexity AI、X.AI、Databricks、Cursor等公司都拿到了新一筆錢。

拿到錢該如何分配，是這些公司下一步的重點，加碼技術(shù)研發(fā)和基礎(chǔ)設(shè)施建設(shè)還是主線。X.AI在本次融資公告中就提到，主要用途預(yù)計是采購另外10萬塊英偉達 GPU，以進一步擴充其算力規(guī)模。

融資的牌桌上，有富人，就有窮人。風險機構(gòu)Northzone合伙人Molly Alter預(yù)測：“「最誘人」的交易將繼續(xù)以極高的估值進行，但對于其他公司而言，則需要展示非常具體的指標才能獲得高估值?！父蝗恕购汀父F人」將出現(xiàn)巨大的分化?！?/p>

分化的結(jié)果將是，我們會看見，尋求退場或倒閉的初創(chuàng)公司會增加，大型科技公司和頭部企業(yè)的整合速度也會加快。

如Perplexity AI在本月收購了一家名為Carbon的小型初創(chuàng)公司，Cursor背后的開發(fā)商Anysphere也將另一款A(yù)I編碼助手Supermaven收入囊中。

「The information」此前曾提出，衡量那些短期內(nèi)不太可能被收購的公司主要有以下幾點因素：收入和利潤、增長、員工人數(shù)、籌集的總資金以及公司是否從可能成為收購者的戰(zhàn)略投資者那里籌集了大量資金。

05回流與出走，所有人都面臨”人“的問題

人、錢、事，是所有公司的三要素，而在大模型行業(yè)，人又是最關(guān)鍵的因素。

圍繞大模型組織的整合、人才的回流和出走，成了年末的焦點話題。

此前我們在《大模型狂飆兩年后，“六小龍”開始做減法》曾報道過，大模型「六小龍」中已經(jīng)不斷有人員離開，他們離職的方向包括但不限于——回流大廠、再創(chuàng)業(yè)。

而再創(chuàng)業(yè)的方向基本也和AI相關(guān)，零一萬物前聯(lián)潘欣在近期以閃極AI合伙人身份投身AI眼鏡浪潮，月之暗面前產(chǎn)品負責人王冠的新創(chuàng)業(yè)項目ONE2X也在11月完成天使輪融資。

而「人」也是過去一年里OpenAI頭疼的問題。不久前，「GPT之父」Alec RadfordAlec Radford也宣布從OpenAI離開，宣布將開啟自己獨立研究生涯。搜索負責人Shivakumar Venkataraman也在加入公司七個月后離職，他領(lǐng)導(dǎo)了OpenAI企業(yè)客戶的搜索和人工智能的開發(fā)。

類似的整合也出現(xiàn)在大廠內(nèi)部，它們需要以更靈活的姿態(tài)應(yīng)對競爭。此前據(jù)《智能涌現(xiàn)》報道，阿里旗下的AI應(yīng)用「通義」也從阿里云分拆，并入阿里智能信息事業(yè)群。

可以肯定的是，隨著競爭激烈，組織和人才整合和分化不會停止。

時間撥回去年12月，在經(jīng)歷了內(nèi)斗動蕩后，重回管理層的Sam Altman或許不會想到，此刻的OpenAI已經(jīng)歷了一輪人才的大換血。

一年前，人們討論的話題是創(chuàng)業(yè)公司和大廠間的競爭，技術(shù)上聚焦長文本窗口，流行大模型是一把手工程，一年過去，這些話題還在討論，但有些問題已經(jīng)隨技術(shù)更迭成為共識。

即便人們對AI依舊懷疑，但它確實已走入人們的生活，這個趨勢將無法阻擋，正如Sam Altman在12天直播發(fā)布會后所說的那樣：

“You can just do things。”

本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表，版權(quán)歸原作者所有。文章系作者個人觀點，不代表創(chuàng)業(yè)邦立場，轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問，請聯(lián)系editor@cyzone.cn。