五月天成人小说,中文字幕亚洲欧美专区,久久妇女,亚洲伊人久久大香线蕉综合,日日碰狠狠添天天爽超碰97

大模型瘋狂12月,卷出五個(gè)關(guān)鍵趨勢(shì)

興奮與失落

編者按:本文來(lái)自微信公眾號(hào) 硅基研究室(ID:gh_cef05ac13977),作者:kiki,編輯:山核桃,創(chuàng)業(yè)邦經(jīng)授權(quán)發(fā)布。

如果對(duì)比去年同期,你會(huì)發(fā)現(xiàn)今年12月是大模型行業(yè)的一個(gè)熱鬧峰值。

從11月中旬開(kāi)始,OpenAI、微軟、谷歌、字節(jié)跳動(dòng)、百度和智譜等科技公司都召開(kāi)了與大模型相關(guān)的發(fā)布會(huì),推出了一系列新模型、新應(yīng)用和新產(chǎn)品,其中OpenAI的12天連續(xù)直播更是開(kāi)啟了科技公司發(fā)布會(huì)的新流行。

熱鬧之下,比起去年技術(shù)層和競(jìng)爭(zhēng)層的種種不確定性,當(dāng)下模型廠商們的心態(tài)和預(yù)期好很多。一方面,在技術(shù)側(cè),一場(chǎng)推理AI競(jìng)賽已經(jīng)開(kāi)打;另一方面,應(yīng)用層包括AI Agent、搜索等方向也已經(jīng)明確。

我們整理了12月大模型行業(yè)里的五個(gè)趨勢(shì),記錄這個(gè)瘋狂月份里的興奮和失落。

01OpenAI扣動(dòng)板機(jī),開(kāi)啟推理AI競(jìng)賽

隨著OpenAI相繼發(fā)布o(jì)1和o3模型,一場(chǎng)推理競(jìng)賽正在模型廠商間展開(kāi)。

據(jù)OpenAI發(fā)布的o3系列時(shí)給出的評(píng)測(cè)數(shù)據(jù),在數(shù)學(xué)、編碼、博士級(jí)科學(xué)問(wèn)題等復(fù)雜問(wèn)題上的表現(xiàn),o3均展現(xiàn)出了強(qiáng)大的實(shí)力,例如在陶哲軒等60余位全球數(shù)學(xué)家共同推出的最強(qiáng)數(shù)學(xué)基準(zhǔn)的EpochAI Frontier Math中,o3 創(chuàng)下新紀(jì)錄,準(zhǔn)確率高達(dá)25.2%,而其他模型都沒(méi)有超過(guò)2.0%。

而在OpenAI沒(méi)放出o3前,國(guó)內(nèi)外科技公司的目標(biāo)無(wú)疑是追趕o1,谷歌此前發(fā)布全新測(cè)試模型Gemini 2.0 Flash Thinking。

今年11月,月之暗面Kimi的新一代數(shù)學(xué)推理模型k0-math、DeepSeek的推理模型DeepSeek-R1-Lite預(yù)覽版、阿里云通義的QwQ-32B-Preview也相繼發(fā)布,在一些數(shù)學(xué)和編碼評(píng)估表現(xiàn)中,它們的分?jǐn)?shù)比o1還要高。

但一個(gè)問(wèn)題是,目前尚不清楚o3是否會(huì)為普通用戶帶來(lái)很大幫助,從模型能力來(lái)看更適合推編碼、數(shù)學(xué)和科學(xué)領(lǐng)域的研究人員,除此以外,推理模型也很昂貴。在Keras之父Fran?ois Chollet發(fā)起的ARC-AGI基準(zhǔn)測(cè)試顯示,盡管o3在高計(jì)算模式下得分率為 87.5%,但研究人員在該模式下每個(gè)任務(wù)花費(fèi)達(dá)到數(shù)美元,任務(wù)成本很高。

圖片

ARC-AGI測(cè)試標(biāo)準(zhǔn) 圖源:X@arcprize

但成本也只是一個(gè)相對(duì)的概念。近期,清華NLP實(shí)驗(yàn)室劉知遠(yuǎn)教授團(tuán)隊(duì)提出了大模型的密度定律(densing law),該定律表明,大約每過(guò)3.3個(gè)月(100天),就能用參數(shù)量減半的模型達(dá)到當(dāng)前最先進(jìn)模型的性能水平,這意味未來(lái)推理成本還會(huì)快速降低。

但至少?gòu)募夹g(shù)端來(lái)看,至少OpenAI再度驗(yàn)證了Scaling Law沒(méi)有消失,只不過(guò)是從預(yù)訓(xùn)練端轉(zhuǎn)向了推理端,通過(guò)強(qiáng)化學(xué)習(xí)和更多的思考時(shí)間,提升模型的復(fù)雜推理能力,這條路是可行的。

對(duì)國(guó)內(nèi)外基礎(chǔ)模型廠商而言,它們需要追趕的新目標(biāo)又出現(xiàn)了。

02降價(jià)還在繼續(xù),甚至卷到了視頻模型

繼5月、9月后的兩輪大模型「價(jià)格戰(zhàn)」后,OpenAI和火山引擎(字節(jié)跳動(dòng)旗下云廠商)又掀開(kāi)了第三輪「價(jià)格戰(zhàn)」。

在OpenAI第九天的發(fā)布會(huì)上,針對(duì)GPT-4o音頻模型,4o音頻價(jià)格降低了 60%,降至輸入40美元/百萬(wàn)tokens、輸出80美元/百萬(wàn)tokens,文本價(jià)格為輸入2.5美元/百萬(wàn)tokens、輸出10美元/百萬(wàn)tokens。

圖片

圖片

OpenAI 12天直播 圖源:官網(wǎng)

為了討好開(kāi)發(fā)者,OpenAI還把價(jià)格戰(zhàn)打到了更有性價(jià)比的小模型GPT-4o mini上,音頻費(fèi)用是4o的四分之一。“我們聽(tīng)到了開(kāi)發(fā)者關(guān)于成本的反饋,我們正在降低成本”。OpenAI開(kāi)發(fā)者平臺(tái)負(fù)責(zé)人Olivier Godement在直播中這樣說(shuō)。

另一邊的火山引擎則是把「價(jià)格戰(zhàn)」帶到了視頻模型上,其發(fā)布的豆包視覺(jué)理解模型輸入價(jià)格為0.003元/每千tokens,比行業(yè)平均價(jià)格降低85%,火山引擎稱將視覺(jué)理解模型帶入了「厘時(shí)代」。

「厘時(shí)代」的說(shuō)法并不陌生,今年5月火山引擎就宣布豆包主力模型將推理輸入價(jià)格降至「厘時(shí)代」,打響大模型推理算力價(jià)格戰(zhàn),此后阿里云、百度智能云和騰訊云均迅速跟進(jìn),大模型推理算力價(jià)格下降了90%以上。

圖片

降價(jià)并不是國(guó)內(nèi)模型廠商的獨(dú)有特色,OpenAI也曾多次降價(jià)。但區(qū)別于國(guó)外廠商,國(guó)內(nèi)大模型玩家的特點(diǎn)是:降價(jià)幅度更狠,且多為云廠商主導(dǎo)。

降價(jià)的原因主要有三:首先,以價(jià)換量,以價(jià)格帶動(dòng)推理算力消耗量增長(zhǎng),這也是為什么降價(jià)主要集中在云廠商的原因。

火山引擎方面,5月豆包通用模型的日均tokens使用量為1200億,截至12月中旬,日均tokens使用量已超過(guò)4萬(wàn)億,較七個(gè)月前首次發(fā)布時(shí)增長(zhǎng)了33倍。百度5月日均Token消耗量是2500億,截至11月初,百度文心大模型的日均處理Tokens文本數(shù)超過(guò)1.7萬(wàn)億,不到半年增長(zhǎng)了6.8倍。

其次,隨著底層大模型成本、價(jià)格的降低,吸引開(kāi)發(fā)者,加速AI進(jìn)入外部企業(yè),搶占應(yīng)用生態(tài)。

零一萬(wàn)物創(chuàng)始人李開(kāi)復(fù)在近期的一場(chǎng)采訪中對(duì)比去年和今年的模型價(jià)格,這樣說(shuō):“一年半的時(shí)間內(nèi),價(jià)格差了500倍,同時(shí)模型能力還有很大程度的提升。今天如果你還覺(jué)得貴,明年99%的概率就不貴了,再過(guò)一年可能不但不貴,而且能夠支撐你做想要的應(yīng)用?!?/strong>

最后,技術(shù)本身的優(yōu)化也帶來(lái)降本的空間。譚待提到,降價(jià)是算法、軟件、工程和硬件結(jié)合的結(jié)果,例如模型結(jié)構(gòu)的優(yōu)化,在工程手段上,針對(duì)不同客戶場(chǎng)景集中規(guī)模化處理模型調(diào)用任務(wù)以及采用多種工程化手段,還有通過(guò)以異構(gòu)資源池化的解決方案,提升芯片利用率等。

譚待談到驅(qū)動(dòng)兩次降價(jià)的兩個(gè)內(nèi)部決策因素,提到兩個(gè)核心因素,一方面會(huì)了解開(kāi)發(fā)者、企業(yè)在使用過(guò)程中對(duì)成本痛點(diǎn),價(jià)格降到多少,他們就能用起來(lái),另一方面,火山引擎也在通過(guò)技術(shù)優(yōu)化能把成本打到多低:“這兩個(gè)值的中間段就是火山引擎可以定下的價(jià)格”。

據(jù)華泰證券此前預(yù)測(cè),降價(jià)或還會(huì)蔓延,且已呈現(xiàn)出向主力模型降價(jià)的趨勢(shì)。但降價(jià)是面子,模型能力才是里子,模型廠商需要回答的核心問(wèn)題有兩個(gè):一是以價(jià)換量是否會(huì)影響利潤(rùn)表現(xiàn)(國(guó)內(nèi)云廠商這些年均強(qiáng)調(diào)利潤(rùn)),二是模型效果是否能真正讓客戶買(mǎi)單,因?yàn)橐磺懈?jìng)爭(zhēng)的原點(diǎn)都還會(huì)回歸模型的推理能力上。

03大模型應(yīng)用爆發(fā)了,但能用到好用間還有鴻溝

計(jì)算成本的下降和基礎(chǔ)模型選項(xiàng)的增加,讓大模型應(yīng)用層進(jìn)入了一個(gè)飛速發(fā)展的時(shí)期,風(fēng)險(xiǎn)投資公司Lerer Hippeau管理合伙人Ben Lerer甚至這樣說(shuō):

“如果你是一家初創(chuàng)公司,你可以選擇當(dāng)下流行的方案,不僅僅是做ChatGPT包裝器、Claude包裝器、Gemini包裝器,或者隨便什么,你可以將所有這些包裝器組合起來(lái),以優(yōu)化功能、結(jié)果和這些結(jié)果的成本?!?/p>

「套殼與否」已經(jīng)不再成為市場(chǎng)關(guān)注的重點(diǎn),國(guó)外應(yīng)用層玩家的「通用大模型套垂直小模型」的「雞尾酒打法」也已復(fù)制到中國(guó)。

以國(guó)內(nèi)AI玩具廠商躍然創(chuàng)新為例,創(chuàng)始人李勇就提到,在通用大模型上和MiniMax、豆包、智譜均有合作,“各家效果都挺好,兒童場(chǎng)景也夠用”,現(xiàn)階段使用MiniMax比較多是因?yàn)椤敖o了躍然創(chuàng)新早期用戶很多免費(fèi)tokens”。

比起外界對(duì)「何時(shí)出現(xiàn)殺手級(jí)應(yīng)用」的追問(wèn),各家廠商有自己的判斷,此前字節(jié)管理層判斷AI對(duì)話類產(chǎn)品可能只是AI產(chǎn)品的「中間態(tài)」,而百度創(chuàng)始人李彥宏則對(duì)外反復(fù)談到,Agent是他最看好的AI應(yīng)用發(fā)展方向。

整個(gè)12月,大模型玩家們圍繞應(yīng)用層的探索形成了「2+X」的確定性方向,其中「2」指的是AI Agent(智能代理)和AI搜索,而「X」則是包括AI玩具、AI耳機(jī)、AI眼鏡等諸多AI軟/硬件產(chǎn)品。

在AI搜索上,姍姍來(lái)遲的OpenAI終于在12天直播中宣布在ChatGPT新增了搜索功能,而據(jù)外媒報(bào)道,谷歌在推出AI Overviews后,近期也在考慮在Chrome瀏覽器中增加「AI模式」選項(xiàng)。而在不久前,AI搜索領(lǐng)域的巨頭Perplexity AI也完成了新一輪5億美元的融資,估值已升至90億美元。

圖片

搜索這塊「舊蛋糕」一直是大模型應(yīng)用的必爭(zhēng)之地,如今戰(zhàn)火更盛的原因一是大模型推理技術(shù)能力的提升,二是對(duì)商業(yè)化的迫切需求讓玩家們加大了對(duì)搜索這一「離錢(qián)更近」場(chǎng)景的爭(zhēng)奪。

而與AI搜索關(guān)系「曖昧」的AI Agent也在12月成為最火的應(yīng)用落地方向。

Anthropic推出的Computer Use功能和智譜近期發(fā)布的AutoGLM都展示了端側(cè)Agent的交互性、自動(dòng)化和主動(dòng)性等特點(diǎn),國(guó)內(nèi)外科技大廠也幾乎都有自己的 Agent平臺(tái)。

在科技企業(yè)的各種演示中,AI Agent似乎已經(jīng)能融入用戶的工作和生活,不僅在手機(jī)端能執(zhí)行預(yù)定酒店、點(diǎn)外賣(mài)等指令,還可以成為用戶的工作助理,智譜AI CEO張鵬將AI Agent比作大模型通用操作系統(tǒng)LLM-OS的雛形,它的潛力在于大模型公司可以以此搭建自己的生態(tài)圈,在手機(jī)、PC等端側(cè)找到落地的入口。

圖片

“(AI Agent)實(shí)現(xiàn)大模型的互聯(lián)互通,理論是沒(méi)有邊界的”。張鵬表示。

但也請(qǐng)對(duì)科技公司的理想保持冷靜?,F(xiàn)階段,他們尚未解決的問(wèn)題還有很多。比如商業(yè)模式,在C端,智能體目前尚沒(méi)有形成新的商業(yè)模式,依舊靠高流量帶來(lái)的付費(fèi)轉(zhuǎn)化,百度、字節(jié)等大廠的智能體還需要靠自己已有的流量陣地完成分發(fā)。

而在B端,紅杉在近期一份報(bào)道中指出,隨著代理(Agent)應(yīng)用很快變得更加復(fù)雜,對(duì)于任何給定的領(lǐng)域,收集現(xiàn)實(shí)世界的數(shù)據(jù)、編碼領(lǐng)域和應(yīng)用特定的認(rèn)知架構(gòu)也將成為更多玩家擺在眼前的挑戰(zhàn)。

當(dāng)然,在「X」上也涌現(xiàn)出更多的嘗試。除了我們已熟悉的AI手機(jī)、AI PC外,紅極一時(shí)的AI Pin不見(jiàn)了,新的風(fēng)口屬于AI玩具和AI耳機(jī)。

字節(jié)的顯眼包,已經(jīng)開(kāi)賣(mài)的AI毛絨玩具,究竟是風(fēng)口,還是剛需,銷(xiāo)量和復(fù)購(gòu)數(shù)字會(huì)給出答案。

一句話總結(jié),在強(qiáng)調(diào)「應(yīng)用優(yōu)先」的共識(shí)里,從能用到好用,還有許多鴻溝。

04資金大分裂繼續(xù),窮人富人已經(jīng)出現(xiàn)

熱鬧的年終發(fā)布月里,久違的大模型融資熱又來(lái)了。

上個(gè)月底,在OpenAI和Anthropic完成新一筆融資后,據(jù)我們不完全統(tǒng)計(jì),12月初,又一批國(guó)內(nèi)外的明星AI企業(yè)們拿到了「過(guò)冬錢(qián)」。

圖片

國(guó)內(nèi)大模型企業(yè)中,面壁智能、智譜AI、階躍星辰完成新一輪融資,至此也將國(guó)內(nèi)基座大模型的估值抬升至200億元門(mén)檻,隨著單筆融資的提升,我們發(fā)現(xiàn)接住國(guó)內(nèi)大模型公司已經(jīng)變成了老股東、國(guó)資和科技大廠。

國(guó)外企業(yè)中,模型層、應(yīng)用層和幾基座層均有新融資出現(xiàn),Perplexity AI、X.AI、Databricks、Cursor等公司都拿到了新一筆錢(qián)。

拿到錢(qián)該如何分配,是這些公司下一步的重點(diǎn),加碼技術(shù)研發(fā)和基礎(chǔ)設(shè)施建設(shè)還是主線。X.AI在本次融資公告中就提到,主要用途預(yù)計(jì)是采購(gòu)另外10萬(wàn)塊英偉達(dá) GPU,以進(jìn)一步擴(kuò)充其算力規(guī)模。

融資的牌桌上,有富人,就有窮人。風(fēng)險(xiǎn)機(jī)構(gòu)Northzone合伙人Molly Alter預(yù)測(cè):“「最誘人」的交易將繼續(xù)以極高的估值進(jìn)行,但對(duì)于其他公司而言,則需要展示非常具體的指標(biāo)才能獲得高估值。「富人」和「窮人」將出現(xiàn)巨大的分化。”

分化的結(jié)果將是,我們會(huì)看見(jiàn),尋求退場(chǎng)或倒閉的初創(chuàng)公司會(huì)增加,大型科技公司和頭部企業(yè)的整合速度也會(huì)加快。

如Perplexity AI在本月收購(gòu)了一家名為Carbon的小型初創(chuàng)公司,Cursor背后的開(kāi)發(fā)商Anysphere也將另一款A(yù)I編碼助手Supermaven收入囊中。

「The information」此前曾提出,衡量那些短期內(nèi)不太可能被收購(gòu)的公司主要有以下幾點(diǎn)因素:收入和利潤(rùn)、增長(zhǎng)、員工人數(shù)、籌集的總資金以及公司是否從可能成為收購(gòu)者的戰(zhàn)略投資者那里籌集了大量資金。

05回流與出走,所有人都面臨”人“的問(wèn)題

人、錢(qián)、事,是所有公司的三要素,而在大模型行業(yè),人又是最關(guān)鍵的因素。

圍繞大模型組織的整合、人才的回流和出走,成了年末的焦點(diǎn)話題。

此前我們?cè)凇洞竽P涂耧j兩年后,“六小龍”開(kāi)始做減法》曾報(bào)道過(guò),大模型「六小龍」中已經(jīng)不斷有人員離開(kāi),他們離職的方向包括但不限于——回流大廠、再創(chuàng)業(yè)。

而再創(chuàng)業(yè)的方向基本也和AI相關(guān),零一萬(wàn)物前聯(lián)潘欣在近期以閃極AI合伙人身份投身AI眼鏡浪潮,月之暗面前產(chǎn)品負(fù)責(zé)人王冠的新創(chuàng)業(yè)項(xiàng)目ONE2X也在11月完成天使輪融資。

而「人」也是過(guò)去一年里OpenAI頭疼的問(wèn)題。不久前,「GPT之父」Alec RadfordAlec Radford也宣布從OpenAI離開(kāi),宣布將開(kāi)啟自己獨(dú)立研究生涯。搜索負(fù)責(zé)人Shivakumar Venkataraman也在加入公司七個(gè)月后離職,他領(lǐng)導(dǎo)了OpenAI企業(yè)客戶的搜索和人工智能的開(kāi)發(fā)。

類似的整合也出現(xiàn)在大廠內(nèi)部,它們需要以更靈活的姿態(tài)應(yīng)對(duì)競(jìng)爭(zhēng)。此前據(jù)《智能涌現(xiàn)》報(bào)道,阿里旗下的AI應(yīng)用「通義」也從阿里云分拆,并入阿里智能信息事業(yè)群。

可以肯定的是,隨著競(jìng)爭(zhēng)激烈,組織和人才整合和分化不會(huì)停止。

時(shí)間撥回去年12月,在經(jīng)歷了內(nèi)斗動(dòng)蕩后,重回管理層的Sam Altman或許不會(huì)想到,此刻的OpenAI已經(jīng)歷了一輪人才的大換血。

一年前,人們討論的話題是創(chuàng)業(yè)公司和大廠間的競(jìng)爭(zhēng),技術(shù)上聚焦長(zhǎng)文本窗口,流行大模型是一把手工程,一年過(guò)去,這些話題還在討論,但有些問(wèn)題已經(jīng)隨技術(shù)更迭成為共識(shí)。

即便人們對(duì)AI依舊懷疑,但它確實(shí)已走入人們的生活,這個(gè)趨勢(shì)將無(wú)法阻擋,正如Sam Altman在12天直播發(fā)布會(huì)后所說(shuō)的那樣:

“You can just do things?!?/p>

本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn),不代表創(chuàng)業(yè)邦立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問(wèn),請(qǐng)聯(lián)系editor@cyzone.cn。

反饋
聯(lián)系我們
推薦訂閱