DeepSeek最終會(huì)拿誰(shuí)的錢？

吳懟懟·2025-02-23

關(guān)注

現(xiàn)在，就看梁文峰和DeepSeek團(tuán)隊(duì)更喜歡哪家公司了。

編者按：本文來(lái)自微信公眾號(hào) 吳懟懟，創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。

01?

先說(shuō)結(jié)論，若DeepSeek必須選擇“拿誰(shuí)的錢”，騰訊可能是最佳選擇之一，阿里是其二。

騰訊是最積極接入DeepSeek的一家大廠。B端騰訊云第一時(shí)間接入，C端騰訊元寶全線接入，微信搜索灰度接入。

組織架構(gòu)的調(diào)整也在DeepSeek這波刺激之下迅速完成，原本歸屬于PCG的一系列產(chǎn)品劃入CSIG，從toB和toC兩側(cè)完成AI Agent的布局。???????

另外，騰訊投資的口碑一致很不錯(cuò)，把半條命交給合作伙伴雖然已是過去時(shí)，但騰訊投資對(duì)所投企業(yè)干涉確實(shí)很少，所投企業(yè)最終也成為巨頭，比如美團(tuán)，拼多多和京東。

最近一個(gè)細(xì)節(jié)則是，民營(yíng)企業(yè)座談會(huì)上，馬化騰和梁文峰坐在一塊，會(huì)后肯定會(huì)聊點(diǎn)什么，哪怕是寒暄幾句。?

不像當(dāng)初張一鳴不想做騰訊員工，字節(jié)是直接全方位挑戰(zhàn)騰訊的業(yè)務(wù)，而DeepSeek不需要和騰訊成為競(jìng)爭(zhēng)對(duì)手。

DeepSeek做的是開源模型，開源模型目前最有競(jìng)爭(zhēng)力的是Meta的LLaMA，國(guó)內(nèi)最像Meta的就是騰訊和字節(jié)，擁有大量用戶和數(shù)據(jù)。

盡管現(xiàn)階段用戶反饋，相較于AI自己的學(xué)習(xí)訓(xùn)練可以忽略不計(jì)，但越往后走，開源大模型的競(jìng)爭(zhēng)力，取決因素必然包含海量用戶集。

而字節(jié)呢，已經(jīng)押注了閉源模型，也在豆包上面傾注了巨量資源，現(xiàn)在是不是走開放模式接入DeepSeek尚未可知。

而且，這次民營(yíng)企業(yè)座談會(huì)，字節(jié)也沒有代表去參加。解決tiktok的問題，對(duì)字節(jié)來(lái)說(shuō)仍然棘手。????????????????????????????????

02

為什么說(shuō)阿里也很有競(jìng)爭(zhēng)力？?

阿里此前在AI賽道的投資，幾乎是“買賽道”的模式。

大模型賽道，投資了月之暗面（Moonshot AI）、MiniMax、智譜AI、百川智能和零一萬(wàn)物。

有一些是通過“現(xiàn)金+阿里云算力額度”模式投資，阿里云養(yǎng)兵千日，又等到了AI的爆發(fā)。????????????

芯片領(lǐng)域，投資了墨芯人工智能（稀疏計(jì)算芯片）、瀚博半導(dǎo)體（GPU設(shè)計(jì)），強(qiáng)化算力底層支撐。

機(jī)器人板塊，投資逐際動(dòng)力（人形機(jī)器人）、星動(dòng)紀(jì)元（工業(yè)機(jī)器人），可以說(shuō)是全面布局。??

另一方面，阿里加速剝離了非主營(yíng)業(yè)務(wù)，賣掉了線下零售，出手了和電商無(wú)關(guān)的投資。一切向吳詠銘所說(shuō)的“用戶為先，AI驅(qū)動(dòng)”的方向走了。?????

此外，很核心的一個(gè)因素是，DeepSeek蒸餾了阿里的Qwen模型。????

根據(jù)公開資料顯示，DeepSeek通過知識(shí)蒸餾技術(shù)，將自研的DeepSeek-R1（671B參數(shù)）作為教師模型，對(duì)Qwen系列的以下模型進(jìn)行了蒸餾：

1、Qwen-1.5B，通過兩階段蒸餾法（結(jié)構(gòu)蒸餾+強(qiáng)化學(xué)習(xí)），在數(shù)學(xué)推理任務(wù)中性能接近教師模型的80%

2、Qwen-7B，在AIME 2024基準(zhǔn)測(cè)試中實(shí)現(xiàn)55.5%的Pass@1，超越同類開源模型

3、Qwen-14B，采用漸進(jìn)式分層蒸餾體系，在GSM8K數(shù)學(xué)題測(cè)試中準(zhǔn)確率達(dá)89%

4、Qwen-32B，性能表現(xiàn)最突出，在MATH-500測(cè)試中Pass@1高達(dá)94.3%，推理速度比原模型提升50倍?

這些蒸餾模型均基于DeepSeek-R1生成的80萬(wàn)條結(jié)構(gòu)化推理數(shù)據(jù)（含數(shù)學(xué)、編程等任務(wù)）進(jìn)行監(jiān)督微調(diào)，并通過模板化輸出對(duì)齊教師模型的推理軌跡。

當(dāng)然，值得注意的是，70B參數(shù)級(jí)別的蒸餾模型僅針對(duì)Llama架構(gòu)開發(fā)，未覆蓋Qwen系列。

阿里最終也拿下了和蘋果國(guó)行的AI合作。

最近，杭州的創(chuàng)業(yè)氛圍和營(yíng)商環(huán)境被各方點(diǎn)贊，DeepSeek和阿里同在杭州，阿里在地理位置上，有著更接近的優(yōu)勢(shì)。?????????

03

DeepSeek的融資很容易，但也很難。

盡管各方都想要給錢，但DeepSeek怎么拿錢卻是一件難事。???????????????

1、高估值。參照OpenAI 3000億美金估值，DeepSeek的估值預(yù)期必然也是直奔千億級(jí)。這意味著拿5%股權(quán)就要掏出50億美金——放眼全球，能輕松開支票的機(jī)構(gòu)也不多。

2、融資低欲望。從未融資的創(chuàng)業(yè)公司，就像沒相過親的鉆石王老五，根本不知道該怎么和投資人“談戀愛"。更何況創(chuàng)始人團(tuán)隊(duì)可能覺得“我們自己印鈔機(jī)（幻方量化）賺的錢都花不完”。當(dāng)然，這個(gè)可能性現(xiàn)在比較小，幻方量化的管理規(guī)模已經(jīng)縮水很多了。

3、中外兩面的困境。拿外資可能觸發(fā)數(shù)據(jù)安全審查，接國(guó)資則可能面臨出海封鎖，選大廠？看看那些自研的“人工智障”模型就知道技術(shù)團(tuán)隊(duì)有多抗拒。當(dāng)然，拿錢的話，創(chuàng)始團(tuán)隊(duì)可以馬上改善生活。

4、開源模式的盈利詛咒。不同于閉源的ChatGPT可以通過API收費(fèi)，DeepSeek選擇的開源路線本質(zhì)是“用愛發(fā)電”。參考RedHat（紅帽）的歷史，開源巨頭最終仍需依附IBM這樣的傳統(tǒng)巨頭。更殘酷的是，國(guó)內(nèi)尚未出現(xiàn)愿意為開源模型付費(fèi)的成熟市場(chǎng)，這讓投資回報(bào)率充滿不確定性。

5、別的可能性。剩下的選項(xiàng)個(gè)個(gè)都是硬骨頭：發(fā)債需要穩(wěn)定現(xiàn)金流，另外，讓銀行給沒盈利的AI公司放貸？銀行可能沒操作過。

科創(chuàng)板雖然已經(jīng)不硬性要求盈利，但是未盈利企業(yè)的通過率顯著低于盈利企業(yè)。

港股IPO，港股流動(dòng)性堪憂，雖然這一波恒生科技困境逆轉(zhuǎn)，觸底反彈，但是商湯科技的故事尚在眼前。

那么母公司上市呢？幻方量化上市更是牽涉量化私募監(jiān)管風(fēng)暴。

綜上，相較之下，騰訊、阿里的產(chǎn)業(yè)資本反而成了“最不壞的選擇”——既能提供社交、電商等落地場(chǎng)景，又有海外投資經(jīng)驗(yàn)規(guī)避監(jiān)管風(fēng)險(xiǎn)。

而且，對(duì)于整體中概的估值修復(fù)，中國(guó)企業(yè)重新吸引全球資本的大敘事來(lái)說(shuō)，拿騰訊或者阿里的錢，都不是壞事。??????????

現(xiàn)在，就看梁文峰和DeepSeek團(tuán)隊(duì)更喜歡哪家公司了。

本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表，版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn)，不代表創(chuàng)業(yè)邦立場(chǎng)，轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問，請(qǐng)聯(lián)系editor@cyzone.cn。