編者按:本文來自微信公眾號 吳懟懟,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
01?
先說結(jié)論,若DeepSeek必須選擇“拿誰的錢”,騰訊可能是最佳選擇之一,阿里是其二。
騰訊是最積極接入DeepSeek的一家大廠。B端騰訊云第一時間接入,C端騰訊元寶全線接入,微信搜索灰度接入。
組織架構(gòu)的調(diào)整也在DeepSeek這波刺激之下迅速完成,原本歸屬于PCG的一系列產(chǎn)品劃入CSIG,從toB和toC兩側(cè)完成AI Agent的布局。???????
另外,騰訊投資的口碑一致很不錯,把半條命交給合作伙伴雖然已是過去時,但騰訊投資對所投企業(yè)干涉確實很少,所投企業(yè)最終也成為巨頭,比如美團(tuán),拼多多和京東。
最近一個細(xì)節(jié)則是,民營企業(yè)座談會上,馬化騰和梁文峰坐在一塊,會后肯定會聊點什么,哪怕是寒暄幾句。?
不像當(dāng)初張一鳴不想做騰訊員工,字節(jié)是直接全方位挑戰(zhàn)騰訊的業(yè)務(wù),而DeepSeek不需要和騰訊成為競爭對手。
DeepSeek做的是開源模型,開源模型目前最有競爭力的是Meta的LLaMA,國內(nèi)最像Meta的就是騰訊和字節(jié),擁有大量用戶和數(shù)據(jù)。
盡管現(xiàn)階段用戶反饋,相較于AI自己的學(xué)習(xí)訓(xùn)練可以忽略不計,但越往后走,開源大模型的競爭力,取決因素必然包含海量用戶集。
而字節(jié)呢,已經(jīng)押注了閉源模型,也在豆包上面傾注了巨量資源,現(xiàn)在是不是走開放模式接入DeepSeek尚未可知。
而且,這次民營企業(yè)座談會,字節(jié)也沒有代表去參加。解決tiktok的問題,對字節(jié)來說仍然棘手。????????????????????????????????
02
為什么說阿里也很有競爭力??
阿里此前在AI賽道的投資,幾乎是“買賽道”的模式。
大模型賽道,投資了月之暗面(Moonshot AI)、MiniMax、智譜AI、百川智能和零一萬物。
有一些是通過“現(xiàn)金+阿里云算力額度”模式投資,阿里云養(yǎng)兵千日,又等到了AI的爆發(fā)。????????????
芯片領(lǐng)域,投資了墨芯人工智能(稀疏計算芯片)、瀚博半導(dǎo)體(GPU設(shè)計),強化算力底層支撐。
機器人板塊,投資逐際動力(人形機器人)、星動紀(jì)元(工業(yè)機器人),可以說是全面布局。??
另一方面,阿里加速剝離了非主營業(yè)務(wù),賣掉了線下零售,出手了和電商無關(guān)的投資。一切向吳詠銘所說的“用戶為先,AI驅(qū)動”的方向走了。?????
此外,很核心的一個因素是,DeepSeek蒸餾了阿里的Qwen模型。????
根據(jù)公開資料顯示,DeepSeek通過知識蒸餾技術(shù),將自研的DeepSeek-R1(671B參數(shù))作為教師模型,對Qwen系列的以下模型進(jìn)行了蒸餾:
1、Qwen-1.5B,通過兩階段蒸餾法(結(jié)構(gòu)蒸餾+強化學(xué)習(xí)),在數(shù)學(xué)推理任務(wù)中性能接近教師模型的80%
2、Qwen-7B,在AIME 2024基準(zhǔn)測試中實現(xiàn)55.5%的Pass@1,超越同類開源模型
3、Qwen-14B,采用漸進(jìn)式分層蒸餾體系,在GSM8K數(shù)學(xué)題測試中準(zhǔn)確率達(dá)89%
4、Qwen-32B,性能表現(xiàn)最突出,在MATH-500測試中Pass@1高達(dá)94.3%,推理速度比原模型提升50倍?
這些蒸餾模型均基于DeepSeek-R1生成的80萬條結(jié)構(gòu)化推理數(shù)據(jù)(含數(shù)學(xué)、編程等任務(wù))進(jìn)行監(jiān)督微調(diào),并通過模板化輸出對齊教師模型的推理軌跡。
當(dāng)然,值得注意的是,70B參數(shù)級別的蒸餾模型僅針對Llama架構(gòu)開發(fā),未覆蓋Qwen系列。
阿里最終也拿下了和蘋果國行的AI合作。
最近,杭州的創(chuàng)業(yè)氛圍和營商環(huán)境被各方點贊,DeepSeek和阿里同在杭州,阿里在地理位置上,有著更接近的優(yōu)勢。?????????
03
DeepSeek的融資很容易,但也很難。
盡管各方都想要給錢,但DeepSeek怎么拿錢卻是一件難事。???????????????
1、高估值。參照OpenAI 3000億美金估值,DeepSeek的估值預(yù)期必然也是直奔千億級。這意味著拿5%股權(quán)就要掏出50億美金——放眼全球,能輕松開支票的機構(gòu)也不多。
2、融資低欲望。從未融資的創(chuàng)業(yè)公司,就像沒相過親的鉆石王老五,根本不知道該怎么和投資人“談戀愛"。更何況創(chuàng)始人團(tuán)隊可能覺得“我們自己印鈔機(幻方量化)賺的錢都花不完”。當(dāng)然,這個可能性現(xiàn)在比較小,幻方量化的管理規(guī)模已經(jīng)縮水很多了。
3、中外兩面的困境。拿外資可能觸發(fā)數(shù)據(jù)安全審查,接國資則可能面臨出海封鎖,選大廠?看看那些自研的“人工智障”模型就知道技術(shù)團(tuán)隊有多抗拒。當(dāng)然,拿錢的話,創(chuàng)始團(tuán)隊可以馬上改善生活。
4、開源模式的盈利詛咒。不同于閉源的ChatGPT可以通過API收費,DeepSeek選擇的開源路線本質(zhì)是“用愛發(fā)電”。參考RedHat(紅帽)的歷史,開源巨頭最終仍需依附IBM這樣的傳統(tǒng)巨頭。更殘酷的是,國內(nèi)尚未出現(xiàn)愿意為開源模型付費的成熟市場,這讓投資回報率充滿不確定性。
5、別的可能性。剩下的選項個個都是硬骨頭:發(fā)債需要穩(wěn)定現(xiàn)金流,另外,讓銀行給沒盈利的AI公司放貸?銀行可能沒操作過。
科創(chuàng)板雖然已經(jīng)不硬性要求盈利,但是未盈利企業(yè)的通過率顯著低于盈利企業(yè)。
港股IPO,港股流動性堪憂,雖然這一波恒生科技困境逆轉(zhuǎn),觸底反彈,但是商湯科技的故事尚在眼前。
那么母公司上市呢?幻方量化上市更是牽涉量化私募監(jiān)管風(fēng)暴。
綜上,相較之下,騰訊、阿里的產(chǎn)業(yè)資本反而成了“最不壞的選擇”——既能提供社交、電商等落地場景,又有海外投資經(jīng)驗規(guī)避監(jiān)管風(fēng)險。
而且,對于整體中概的估值修復(fù),中國企業(yè)重新吸引全球資本的大敘事來說,拿騰訊或者阿里的錢,都不是壞事。??????????
現(xiàn)在,就看梁文峰和DeepSeek團(tuán)隊更喜歡哪家公司了。
本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個人觀點,不代表創(chuàng)業(yè)邦立場,轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問,請聯(lián)系editor@cyzone.cn。