編者按:本文來自微信公眾號 “中國企業(yè)家雜志”(ID:iceo-com-cn),作者:閆俊文,編輯:張曉迪,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
AI創(chuàng)業(yè)風(fēng)起云涌,過去兩年,創(chuàng)業(yè)者袁進輝經(jīng)歷了兩段奇幻歷程。
第一段是2023年3月,美團聯(lián)合創(chuàng)始人王慧文收購袁進輝的第一個創(chuàng)業(yè)項目OneFlow。OneFlow是一個深度學(xué)習(xí)框架,它可以加速大模型訓(xùn)練效率。王慧文看中了袁進輝的技術(shù)能力。
由此,袁進輝和團隊并入王慧文創(chuàng)立的光年之外,2023年6月,王慧文宣布“病退”,老朋友王興出手接盤,光年之外被美團收購,袁進輝隨之進入美團體系。
第二段是2023年8月,袁進輝決定出走美團,再次創(chuàng)業(yè),成立硅基流動。他瞄準(zhǔn)AI Infra創(chuàng)業(yè),這是一個芯片之上,大模型和應(yīng)用之下的中間層,可通過技術(shù)手段實現(xiàn)模型的穩(wěn)定高效調(diào)用。
今年1月20日,DeepSeek發(fā)布并開源R1推理模型,迅速爆火。2月,袁進輝帶領(lǐng)團隊加班加點,春節(jié)不休,硅基流動聯(lián)合華為云部署R1模型,這讓硅基流動官網(wǎng)的流量暴漲40倍,一度超過騰訊云與阿里云。
袁進輝和DeepSeek創(chuàng)始人梁文鋒還另有一段淵源。
從美團出走之后,袁進輝到處找融資,此時,梁文鋒流露出“有意愿投資”的想法,但兩人在開不開源的問題上有分歧,梁文鋒堅持模型推理部署引擎要開源,不開源沒出路,但袁進輝還沒有從上一段創(chuàng)業(yè)經(jīng)歷OneFlow中走出來——因商業(yè)化不足,該項目數(shù)次陷入資金周轉(zhuǎn)困境。
“我們之前做開源深度學(xué)習(xí)框架OneFlow,開源不見得有助于成功,要想清楚商業(yè)邏輯才行?!痹M輝告訴《中國企業(yè)家》。
所以,投資沒有了下文,但兩家公司一直在業(yè)務(wù)上有交集,DeepSeek數(shù)次更新大模型時,袁進輝團隊都會率先將其部署在硅基流動的服務(wù)器上,包括2024年5月發(fā)布的V2模型以及9月發(fā)布的V2.5,在一段時間內(nèi),硅基流動是唯一部署DeepSeek-V2和V2.5的第三方服務(wù)商。
從2016年開啟第一段創(chuàng)業(yè),再到2023年第二段創(chuàng)業(yè),袁進輝總結(jié)創(chuàng)業(yè)這件事:“現(xiàn)在創(chuàng)業(yè)就像穿越沙漠,身上背一些補給水,中間沒找到綠洲,也許水就喝完了,穿越不過去。但現(xiàn)在,我們找到了一塊綠洲,如果綠洲足夠大,我就住在這兒了,也可能在這兒補給之后,繼續(xù)往前走。”
補給就是拿投資人的錢,綠洲就是DeepSeek爆火帶來的商業(yè)化機會,使硅基流動有現(xiàn)金流與不斷增長的業(yè)務(wù)。
硅基流動最新一輪融資完成于今年6月,由阿里云領(lǐng)投,金額達數(shù)億元人民幣,老股東創(chuàng)新工場等機構(gòu)超額跟投,早前的投資機構(gòu)還有美團(戰(zhàn)略投資)、耀途資本、奇績創(chuàng)壇等。
這是一個連續(xù)創(chuàng)業(yè)者在AI時代的節(jié)奏,在技術(shù)快速迭代下,沒有什么壁壘是永恒的,只能伴隨技術(shù)進化,直至找到沙漠中那片足夠大的綠洲。
大規(guī)模專家并行之戰(zhàn)
2024年12月,DeepSeek發(fā)布V3模型之前,梁文鋒問袁進輝的團隊,要不要先部署,結(jié)果算了一下賬,袁進輝發(fā)現(xiàn),可能沒那么多錢(租服務(wù)器),當(dāng)時大家還開玩笑,趕緊融資,讓投資人打錢。
部署V3模型的難點有兩個。第一,最優(yōu)的部署結(jié)構(gòu)是要用大規(guī)模專家并行,如果不用專家并行,生產(chǎn)效率很低,也很難算過來賬。要復(fù)現(xiàn)大規(guī)模專家并行,需要投入大量研發(fā)工作量。
第二,要做大規(guī)模專家并行部署,需要大幾十張卡或者幾百張卡,一個月租賃費用就要七八萬元,如果要租幾十臺服務(wù)器,對創(chuàng)業(yè)公司而言是一筆不小的成本支出。
等到2025年1月,基于V3模型架構(gòu)的R1模型推出,它引發(fā)的流量風(fēng)暴讓DeepSeek的APP和網(wǎng)頁端直接崩潰,一天只能回答用戶一個問題。第一周,DeepSeek APP的下載數(shù)量為600萬次,到了第二周,數(shù)量已經(jīng)飆升至2000萬次,它的爆火疊加春節(jié)的人員流動,DeepSeek成了街談巷議的話題。
來源:AI生成
彼時恰逢春節(jié),袁進輝不得不動員整個團隊,春節(jié)不停工,周末技術(shù)團隊也加班加點,這種狀況一直持續(xù)到4月。除了DeepSeek官方,沒有哪一家在短時間突破大規(guī)模專家并行技術(shù),大家只能“開著飛機換引擎”,先用堆砌資源的方式接入流量,然后更新推理引擎架構(gòu),逐漸替換舊有的架構(gòu),這個過程大概持續(xù)了兩個月。
接住了流量紅利,這讓硅基流動在2月聲名鵲起,它一夜之間變成了一款C端應(yīng)用。C端小白用戶以嘗鮮為主,但留存不佳,當(dāng)大廠的C端產(chǎn)品后來部署了DeepSeek,他們就會轉(zhuǎn)移至大公司的產(chǎn)品里,比如騰訊元寶,第一季度,月活躍用戶數(shù)從數(shù)百萬飆升至4000萬。
這場流量遷徙大戰(zhàn)打出了硅基流動的“品牌知名度”,在一些AI廠商的API調(diào)用窗口里,除了騰訊云、火山引擎、阿里云之外,“硅基流動”也是一個選項。
回顧這場瞬時爆發(fā)的大戰(zhàn),可以說,袁進輝有一些收獲:第一,跑通了大規(guī)模專家并行,讓其從“可用”變成“好用”;第二,打了大仗,打開了市場,鍛煉了團隊,增加了品牌知名度。
大模型時代的商業(yè)化
MaaS(模型即服務(wù))是大模型時代誕生的商業(yè)模式,對于用戶來說,用多少Token,花多少錢。但一些創(chuàng)業(yè)者對這一模式持相反態(tài)度。
袁進輝告訴《中國企業(yè)家》,MaaS服務(wù)能不能賺到錢,取決于企業(yè)有沒有這個能力,比如在技術(shù)方面,用同樣的算力,發(fā)揮出更好效率。
在4月實現(xiàn)大規(guī)模專家并行之后,它的Token輸出效率是非專家并行的幾十倍,是存在賺錢空間的。
為解決外部公司部署難題,DeepSeek專門舉辦了“開源周”并發(fā)布了相關(guān)論文,DeepSeek提到,“V3/R1推理系統(tǒng)的優(yōu)化目標(biāo)是:更大的吞吐,更低的延遲。為了實現(xiàn)這兩個目標(biāo),我們的方案是使用大規(guī)??绻?jié)點專家并行?!?/p>
袁進輝舉例,假設(shè)我有40臺機器,一個月的租金是三四百萬元,跑滿的話,一個月生產(chǎn)的Token大概能有過千萬的收入。袁進輝說,“關(guān)鍵是跑滿?!边@涉及獲客、機器錯峰運行等運營效率問題。
袁進輝說:“作為供應(yīng)商,是否能做好MaaS,取決于是否能駕馭這一系統(tǒng)工程。對于做Infra的公司,本職工作就是解決用戶痛點或行業(yè)困難。”
所以,當(dāng)一些初創(chuàng)公司放棄部署DeepSeek提供MaaS服務(wù)時,袁進輝抓住了這個機會。
為了吸引用戶,硅基流動早在MaaS平臺推出后不久就上線了“注冊送14元,邀請成功送14元”的運營策略。袁進輝開玩笑說,這次爆火差點讓自己的現(xiàn)金流撐不住。
但袁進輝不后悔,他表示,做任何決策都是有風(fēng)險的,“如果不賭,你只能等下一次機會,至少在這次機會里,沒資格參與了,你只能去做軟件銷售或者一體機這樣的項目。其實沒有人不想做最好的生意,最好的生意就是AI云服務(wù)?!?/p>
袁進輝說:“創(chuàng)業(yè)期間,你應(yīng)該擔(dān)心的,不是問題太挑戰(zhàn)而是沒有挑戰(zhàn),老是碰到一些容易的問題,這是沒意義的?!?/p>
2025年,袁進輝認(rèn)為,整個AI行業(yè)都要考慮的關(guān)鍵問題是商業(yè)化。
他說:“原來大家關(guān)心的全是技術(shù)問題,但現(xiàn)在,整個行業(yè)思考的是要做什么產(chǎn)品,產(chǎn)品怎么完成商業(yè)閉環(huán)?!?/p>
AI時代的創(chuàng)業(yè)——“焦慮”
對于硅基流動來說,2025年的關(guān)鍵詞是高增長。
袁進輝說:“我們怎么提高市場占有率,不管是中小B客戶也好,還是大B也好,不管是公有云也好,私有部署也好,甚至也可以做海外市場,把它轉(zhuǎn)化成綠洲?!?/p>
穿越“沙漠”,除了隨身攜帶的補給,必須不斷尋找綠洲。
袁進輝說,創(chuàng)業(yè)過程可能不是一步到位。字節(jié)跳動也不是第一步就做了抖音,它在中間有幾個躍遷曲線,“抓住現(xiàn)有的商機,標(biāo)準(zhǔn)化產(chǎn)品,盡可能提高市場占有率,變成一個未來對抗風(fēng)險的安全港,你才能在未來抓住更好的機會,做出更好的產(chǎn)品?!?/p>
做AI Infra創(chuàng)業(yè),其本質(zhì)是尋找大公司之間的縫隙,在密集的炮火之間尋找溝壑,但它的產(chǎn)品保鮮期也比純C端產(chǎn)品要長一些,壁壘更厚一些。
硅基流動的一大優(yōu)勢是“中立”,相對于模型廠商,后者推廣大模型云服務(wù),優(yōu)先賣自己的模型。
袁進輝說,現(xiàn)在AI還處在野蠻生長階段,大公司的大炮射程也覆蓋不了所有地方,這時最關(guān)鍵的是不要想那么多,舍命狂奔就好了。
就像模型能力有天花板一樣,AI Infra技術(shù)也有它的天花板,它注定無法持續(xù)領(lǐng)先競爭對手很多,但關(guān)鍵是做好細(xì)節(jié)優(yōu)化、工程聚焦。
“焦慮感是現(xiàn)階段AI公司的特點,各領(lǐng)風(fēng)騷一段時間,你還不能停?!痹M輝總結(jié)。
重開一局,袁進輝想再次挑戰(zhàn)自己?!皬拇碳こ潭葋碚f,不僅要把技術(shù)做好,也要把產(chǎn)品、商業(yè)做好。就像打游戲一樣,一關(guān)一關(guān)地過,如果老是重復(fù)打同一關(guān),你很快就煩了,沒什么興趣了?!?/p>
本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個人觀點,不代表創(chuàng)業(yè)邦立場,轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問,請聯(lián)系editor@cyzone.cn。