DeepSeek開(kāi)啟“開(kāi)源周”，與我們有什么關(guān)系？

混沌學(xué)園·2025-02-27

編者按：本文來(lái)自微信公眾號(hào) 混沌大學(xué)（ID：hundun-university），作者：混沌學(xué)園，創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載

就在剛剛，DeepSeek宣布，從下周開(kāi)始，他們將開(kāi)源 5 個(gè)代碼庫(kù)，以完全透明的方式與全球開(kāi)發(fā)者社區(qū)分享他們的研究進(jìn)展，并將這一計(jì)劃定義為“開(kāi)源周”。

DeepSeek正以開(kāi)放的姿態(tài)參與重構(gòu)全球AI生態(tài)格局。置身于AI時(shí)代的我們，不得不思考，如何讓DeepSeek參與到我們的事業(yè)之中。

“早在這次DeepSeek破圈之前，AI整體的能力就已超過(guò)99%的人類(lèi)?！?/p>

“我越研究AI越感覺(jué)痛苦，就像舉著錘子找釘子，每天都在思索要做點(diǎn)什么。

在長(zhǎng)時(shí)間的迷茫之后，我才驚覺(jué)，最大的機(jī)會(huì)往往都在自己的認(rèn)知、自己的專(zhuān)業(yè)領(lǐng)域里?！?/p>

“如果你開(kāi)發(fā)的功能只能幫企業(yè)替換掉10個(gè)員工，最好不要做”。

前天，Monica.im產(chǎn)品合伙人張濤老師坐客混沌，以技術(shù)演進(jìn)為脈絡(luò)，揭示了DeepSeek如何通過(guò)「格式激勵(lì)和結(jié)果激勵(lì)」實(shí)現(xiàn)思維鏈自主進(jìn)化，并在博士級(jí)難題上做到了跨越式突破，其底層邏輯恰似“AI覺(jué)醒思考本能”。

張濤老師曾任神策數(shù)據(jù)副總裁、飛書(shū)海外產(chǎn)品負(fù)責(zé)人、光年之外產(chǎn)品負(fù)責(zé)人，是一個(gè)熱愛(ài)技術(shù)的產(chǎn)品人。春節(jié)之后第一周，他以萬(wàn)字深度拆解DeepSeek R1是怎樣煉成的，在創(chuàng)投圈引起廣泛討論。

在這場(chǎng)技術(shù)革命中，創(chuàng)業(yè)者如何抓住時(shí)代紅利？張濤的演講不僅是對(duì)DeepSeek的深度解碼，更是創(chuàng)業(yè)者的行動(dòng)指南。他提醒我們，在這場(chǎng)AI浪潮中，唯有抓住行業(yè)痛點(diǎn)，將AI轉(zhuǎn)化為解決問(wèn)題的工具，才是定義未來(lái)的關(guān)鍵所在。

?DeepSeek驚艷全球在于“非共識(shí)”的模型訓(xùn)練方法

OpenAI發(fā)布了o系列的模型，它在博士級(jí)別的難題上的表現(xiàn)遠(yuǎn)超之前幾款，基本上可以達(dá)到83分。從以前的13分到現(xiàn)在的83分，這是一個(gè)十分夸張的進(jìn)步，推動(dòng)它進(jìn)步的原因正是我剛剛提到的思維鏈。

既然思維鏈這么厲害，那么全世界的AI公司應(yīng)該都會(huì)竭盡全力實(shí)現(xiàn)。但是該如何實(shí)現(xiàn)？OpenAI從2023年年終開(kāi)始，基本不再對(duì)外發(fā)布任何的技術(shù)報(bào)告，在他們發(fā)布的最后一篇報(bào)告里，有一個(gè)很關(guān)鍵的內(nèi)容，叫過(guò)程激勵(lì)模型（process reward model）。

在提出過(guò)程激勵(lì)模型的同時(shí)，OpenAI還放出了過(guò)程激勵(lì)的數(shù)據(jù)集。自這次報(bào)告之后，全球很多廠商都在研究如何通過(guò)過(guò)程激勵(lì)復(fù)現(xiàn)o1，但做起來(lái)才發(fā)現(xiàn)極其困難。但是與此同時(shí)，有兩家廠商卻找到了不一樣的路徑，它們都是我們中國(guó)的廠商，一個(gè)是Kimi，一個(gè)是DeepSeek。

其實(shí)這條路徑并不復(fù)雜，它基于兩個(gè)最簡(jiǎn)單的規(guī)則：準(zhǔn)確度激勵(lì)和格式激勵(lì)。通俗來(lái)說(shuō)，準(zhǔn)確度激勵(lì)意味著它做對(duì)了就獎(jiǎng)勵(lì)，做錯(cuò)了就不獎(jiǎng)勵(lì)；格式激勵(lì)意味著它在得出最終答案前，還需要進(jìn)行思考。它們都指向了一個(gè)最基本的激勵(lì)原則——要求做對(duì)，并且有好的思考。在給定這兩個(gè)激勵(lì)的預(yù)設(shè)下，訓(xùn)練模型的過(guò)程中就發(fā)生了一個(gè)非常神奇的現(xiàn)象：隨著學(xué)習(xí)過(guò)程的強(qiáng)化，模型產(chǎn)生的思維過(guò)程越來(lái)越長(zhǎng)。這說(shuō)明由于這兩種激勵(lì)的約束，模型自動(dòng)意識(shí)到了要把題做對(duì)的前提是思考的過(guò)程要更嚴(yán)謹(jǐn)。

不得不說(shuō)，這是一個(gè)令人震撼的現(xiàn)象。

DeepSeek的出現(xiàn)帶給全世界非常大的震撼，因?yàn)橹按竽Ｐ突旧媳籓penAI一家統(tǒng)治，而它很大程度上松動(dòng)了OpenAI一家獨(dú)大的局面。并且DeepSeek采取了一個(gè)開(kāi)源的姿態(tài)，面向全世界，這一舉措基本上改變了整個(gè)AI行業(yè)的底層生態(tài)，撬動(dòng)了整個(gè)行業(yè)的板塊。

?AI 創(chuàng)業(yè)最好不要先從“降本”切入

我相信從ChatGPT到DeepSeek，AI已經(jīng)一次又一次地讓我們?yōu)樗痤?。比如它的圖像理解能力，能夠做到立即做出準(zhǔn)確的判斷。再比如圖像生成能力，也能做到生成惟妙惟肖的人像模型，讓我們分不清虛實(shí)。甚至現(xiàn)在很多人已經(jīng)用AI的視頻生成能力創(chuàng)作視頻內(nèi)容，講述一個(gè)完整的、有趣的故事。

可以說(shuō)，三年前的我們都難以想象當(dāng)前的世界會(huì)發(fā)生這樣的巨變。那么，它帶給我們哪些新的可能性？

最直觀的影響是降本。比如以前某個(gè)崗位需要十個(gè)員工接電話，現(xiàn)在只需要一個(gè)AI就能搞定。但這里有一個(gè)關(guān)鍵要點(diǎn)，降本從來(lái)不是企業(yè)思考的核心，沒(méi)有企業(yè)是通過(guò)降本實(shí)現(xiàn)業(yè)務(wù)增長(zhǎng)的。因?yàn)楫?dāng)企業(yè)在賺錢(qián)的時(shí)候，其實(shí)不會(huì)關(guān)心降本，而一旦它開(kāi)始關(guān)注降本，大概率就意味著進(jìn)入了下行周期。

因此每當(dāng)有創(chuàng)業(yè)者來(lái)問(wèn)我AI創(chuàng)業(yè)應(yīng)該做些什么，我給他們的建議都是“如果你開(kāi)發(fā)的功能只能幫企業(yè)替換掉10個(gè)員工，最好不要做”。因?yàn)橹袊?guó)的勞動(dòng)力成本本來(lái)就不高，替換掉10個(gè)員工對(duì)企業(yè)來(lái)說(shuō)算不上剛需。我們真正需要尋找的是以前10個(gè)員工在做的崗位，如果并不是因?yàn)楣局幌胱?0個(gè)員工做，那么這背后受限于什么要素？比如招不到人，比如管理難度大。如果這個(gè)崗位有500人在做就能夠帶來(lái)業(yè)務(wù)線性增長(zhǎng)，就很適合成為AI創(chuàng)業(yè)的領(lǐng)域。

所以除了降本增效之外，我認(rèn)為對(duì)于創(chuàng)業(yè)者來(lái)說(shuō)，AI最重要的價(jià)值是他創(chuàng)造了一種全新的商業(yè)模式的可能性，讓以前一些因?yàn)閱挝徊唤?jīng)濟(jì)因此無(wú)法實(shí)現(xiàn)的創(chuàng)業(yè)設(shè)想變得可行。這正是這個(gè)新時(shí)代里賦予我們的機(jī)會(huì)，而不是用AI換掉幾個(gè)員工、省掉一點(diǎn)開(kāi)支，這都是小錢(qián)，找到新的商業(yè)機(jī)會(huì)才能賺到真正的大錢(qián)。

聽(tīng)到這里，可能會(huì)有人想，AI領(lǐng)域這么大有可為，不做AI的話是不是無(wú)路可走？其實(shí)完全不是這樣的。我做AI相關(guān)行業(yè)已經(jīng)兩年了，這一期間我越研究AI越感覺(jué)痛苦，就像舉著錘子找釘子，每天都在思索要做點(diǎn)什么。在長(zhǎng)時(shí)間的迷茫之后，我才驚覺(jué)，最大的機(jī)會(huì)往往都在自己的認(rèn)知、自己的專(zhuān)業(yè)領(lǐng)域里。

給大家舉個(gè)例子。前年在我研究圖像技術(shù)時(shí)，我發(fā)現(xiàn)有種技術(shù)可以做到1秒鐘生成幾十張圖，對(duì)于我來(lái)說(shuō)這個(gè)技術(shù)并沒(méi)有太多用處。所以即使我有這樣的技術(shù)，但我卻并不知道怎么用。后來(lái)回重慶的時(shí)候我把這項(xiàng)技術(shù)演示給當(dāng)?shù)匾粋€(gè)做建筑師的朋友，他十分震驚，立即投入使用。以前他們做一張渲染圖是以小時(shí)為單位計(jì)算時(shí)間成本，現(xiàn)在只需要幾秒種，并且是實(shí)時(shí)的。據(jù)他反饋，雖然最后的渲染圖無(wú)法用于施工，但現(xiàn)在與甲方溝通的時(shí)候可以從各個(gè)角度給出方案，如果有需要修改的部分，可以立即修改?？梢哉f(shuō)，通過(guò)使用AI，極大地提升了他們工作和溝通的效率。

因此我在這里建議大家多結(jié)合自身的行業(yè)去思考，因?yàn)槊恳淮谓鉀Q問(wèn)題的過(guò)程，可能會(huì)開(kāi)拓出AI創(chuàng)業(yè)的新思路。

?全球AI滲透率遠(yuǎn)低于人們的想象

由于我們處在行業(yè)里，因此會(huì)誤以為AI已經(jīng)遍布全世界，但其實(shí)去年這個(gè)時(shí)候，OpenAI的全球用戶總數(shù)還不到世界人口的3%。這一現(xiàn)象意味著全世界絕大多數(shù)人都沒(méi)有使用過(guò)AI，因此每年都有相當(dāng)多的人第一次嘗試AI，而當(dāng)他們?cè)诔跗谑褂脮r(shí)，可能會(huì)困惑要從何入手，是語(yǔ)音生成？文字聊天？還是視頻制作？

我們認(rèn)為，大模型的能力是一臺(tái)發(fā)動(dòng)機(jī)，但對(duì)于用戶來(lái)說(shuō)最重要的是車(chē)，因此我們將自身定位為造車(chē)的車(chē)場(chǎng)。

未來(lái)是什么樣子的？我認(rèn)為純聊天機(jī)器人是AI發(fā)展過(guò)程中的一個(gè)過(guò)渡階段。因?yàn)閷?duì)于全世界大多數(shù)人來(lái)說(shuō)，提問(wèn)的能力有限，也缺乏提問(wèn)的動(dòng)機(jī)。這使得AI的核心表現(xiàn)對(duì)多數(shù)人來(lái)說(shuō)沒(méi)有價(jià)值，如果要走向更廣大的市場(chǎng)，AI的發(fā)展必須貼合用戶需求的最大公約數(shù)。

我們目前做的事情其實(shí)就是努力跟隨這個(gè)方向。

本文為專(zhuān)欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表，版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn)，不代表創(chuàng)業(yè)邦立場(chǎng)，轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問(wèn)，請(qǐng)聯(lián)系editor@cyzone.cn。