編者按:本文來自微信公眾號(hào) 混沌大學(xué)(ID:hundun-university),作者:混沌學(xué)園,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載
就在剛剛,DeepSeek宣布,從下周開始,他們將開源 5 個(gè)代碼庫(kù),以完全透明的方式與全球開發(fā)者社區(qū)分享他們的研究進(jìn)展,并將這一計(jì)劃定義為“開源周”。
DeepSeek正以開放的姿態(tài)參與重構(gòu)全球AI生態(tài)格局。置身于AI時(shí)代的我們,不得不思考,如何讓DeepSeek參與到我們的事業(yè)之中。
“早在這次DeepSeek破圈之前,AI整體的能力就已超過99%的人類?!?/p>
“我越研究AI越感覺痛苦,就像舉著錘子找釘子,每天都在思索要做點(diǎn)什么。
在長(zhǎng)時(shí)間的迷茫之后,我才驚覺,最大的機(jī)會(huì)往往都在自己的認(rèn)知、自己的專業(yè)領(lǐng)域里。”
“如果你開發(fā)的功能只能幫企業(yè)替換掉10個(gè)員工,最好不要做”。
前天,Monica.im產(chǎn)品合伙人張濤老師坐客混沌,以技術(shù)演進(jìn)為脈絡(luò),揭示了DeepSeek如何通過「格式激勵(lì)和結(jié)果激勵(lì)」實(shí)現(xiàn)思維鏈自主進(jìn)化,并在博士級(jí)難題上做到了跨越式突破,其底層邏輯恰似“AI覺醒思考本能”。
張濤老師曾任神策數(shù)據(jù)副總裁、飛書海外產(chǎn)品負(fù)責(zé)人、光年之外產(chǎn)品負(fù)責(zé)人,是一個(gè)熱愛技術(shù)的產(chǎn)品人。春節(jié)之后第一周,他以萬(wàn)字深度拆解DeepSeek R1是怎樣煉成的,在創(chuàng)投圈引起廣泛討論。
在這場(chǎng)技術(shù)革命中,創(chuàng)業(yè)者如何抓住時(shí)代紅利?張濤的演講不僅是對(duì)DeepSeek的深度解碼,更是創(chuàng)業(yè)者的行動(dòng)指南。他提醒我們,在這場(chǎng)AI浪潮中,唯有抓住行業(yè)痛點(diǎn),將AI轉(zhuǎn)化為解決問題的工具,才是定義未來的關(guān)鍵所在。
?DeepSeek驚艷全球在于“非共識(shí)”的模型訓(xùn)練方法
OpenAI發(fā)布了o系列的模型,它在博士級(jí)別的難題上的表現(xiàn)遠(yuǎn)超之前幾款,基本上可以達(dá)到83分。從以前的13分到現(xiàn)在的83分,這是一個(gè)十分夸張的進(jìn)步,推動(dòng)它進(jìn)步的原因正是我剛剛提到的思維鏈。
既然思維鏈這么厲害,那么全世界的AI公司應(yīng)該都會(huì)竭盡全力實(shí)現(xiàn)。但是該如何實(shí)現(xiàn)?OpenAI從2023年年終開始,基本不再對(duì)外發(fā)布任何的技術(shù)報(bào)告,在他們發(fā)布的最后一篇報(bào)告里,有一個(gè)很關(guān)鍵的內(nèi)容,叫過程激勵(lì)模型(process reward model)。
在提出過程激勵(lì)模型的同時(shí),OpenAI還放出了過程激勵(lì)的數(shù)據(jù)集。自這次報(bào)告之后,全球很多廠商都在研究如何通過過程激勵(lì)復(fù)現(xiàn)o1,但做起來才發(fā)現(xiàn)極其困難。但是與此同時(shí),有兩家廠商卻找到了不一樣的路徑,它們都是我們中國(guó)的廠商,一個(gè)是Kimi,一個(gè)是DeepSeek。
其實(shí)這條路徑并不復(fù)雜,它基于兩個(gè)最簡(jiǎn)單的規(guī)則:準(zhǔn)確度激勵(lì)和格式激勵(lì)。通俗來說,準(zhǔn)確度激勵(lì)意味著它做對(duì)了就獎(jiǎng)勵(lì),做錯(cuò)了就不獎(jiǎng)勵(lì);格式激勵(lì)意味著它在得出最終答案前,還需要進(jìn)行思考。它們都指向了一個(gè)最基本的激勵(lì)原則——要求做對(duì),并且有好的思考。在給定這兩個(gè)激勵(lì)的預(yù)設(shè)下,訓(xùn)練模型的過程中就發(fā)生了一個(gè)非常神奇的現(xiàn)象:隨著學(xué)習(xí)過程的強(qiáng)化,模型產(chǎn)生的思維過程越來越長(zhǎng)。這說明由于這兩種激勵(lì)的約束,模型自動(dòng)意識(shí)到了要把題做對(duì)的前提是思考的過程要更嚴(yán)謹(jǐn)。
不得不說,這是一個(gè)令人震撼的現(xiàn)象。
DeepSeek的出現(xiàn)帶給全世界非常大的震撼,因?yàn)橹按竽P突旧媳籓penAI一家統(tǒng)治,而它很大程度上松動(dòng)了OpenAI一家獨(dú)大的局面。并且DeepSeek采取了一個(gè)開源的姿態(tài),面向全世界,這一舉措基本上改變了整個(gè)AI行業(yè)的底層生態(tài),撬動(dòng)了整個(gè)行業(yè)的板塊。
?AI 創(chuàng)業(yè)最好不要先從“降本”切入
我相信從ChatGPT到DeepSeek,AI已經(jīng)一次又一次地讓我們?yōu)樗痤潯1热缢膱D像理解能力,能夠做到立即做出準(zhǔn)確的判斷。再比如圖像生成能力,也能做到生成惟妙惟肖的人像模型,讓我們分不清虛實(shí)。甚至現(xiàn)在很多人已經(jīng)用AI的視頻生成能力創(chuàng)作視頻內(nèi)容,講述一個(gè)完整的、有趣的故事。
可以說,三年前的我們都難以想象當(dāng)前的世界會(huì)發(fā)生這樣的巨變。那么,它帶給我們哪些新的可能性?
最直觀的影響是降本。比如以前某個(gè)崗位需要十個(gè)員工接電話,現(xiàn)在只需要一個(gè)AI就能搞定。但這里有一個(gè)關(guān)鍵要點(diǎn),降本從來不是企業(yè)思考的核心,沒有企業(yè)是通過降本實(shí)現(xiàn)業(yè)務(wù)增長(zhǎng)的。因?yàn)楫?dāng)企業(yè)在賺錢的時(shí)候,其實(shí)不會(huì)關(guān)心降本,而一旦它開始關(guān)注降本,大概率就意味著進(jìn)入了下行周期。
因此每當(dāng)有創(chuàng)業(yè)者來問我AI創(chuàng)業(yè)應(yīng)該做些什么,我給他們的建議都是“如果你開發(fā)的功能只能幫企業(yè)替換掉10個(gè)員工,最好不要做”。因?yàn)橹袊?guó)的勞動(dòng)力成本本來就不高,替換掉10個(gè)員工對(duì)企業(yè)來說算不上剛需。我們真正需要尋找的是以前10個(gè)員工在做的崗位,如果并不是因?yàn)楣局幌胱?0個(gè)員工做,那么這背后受限于什么要素?比如招不到人,比如管理難度大。如果這個(gè)崗位有500人在做就能夠帶來業(yè)務(wù)線性增長(zhǎng),就很適合成為AI創(chuàng)業(yè)的領(lǐng)域。
所以除了降本增效之外,我認(rèn)為對(duì)于創(chuàng)業(yè)者來說,AI最重要的價(jià)值是他創(chuàng)造了一種全新的商業(yè)模式的可能性,讓以前一些因?yàn)閱挝徊唤?jīng)濟(jì)因此無(wú)法實(shí)現(xiàn)的創(chuàng)業(yè)設(shè)想變得可行。這正是這個(gè)新時(shí)代里賦予我們的機(jī)會(huì),而不是用AI換掉幾個(gè)員工、省掉一點(diǎn)開支,這都是小錢,找到新的商業(yè)機(jī)會(huì)才能賺到真正的大錢。
聽到這里,可能會(huì)有人想,AI領(lǐng)域這么大有可為,不做AI的話是不是無(wú)路可走?其實(shí)完全不是這樣的。我做AI相關(guān)行業(yè)已經(jīng)兩年了,這一期間我越研究AI越感覺痛苦,就像舉著錘子找釘子,每天都在思索要做點(diǎn)什么。在長(zhǎng)時(shí)間的迷茫之后,我才驚覺,最大的機(jī)會(huì)往往都在自己的認(rèn)知、自己的專業(yè)領(lǐng)域里。
給大家舉個(gè)例子。前年在我研究圖像技術(shù)時(shí),我發(fā)現(xiàn)有種技術(shù)可以做到1秒鐘生成幾十張圖,對(duì)于我來說這個(gè)技術(shù)并沒有太多用處。所以即使我有這樣的技術(shù),但我卻并不知道怎么用。后來回重慶的時(shí)候我把這項(xiàng)技術(shù)演示給當(dāng)?shù)匾粋€(gè)做建筑師的朋友,他十分震驚,立即投入使用。以前他們做一張渲染圖是以小時(shí)為單位計(jì)算時(shí)間成本,現(xiàn)在只需要幾秒種,并且是實(shí)時(shí)的。據(jù)他反饋,雖然最后的渲染圖無(wú)法用于施工,但現(xiàn)在與甲方溝通的時(shí)候可以從各個(gè)角度給出方案,如果有需要修改的部分,可以立即修改??梢哉f,通過使用AI,極大地提升了他們工作和溝通的效率。
因此我在這里建議大家多結(jié)合自身的行業(yè)去思考,因?yàn)槊恳淮谓鉀Q問題的過程,可能會(huì)開拓出AI創(chuàng)業(yè)的新思路。
?全球AI滲透率遠(yuǎn)低于人們的想象
由于我們處在行業(yè)里,因此會(huì)誤以為AI已經(jīng)遍布全世界,但其實(shí)去年這個(gè)時(shí)候,OpenAI的全球用戶總數(shù)還不到世界人口的3%。這一現(xiàn)象意味著全世界絕大多數(shù)人都沒有使用過AI,因此每年都有相當(dāng)多的人第一次嘗試AI,而當(dāng)他們?cè)诔跗谑褂脮r(shí),可能會(huì)困惑要從何入手,是語(yǔ)音生成?文字聊天?還是視頻制作?
我們認(rèn)為,大模型的能力是一臺(tái)發(fā)動(dòng)機(jī),但對(duì)于用戶來說最重要的是車,因此我們將自身定位為造車的車場(chǎng)。
未來是什么樣子的?我認(rèn)為純聊天機(jī)器人是AI發(fā)展過程中的一個(gè)過渡階段。因?yàn)閷?duì)于全世界大多數(shù)人來說,提問的能力有限,也缺乏提問的動(dòng)機(jī)。這使得AI的核心表現(xiàn)對(duì)多數(shù)人來說沒有價(jià)值,如果要走向更廣大的市場(chǎng),AI的發(fā)展必須貼合用戶需求的最大公約數(shù)。
我們目前做的事情其實(shí)就是努力跟隨這個(gè)方向。
本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn),不代表創(chuàng)業(yè)邦立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問,請(qǐng)聯(lián)系editor@cyzone.cn。