近期,DeepSeek的崛起引發(fā)了硅谷風(fēng)險(xiǎn)投資人和創(chuàng)業(yè)者的廣泛討論。作為人工智能領(lǐng)域的一股新興力量,DeepSeek的快速發(fā)展讓人們開始重新思考AI創(chuàng)新的未來、開源模式的統(tǒng)治力,以及傳統(tǒng)AI商業(yè)模式的可持續(xù)性。
這場討論的核心在于:DeepSeek究竟代表了一種范式轉(zhuǎn)變,還是僅僅是一次短暫的沖擊?現(xiàn)有的AI公司又該如何應(yīng)對這一變化?
01.DeepSeek的創(chuàng)新與優(yōu)勢
DeepSeek在AI開發(fā)者社區(qū)中迅速嶄露頭角,登頂Hugging Face排行榜,并成為開源領(lǐng)域的主導(dǎo)力量。
其以速度、成本效益和可訪問性為核心的設(shè)計(jì)理念,贏得了全球AI研究界的廣泛好評。與競爭對手不同,DeepSeek以極低的成本運(yùn)行,提供頂尖的AI能力,而無需依賴龐大的基礎(chǔ)設(shè)施。
盡管有媒體猜測AI領(lǐng)域的權(quán)力格局正在發(fā)生變化,但實(shí)際情況更為復(fù)雜:DeepSeek的創(chuàng)新正在促使現(xiàn)有玩家重新思考他們的戰(zhàn)略,推動(dòng)行業(yè)向更精簡、更高效的AI模型轉(zhuǎn)型。
DeepSeek的成功源于其對效率和技術(shù)創(chuàng)造力的關(guān)注。該公司憑借DeepSeek Coder和DeepSeek-V3模型在代碼生成和自然語言處理領(lǐng)域表現(xiàn)出色。
DeepSeek采用了強(qiáng)化學(xué)習(xí),而無需人工干預(yù),將自己與依靠人類反饋(RLHF)學(xué)習(xí)的AI公司區(qū)分開來。
其R1-Zero模型完全通過自動(dòng)化獎(jiǎng)勵(lì)系統(tǒng)進(jìn)行學(xué)習(xí),能夠在數(shù)學(xué)、編程和邏輯任務(wù)中自我評分。這一過程催生了自發(fā)的“思維鏈推理”能力,使模型能夠延長推理時(shí)間、重新評估假設(shè)并動(dòng)態(tài)調(diào)整策略。
盡管最初的輸出混合了多種語言,但DeepSeek通過在RL過程中引入少量高質(zhì)量的人工標(biāo)注數(shù)據(jù),成功開發(fā)出了DeepSeek R1模型。
此外,DeepSeek還采用了“專家混合”(MoE)設(shè)計(jì)。MoE技術(shù)允許模型動(dòng)態(tài)選擇專門的子網(wǎng)絡(luò)(即“專家”)來處理輸入的不同部分,從而顯著提高效率。
與傳統(tǒng)的整體模型不同,MoE只需激活一部分專家網(wǎng)絡(luò),從而降低計(jì)算成本,同時(shí)保持高性能。這種方法使DeepSeek能夠高效擴(kuò)展,在低功耗和低延遲的情況下提供更好的準(zhǔn)確性。
DeepSeek專注于RL,MOE和訓(xùn)練后優(yōu)化,展示了AI計(jì)算基礎(chǔ)架構(gòu)的未來,具有優(yōu)化的內(nèi)存、網(wǎng)絡(luò)和計(jì)算,更精細(xì)、更快、更智能。
02.挑戰(zhàn)傳統(tǒng)專有模型
Foundation Capital的普通合伙人Ashu Garg預(yù)測,規(guī)模已不再是AI領(lǐng)域的唯一制勝法寶。他指出,DeepSeek將AI視為一個(gè)系統(tǒng)挑戰(zhàn),從模型架構(gòu)到硬件利用率都進(jìn)行了全面優(yōu)化。
他還強(qiáng)調(diào),下一波AI創(chuàng)新將由那些利用大模型設(shè)計(jì)復(fù)雜“代理系統(tǒng)”的初創(chuàng)公司引領(lǐng),這些系統(tǒng)能夠處理復(fù)雜任務(wù),而不僅僅是自動(dòng)化簡單操作。
在沒有Nvidia頂級H100 GPU的情況下,DeepSeek通過重新編程H800 GPU上的20個(gè)處理單元來增強(qiáng)芯片間通信,并利用FP8量化技術(shù)減少內(nèi)存開銷。此外,他們還引入了多令牌預(yù)測技術(shù),使模型能夠一次性生成多個(gè)單詞,而非逐詞生成。
不僅如此,DeepSeek在開源AI領(lǐng)域的成功對傳統(tǒng)的專有模型模式提出了挑戰(zhàn)。其框架的廣泛采用表明,AI開發(fā)正朝著更加社區(qū)驅(qū)動(dòng)的方向轉(zhuǎn)變。
DeepSeek還打破了“大規(guī)模AI突破需要巨額基礎(chǔ)設(shè)施投資”的固有觀念。通過證明頂尖模型可以高效訓(xùn)練,它迫使行業(yè)領(lǐng)導(dǎo)者重新思考是否真的需要數(shù)十億美元的GPU集群。
隨著AI模型變得更加高效,整體使用量也在增加。
DeepSeek的成本效益降低了進(jìn)入門檻,催生了一批采用精簡AI架構(gòu)的新興初創(chuàng)公司。這一趨勢表明,AI生態(tài)系統(tǒng)正在發(fā)生更廣泛的轉(zhuǎn)變,效率正成為核心差異化因素,而不僅僅是原始計(jì)算能力。
其實(shí)DeepSeek并沒有開創(chuàng)全新的領(lǐng)域,而是對現(xiàn)有的AI技術(shù)進(jìn)行了優(yōu)化和改進(jìn),展示了迭代的力量。
這引發(fā)了一個(gè)問題:在AI開發(fā)中,先發(fā)優(yōu)勢是否真的可持續(xù)?或許,持續(xù)改進(jìn)才是真正的領(lǐng)導(dǎo)力所在。
憑借在速度、推理能力和成本效益方面的進(jìn)步,DeepSeek正在為AI驅(qū)動(dòng)應(yīng)用的新時(shí)代鋪平道路。
行業(yè)即將迎來一波能夠處理復(fù)雜工作流的AI代理浪潮,這些代理將通過提高效率、降低成本并實(shí)現(xiàn)以往無法實(shí)現(xiàn)的新用例,徹底改變各行各業(yè)。
總的來說,DeepSeek的崛起標(biāo)志著AI解決方案正朝著更易獲取、更具成本效益的方向發(fā)展。
隨著行業(yè)的適應(yīng),企業(yè)必須在專有創(chuàng)新與開放合作之間找到平衡,確保下一波AI發(fā)展保持高效、適應(yīng)性強(qiáng)且可擴(kuò)展。隨著AI技術(shù)的不斷進(jìn)步,領(lǐng)先AI公司與新興玩家之間的互動(dòng)將定義技術(shù)進(jìn)步的下一階段。
原文來源于:
1.https://www.forbes.com/sites/drektadang/2025/02/19/how-deepseek-is-influencing-silicon-valleys-ai-landscape/
中文內(nèi)容由元宇宙之心(MetaverseHub)團(tuán)隊(duì)編譯,如需轉(zhuǎn)載請聯(lián)系我們。