編者按:本文來自微信公眾號 來源丨硅星人Pro(ID:Si-Planet),作者丨王兆洋,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
圖源丨midjourney
一心要把DeepSeek變成TikTok
DeepSeek在引發(fā)美國主流科技公司的集體恐慌后,待遇迅速逼近TikTok。
DeepSeek V3和R1連續(xù)發(fā)布后,被美國市場認(rèn)為是找到了比“OpenAI-英偉達(dá)-stargate”這種燒錢模式更高效的新方法,進(jìn)而快速被加上“中美競爭中國突破美國封鎖”的濾鏡,成為所有人的狂歡/狂躁,英偉達(dá)等美股最堅挺的科技股一度“股災(zāi)”式的下跌。
然后在DeepSeek影響下被迫快速調(diào)整o系列模型收費策略,開始把這些王牌模型或免費或全量提供給用戶的OpenAI,也公開做出回應(yīng)。Sam Altman在揶揄“抄襲更容易創(chuàng)新更難”后,終于大度了一些,承認(rèn)DeepSeek已經(jīng)是他們的重要對手,而OpenAI首席研究員Mark Chan則繼續(xù)玩起幼兒園小孩愛玩的“我先說的”游戲,稱DeepSeek是“獨立發(fā)現(xiàn)了o1的技術(shù)方法”。
然后毫無意外的,與此同時,多家媒體報道稱,OpenAI和微軟已經(jīng)開始對DeepSeek展開調(diào)查,認(rèn)為它蒸餾了OpenAI模型的數(shù)據(jù)——一個此前OpenAI已經(jīng)對字節(jié)做過的調(diào)查,并導(dǎo)致了字節(jié)在最近發(fā)布豆包1.5時特意強(qiáng)調(diào)了自己沒有蒸餾任何數(shù)據(jù)。
而美國官方相關(guān)部門也借此快速眼展出了更多討論。不少政策制定者和研究員開始認(rèn)為出口管制“沒起到什么作用”。一些官方機(jī)構(gòu)開始禁止DeepSeek的使用。同時,DeepSeek開始記錄到大量來自美國IP地址的攻擊。OpenAI的“蒸餾”指責(zé)也開始有演變成“知識產(chǎn)權(quán)盜竊”的趨勢,一些調(diào)查和封禁的風(fēng)聲開始頻繁出現(xiàn)。
在這期間,還穿插著諸如Scale.ai等做著大量美國政府生意的公司CEO的表態(tài),Scale的Alexander Wang隨口一句“DeepSeek有5萬臺H100”,成了所有人討論出口管制政策的依據(jù)。
但OpenAI的一系列動作在開發(fā)者社區(qū)引起一邊倒的反感:
“你的論文呢?”“你倒是開源啊?”“你沒有發(fā)布的成果,別人做出來你來恭喜別人?真高貴?!?/p>
HuggingFace的CEO Clem Delangue說的挺委婉——既然R1已經(jīng)讓你們沒有什么競爭的危險了,要不你們開源o1或者寫個詳細(xì)的論文唄。
另外一個評論獲得數(shù)萬閱讀,也代表了開發(fā)者們的態(tài)度:“哥們,交付你們的東西吧別再發(fā)推了,受夠了?!?/p>
同時,最能體現(xiàn)開發(fā)者喜好的幾款產(chǎn)品,“身體很誠實”,Perplexity把R1納入模型產(chǎn)品,微軟的Azure開始提供R1模型,AMD的芯片也快速引入針對R1的部署服務(wù)。
一切迅速TikTok化——對于既得利益的競爭對手公司和美國政府機(jī)構(gòu)來說,證據(jù)不再重要,表態(tài)和通過霸權(quán)實現(xiàn)競爭優(yōu)勢變成唯一的目的。同時真正的開發(fā)者和用戶們像跑到小紅書的“難民”一樣,表達(dá)著對OpenAI們的反感。
Anthropic CEO格局大降的萬字長文
而就在這個關(guān)口,Anthropic的CEO Dario Amodei 發(fā)布了一篇頗有火上澆油效果的萬字文章。
在這篇文章里,他的目的十分明確:一要表達(dá)自己并沒有落后——如果DeepSeek成為了OpenAI的最大敵人,那么Anthropic這個第二就更加沒人在意了,而且,某種程度上,OpenAI給自己找到一個中國對手,似乎天然就能解決它被Anthropic死纏爛打的價值觀和安全的問題,以“美國優(yōu)先”的名義,OpenAI那些安全問題又算什么呢。
在文章里,Dario稱,形容DeepSeek的成功更準(zhǔn)確的描述是:DeepSeek造出了接近美國7到10個月前老模型水平的模型,成本有明顯下降但遠(yuǎn)沒有人們說的那么夸張。
二則是更加明確的重點,他要借DeepSeek帶來的恐慌,來呼吁美國繼續(xù)加強(qiáng)已經(jīng)有的出口管制。
Dario的邏輯是這樣的:DeepSeek只是AI行業(yè)整體進(jìn)步的一個例子,只不過這次第一次是個中國公司做到的;按照他的預(yù)測,到2026-27年,超越人類的AI就會出現(xiàn),而這必須需要數(shù)百萬的芯片;美國一定能實現(xiàn),現(xiàn)在問題是中國能不能實現(xiàn)。
而DeepSeek的成功,是因為在出口管制之前,各種英偉達(dá)芯片被賣到了中國,DeepSeek和美國公司們一樣優(yōu)秀的人才們利用這些禁令前的資源實現(xiàn)了今天的成績,出口管制絕不是逼出DeepSeek成功的原因。反而DeepSeek也依賴芯片。
所以,出口管制是絕對正確的,繼續(xù)實行就會讓中國只剩下人才而沒有必要的芯片,最終美國就能獲勝,從而來到一個單極的世界,而AI會繼續(xù)加強(qiáng)這樣的單極世界里美國的霸權(quán)。這才是他想要的世界。
這不是Dario第一次這樣表態(tài),這幾天在達(dá)沃斯論壇,他在不停接受采訪說著同樣的觀點,這篇萬字長文開頭他也驕傲的提到自己最近鼓吹出口管制的文章,標(biāo)題就叫:《特朗普會讓美國維持AI的領(lǐng)先》。
這篇文章下面,一個評論被點贊多次:
Machines of loving grace; apes of fear and violence.
寡頭化的硅谷公司已經(jīng)習(xí)慣于追求不平等的競爭
這一萬字洋洋灑灑的文字背后,是美國公司們正在快速發(fā)生的寡頭化趨勢。這篇文章出自一個剛剛寫過“Machines of loving grace”的硅谷新貴公司CEO,成了這種寡頭化的最佳注腳。
簡單總結(jié),就是Anthropic這樣的年輕但在此次AI浪潮里快速成為某種既得利益的公司,已經(jīng)習(xí)慣于這樣行事:DeepSeek的成功要靠美國繼續(xù)通過制造和維持資源不平等帶來的AI霸權(quán)來遏制,而不是思考自己的技術(shù)創(chuàng)新和產(chǎn)品市場的競爭策略該如何調(diào)整。
這讓DeepSeek更像過去人們夸贊的那種創(chuàng)新文化的代表,而硅谷哪怕如此年輕的公司卻走到了反面。這看起來讓人意外,但其實早已在發(fā)生。
回到故事的開頭,OpenAI從來也不是硅谷過去代表的那種草根創(chuàng)業(yè)的故事,而是含著金鑰匙,由最有權(quán)勢的幾個人共同制造的利益共同體。它以AGI這樣的偉大目標(biāo)來團(tuán)結(jié)其中各人的不同心思,最終在技術(shù)真正有了突破的時候因利益而分崩離析,非營利組織的外套也直接扔掉了。
對DeepSeek的各路討論中,DeepSeek自己的表述不多但其實信息量足夠,因為它在此刻滿足所有人的不同想象,所以變得面目全非任人打扮,但它也有自己真正的樣子。這是一個想盡一切辦法制造一種最適合AI技術(shù)創(chuàng)新的氛圍的新型組織,它直到今天的競爭策略也是為自己的研究員提供盡可能優(yōu)渥的環(huán)境以利于他們保持好奇心地做研究,推動AI的進(jìn)步。
與此同時,沿襲著OpenAI誕生所代表的“資源整合”型路線,硅谷的公司們正在進(jìn)入另一個階段,1月20日站在國會山的那些巨頭CEO們,多年來首次可以堂而皇之追求寡頭壟斷地位,一切靠技術(shù)靠愿景來獲得經(jīng)濟(jì)優(yōu)勢的路線被這種更粗暴的舊時代的路線替代了,對于GPU的粗暴追逐和基于它的算力霸權(quán)成為了新的創(chuàng)造溢價收益的方法。
兩種模式對比,真正在提供著活力的開發(fā)者和創(chuàng)業(yè)者們自然對DeepSeek好感繼續(xù)增加。
再說回Anthropic的發(fā)聲,就理解為何它更加令人失望了。在我們此前對DeepSeek的技術(shù)分析時曾提到,R1 Zero和R1的設(shè)計,其實把人類對齊這個目前對模型安全十分關(guān)鍵的訓(xùn)練階段,給拆開了,放到了兩個模型里分別完成。它確實帶來了智能的提升,而且不只是榜單,更多是用戶體感到的提升。但它同樣給目前的安全問題帶來了新的挑戰(zhàn)。
如過按照OpenAI和Anthropic的待遇,應(yīng)該出現(xiàn)的是圍繞R1系列模型展開的各種安全研究。這正是技術(shù)社區(qū)此前對OpenAI和Anthropic每一代模型做的事情,其中中國背景的研究團(tuán)隊貢獻(xiàn)尤為突出。這些研究幫助哪怕是閉源的模型更好的改進(jìn)。
DeepSeek的技術(shù)報告比所有人更透明,其實價值也在此,它的訓(xùn)練方法里可能帶來的過于追求智能而放棄掉與人類對齊的部分,究竟該如何對待,這本是一個正常的技術(shù)社區(qū)里最重要的議題。但人們沒看到最強(qiáng)調(diào)模型對人類層面上安全的Anthropic與DeepSeek在這方面的討論交流,等來的是一篇邏輯并不那么嚴(yán)密的萬字檄文。
DeepSeek和Anthropic們各自代表的兩種模式已經(jīng)變成競爭的現(xiàn)實。接下來會如何演進(jìn)?也許再回到這次DeepSeek在技術(shù)創(chuàng)新上真正的成功,可以找到一些啟示:
在DeepSeek的模型里,系統(tǒng)級的優(yōu)化帶來的整體智能和效率的進(jìn)步是一切的根源,對于DeepSeek來說,深入到英偉達(dá)芯片和CUDA最底層部件的創(chuàng)新是追求整體技術(shù)進(jìn)步時理所當(dāng)然的一部分。但對于硅谷的大公司,當(dāng)他們不再追求一種開放的競爭,而是習(xí)慣性尋求不對等的資源優(yōu)勢,那么算力在其中就不再是優(yōu)化的一個關(guān)鍵環(huán)節(jié),而是變成了可以堆砌的人為造就的不對等競爭壁壘,一切都變得簡單,只需要把對手變成下一個TikTok就可以結(jié)束競爭。
正是這樣的對技術(shù)創(chuàng)新的態(tài)度的差異讓R1和V3這樣的高效率模型誕生在DeepSeek,而這些對待技術(shù)的態(tài)度不同,最終是會決定更大的競爭格局的。
本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個人觀點,不代表創(chuàng)業(yè)邦立場,轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問,請聯(lián)系editor@cyzone.cn。