編者按:本文來自微信公眾號 秦朔朋友圈,作者:秦朔,創(chuàng)業(yè)邦經授權轉載。
DeepSeek時刻
2025年1月27日,一家杭州的人工智能大模型公司DeepSeek(深度求索),憑借發(fā)布僅一周的開源推理大模型DeepSeek-R1,在蘋果AppStore中國區(qū)和美國區(qū)的免費榜上雙雙贏得第一,OpenAI的ChatGPT、Google的Gemini等產品都在其后。
這是DeepSeek繼2024年12月26日發(fā)布DeepSeek V3后,再次驚艷AI世界。
這兩個產品證明,在AI這一美國資本最看重的戰(zhàn)略競爭領域,中國正在走出自己的路。美國有ChatGPT時刻,中國也在很短時間有了“DeepSeek時刻”。
和ChatGPT的“三高”特征——高端芯片集群、高額訓練投入、高額算力供給相比,DeepSeek的最大特征是訓練成本大大降低,而性能依然優(yōu)異。這和中國制造走向世界的“必殺技”——超高性價比,如出一轍。
特別值得關注的是,DeepSeek的發(fā)展,不是短平快地復制Meta的開源模型Llama,而是在架構設計、算法優(yōu)化上做了很多創(chuàng)新,從而極大提升了推理的效率,減少了對資源的消耗。
例如,它提出了全新的MLA機制(多頭潛在注意力),與傳統(tǒng)的MHA機制(多頭注意力)相比,把顯存占用降到只是原來的5%~13%。具體來說,MLA機制通過引入潛在化的概念,在處理輸入信息時先做一定的預處理,對信息進行選擇性壓縮和簡化,從而在生成查詢(Query)、鍵(Key)和值(Value)時顯著減少了參數數量,降低了計算復雜度。
DeepSeek所代表的創(chuàng)新,已經成為全球AI界的現(xiàn)象級事件。
位于舊金山的AI創(chuàng)新企業(yè)Perplexity CEO斯里尼瓦斯說:“他們(DeepSeek)以更高效、更低成本的方式開發(fā)了類似(Anthropic和OpenAI)的技術。這確實讓人感到壓力?!?/p>
前谷歌CEO埃里克·施密特和MakerMaker.AI公司CEO達瓦爾·阿喬達撰文指出:“DeepSeek能夠以遠少于美國科技巨頭的資源與其競爭,這給美國大廠帶來了巨大壓力。美國針對中國的出口管制政策旨在切斷其獲得最先進計算芯片的渠道,以遏制中國在AI領域的發(fā)展。然而,事實可能恰恰相反——芯片短缺反而迫使中國企業(yè)提高計算效率,并探索降低訓練成本的新方法?!?/p>
DeepSeek是怎樣一群人做出來的?
DeepSeek脫穎而出后,美國Anthropic聯(lián)合創(chuàng)始人杰克·克拉克說,DeepSeek雇用了“一批高深莫測的奇才”。
2024年在接受36氪采訪時,DeepSeek創(chuàng)始人梁文鋒就此回應說:“并沒有什么高深莫測的奇才,都是一些Top高校的應屆畢業(yè)生、沒畢業(yè)的博四、博五實習生,還有一些畢業(yè)才幾年的年輕人,沒有海外回來的人,都是本土的。”
MLA機制的創(chuàng)新,最早來自一個年輕研究員的idea,“在總結出注意力架構的一些主流變遷規(guī)律后,他突發(fā)奇想去設計了一個替代方案,之后從想法到落地,一個團隊花了幾個月時間跑通了。”
好一個“突發(fā)奇想”!今天中國最缺的可能就是不亦步亦趨的突發(fā)奇想,并為突發(fā)奇想者創(chuàng)造充分發(fā)揮其潛能的環(huán)境。
梁文鋒說,在Open AI發(fā)布的時候,中國普遍對前沿的科技創(chuàng)新缺乏信心,從投資人到大科技,都覺得差距太大了,應該像以往一樣,等著摩爾定律從天上掉下來,在家里躺18個月等更好的硬件和軟件出現(xiàn)。
而DeepSeek的價值態(tài)度和選擇是——
“隨著經濟的發(fā)展,中國應該成為貢獻者,而不是搭便車的人,去參與真正的技術創(chuàng)新。”
“過去三十年,我們都只強調賺錢,對創(chuàng)新是忽視的。創(chuàng)新不完全是商業(yè)驅動的,還需要好奇心和創(chuàng)造欲。我們只是被過去那種慣性束縛了,但它也是階段性的。”
“以后硬核創(chuàng)新會越來越多?,F(xiàn)在可能還不容易被理解,是因為整個社會群體需要被事實教育。當這個社會讓硬核創(chuàng)新的人功成名就,群體性想法就會改變。”
DeepSeek寫在官網上的口號是:探索未至之境/Into the unknown。因為它的轟動,中國商界和社會有可能發(fā)生一些變化:更追求前沿科技而不是拷貝科技,更看重硬核科技而不是醬香科技,更推崇創(chuàng)新大神而不是老板大亨,更熱愛探索未知而不是守成求穩(wěn)。
在我看來,如果這些變化能成為現(xiàn)實,讓整個社會都深度求索起來,求索真知,探索未知,才是DeepSeek的最大影響所在。
硬科技與硬精神
中國的硬核創(chuàng)新并非始自DeepSeek,但任何硬核創(chuàng)新都需要深度求索的精神。
春節(jié)前,我在上海張江的高質量孵化器和中科創(chuàng)星創(chuàng)始合伙人、“硬科技”概念提出者米磊交流。他說:“中國的一個問題還是很多人的心態(tài)沒過關,覺得我們跟美國沒法比,覺得差距特別大,追不上。實際上不是這樣。投對了資源,投對了人,就能追上,甚至超越。從量子計算突破邊界、商業(yè)航天扶搖九天,到《黑神話:悟空》,再到DeepSeek,都證明了這一點?!?/p>
1月26日深夜,《黑神話:悟空》制作人、游戲科學創(chuàng)始人馮驥通過微博盛贊DeepSeek。他說:“太幸運了!太開心了!這樣震撼的突破,來自一個純粹的中國公司。知識與信息平權,至此又往前邁出了堅實的一步?!?/p>
其實,《黑神話:悟空》的團隊也是一個非常本土的團隊,最初只有十幾個人。去年在比亞迪第1000萬輛新能源汽車下線慶典上,我和馮驥鄰座,問他最重要的成功因素是什么,他說第一就是在2018年下決心做一個中國題材的大型3A級單機游戲(注:3A指高投入、高制作、開發(fā)周期長,A lot of money、A lot of resources、A lot of time),第二是保證高品質。
“從現(xiàn)在看,如果當初我們選擇做‘悟空’時,還有別的團隊也做中國題材的3A游戲,也可能會取得成功。只是過去大家都不敢想?,F(xiàn)在,是一個時代到了?!瘪T驥說。
按我的理解,馮驥所說的“時代到了”,除了是指游戲用戶市場的規(guī)模、游戲產業(yè)軟硬件技術的飛躍外,也是指中國因素、中國題材已是產品走向世界的紅利,而不是拖累。從中國新三樣、智能化科技生活產品、泡泡瑪特等在海外的暢銷,到中國網游網文網劇和眾多互聯(lián)網應用在海外的走紅,在在處處也都是證明。
當然,要建立全球影響力,光有中國題材是不夠的,還要做成一流精品。
為做好《黑神話:悟空》,從形象、畫面、音樂到文字字體,馮驥團隊如履薄冰,精益求精。每個游戲人物的名字都是歐陽詢楷書字體,源自歐陽詢的碑刻和拓本,有31個角色可以在1986版電視劇《西游記》里找到原型,部分角色還用了電視劇的演員配音。公司自建的掃描團隊用了三四年時間在全國100多個地方掃描古建筑和不同的地貌,并在游戲中用合理方式呈現(xiàn)出很多實景和實物,也讓這部作品在發(fā)行后很快出圈,形成了虛擬世界和文旅世界的互動。
游戲科學公司官網上,關于“游戲科學名字的由來”,馮驥這樣詮釋:
“在創(chuàng)建游戲科學這家公司之前,我們感覺游戲行業(yè)在國內似乎遠遠算不上一門科學(類比通信行業(yè)或者計算機行業(yè)),而是充斥著由當前成功產品反推的,形形色色的成功學。
“為什么叫游戲科學?因為游戲也和其他行業(yè)一樣,是一門99%勤奮+1%靈感的嚴謹學科,而不是一樁跟風押注的賭徒生意?!?/em>
從梁文鋒所說的“這一波浪潮里,我們的出發(fā)點,就不是趁機賺一筆,而是走到技術的前沿,去推動整個生態(tài)發(fā)展”,到馮驥堅持的絕不做“跟風押注的賭徒生意”,我們看到了和資產負債表瘋狂擴張那個年代所迥異的態(tài)度與追求。
硬核創(chuàng)新的競爭,從根本上說,在于前沿技術。
在張江高質量孵化器展廳,我看到了光量子計算原型機“九章三號”的模型。量子計算是后摩爾時代的一種新計算范式,在原理上具有超快的并行計算能力。2023年,中科院量子信息與量子科技創(chuàng)新研究院團隊與中科院上海微系統(tǒng)所、國家并行計算機工程技術研究中心合作,成功構建了255個光子的“九章三號”,其在百萬分之一秒時間內所處理的最高復雜度的樣本,需要當前最強的超級計算機“前沿”(Frontier)花費超過200億年時間。
這表明,光量子技術原型機在某些特定的復雜問題求解上,具備經典計算機難以企及的強大算力。
雖然要做出真正實用化的量子計算機,還要解決很多核心技術難題,但“九章三號”又一次刷新量子計算優(yōu)越性的世界紀錄說明,在前沿科技的探索上,中國不是只能當跟隨者,而有希望成為引領者。
米磊說,中國過去的發(fā)展路徑,很大程度上是沿著“國外蹚路、國內跟隨”的模式,不用承擔探索方向出錯的浪費,獲得的是確定性的中低收益。未來則必須向硬科技進軍。
“典型的硬科技有兩種,一種是當下中國卡脖子的關鍵核心技術,一種是未來能夠引領新一輪科技變革的顛覆性技術?!?/p>
“如果芯片的尺寸從幾百納米到幾納米,這屬于延續(xù)性創(chuàng)新,但如果能夠做出架構完全不同的量子芯片或光子芯片,這就是顛覆性創(chuàng)新?!?/p>
硬科技時代,需要硬科技精神。米磊說,硬精神有幾個內涵:一是勇?lián)姑?,二是敢為人先,三是啃硬骨頭,四是十年磨劍。
梁文鋒說,對頂級人才吸引最大的,肯定是去解決世界上最難的問題?!捌鋵?,頂尖人才在中國是被低估的。因為整個社會層面的硬核創(chuàng)新太少了,使得他們沒有機會被識別出來。我們在做最難的事,對他們就是有吸引力的。中國產業(yè)結構的調整,會更依賴硬核技術的創(chuàng)新。很多人發(fā)現(xiàn)過去賺快錢很可能來自時代運氣,現(xiàn)在賺不到了,就會更愿意俯身去做真正的創(chuàng)新?!?/p>
一個時代的商業(yè)精神正在嬗變,它跟隨這個時代的國家戰(zhàn)略目標而變。
中國制造,硬核創(chuàng)新的代表
DeepSeek時刻是當下最熱的AI事件,AI又是中美博弈最具話題性的看點,自然成為本文的主題。
但我認為,中國的硬核創(chuàng)新之本,還是在制造業(yè),在大國重器,在專精特新,在一批具備世界級競爭力的技術創(chuàng)新企業(yè)的崛起。
為什么?最簡單的理由是,過去這幾十年,不少發(fā)達國家將制造業(yè)外包了,“放逐”了,而中國好像命里注定就是干制造業(yè)的,硬生生干成了包羅萬象的世界工廠,一刻也沒停過。不是十年磨一劍,二十年磨一劍,是四十多年磨一劍,想一想,就算一開始是再粗糙不堪的銹鐵,最終能磨成什么樣的鋒刃?!
對制造業(yè)的長期觀察,讓我越來越將制造業(yè)理解為人類在物質材料上實現(xiàn)的知識進化和能力進化,包括物理、化學、生物、運算、信息等各種知識,也包括生產、組織、運營、創(chuàng)新等各種能力。知識和能力的進化需要一種現(xiàn)實載體,以接受使用者的檢驗、反饋、改進、超越,再檢驗、再反饋、再改進、再超越。制造業(yè)就扮演了這樣的角色。
因之,守住制造業(yè),實際是守住了知識和能力進化的根,放棄制造業(yè)也就放棄了一種重要的進化與創(chuàng)新方式。
最近20年,美國已有很多學者指出,創(chuàng)新是要以產品開發(fā)和制造過程中形成的知識和經驗體系為基礎的,創(chuàng)新與制造業(yè)密不可分。的確,在大多數情況下,最賺錢的不在制造業(yè),比如美國最賺錢的公司是蘋果公司,它在美國設計產品,在全球分銷產品,但并不制造,制造基本在中國完成。在中國社交媒體上也一直有一種說法,即果鏈企業(yè)所獲的利潤占比太少。
而美國學者在調研中的發(fā)現(xiàn)則是,蘋果的高級設計師、研究人員有超過一半的時間待在中國的工廠里,幫助果鏈企業(yè)把東西造好??梢娢锲返闹圃觳⒉缓唵?,中間要投注、消化很多的要求,這些要求的背后就是一代代不斷提高的知識參數與能力標準,沉淀在材料、工藝、設備、檢驗的各個環(huán)節(jié),以及關于產品功能的定義,和對這些定義的可靠穩(wěn)定的實現(xiàn)之中。
在這個過程里,美國公司賺到了能賺的錢,中國企業(yè)獲得了能得的能力。兩不虧欠。關鍵看未來。美國要看能不能用錢賺更大的未來,中國要看能不能用能力賺更大的未來。
也許是命中注定,也許是情有獨鐘,如果歷史重來一次,我猜中國大概率還是會選提升能力這條路。技不壓身。攢能力比攢錢更重要。
今天我有一個感覺,無論走到哪里,經常可以看到中國制造的種種奇跡,讓我明白,時間就是能力進化的最好朋友。
去年底我到廣東南海獅山鎮(zhèn),在一家混合所有制企業(yè)中海萬泰看到專為深地、深海油氣開發(fā)量身打造的高端油氣裝備,名叫“璇璣”,它可以在幾千米地下瞄準油層鉆探,控制鉆頭在0.7米的薄油層中,橫向或斜向穩(wěn)定穿行數千米,并對地層資料進行實時分析。
而以前在海上進行石油開采,要先測算一個半徑約10公里的范圍進行鉆井,一旦定位不準就要移動鉆井位,移動一次的費用要上千萬元。有了“璇璣”,油氣田的開發(fā)成本大大降低。
看起來是制造,其實是知識和技術?!拌^”技術就是旋轉導向鉆井與隨鉆測井技術,被譽為石油鉆井技術“皇冠上的明珠”,橫跨20多個學科、涉及1000多道高端工藝,有多達幾百萬行控制代碼。
2008年,中國海油確立了自主研發(fā)的技術路線,7年攻關,成功研發(fā)出了“璇璣”系統(tǒng)。之后為更好地推動產業(yè)化,中國海油旗下的中海油服和佛山一家專注高端精密機械研發(fā)與制造的民企“中南機械”強強聯(lián)合,成立了中海萬泰,投入了超過200臺定制型數控加工設備,先后突破了多個特種材料加工應用難題以及槍鉆細深孔加工、高精度深孔電火花等技術難點,實現(xiàn)了“璇璣”全系零件的自主加工。
我在車間里看到了槍鉆工具。要在高溫高強度特種合金里埋上電線,就要用這根刀桿,打穿一個細長孔,孔徑只有2毫米到8毫米,長度最長可達6米。從2022年起,中海萬泰總經理許冠和工程師、技師們持續(xù)鉆研近兩年,終于徹底捅破了這層“窗戶紙”。
今天在中國,像這樣默默無聞卻內蓄著硬核創(chuàng)新的案例,用雨后春筍來形容毫不為過。作為一個觀察者,我的遺憾就是看不完,寫不盡。
這就是一步步發(fā)展到今天的中國制造,充滿了知識、能力、技術的艱辛創(chuàng)造與創(chuàng)新突破。在某種意義上,中國供應鏈,就是中國的科技創(chuàng)新鏈。
即使中國最優(yōu)秀的那些制造企業(yè),也不可能贏得DeepSeek的轟動,但在我內心,它們更是硬核創(chuàng)新的代表,是真正的英雄。
我也希望,中國的AI大模型能夠幫助它們,在智能化方向上更進一步。
結語
從我接觸的大量優(yōu)秀企業(yè)中,發(fā)現(xiàn)都有那么幾個關鍵時刻,構成了它們的“成人禮”。
這些時刻基本上都是下定決心,挑戰(zhàn)技術難題,去做以前不敢想、不敢投,覺得自己做不了、做不成、風險太大的事。
真的做了,過了這一關,整個心態(tài)就會改變,就會真正建立起自信,否則就永遠覺得,逾越不了國際上的某某標桿。
這并不是說,對外開放、對外學習、對外合作不重要,事實上,整個中國產業(yè)能力的變遷,與開放是分不開的。前一段,一家民營鋼鐵企業(yè)的總經理向我回憶了上世紀80年代上海寶鋼引進日本先進技術和設備的建設過程中,冶金部讓全國的鋼鐵企業(yè)都到現(xiàn)場學習,極大提高了整個中國鋼鐵工業(yè)的水平。
我也聽不少中國企業(yè)講到,雖然自己已經收購了當年想收購自己的國外同行,但當初從這些“洋老師”身上獲益匪淺。
即使今天,DeepSeek的創(chuàng)新,也是站在美國生成式AI和Meta開源模型的基礎上展開的。作為中國最重要硬核創(chuàng)新代表之一的“大飛機”,也在強調統(tǒng)一戰(zhàn)線的重要性,強調需要廣泛團結、凝聚國內外各方力量,共謀發(fā)展,共贏未來。
對外開放絕不應該是一種權宜之計。也沒有誰真的能夠包打天下。
但是,總想著躺在別人懷里實現(xiàn)創(chuàng)新,那注定不會有什么大出息。今天,中國企業(yè)已經有了比過去好得多的條件,迎難而上,克難攻堅,展開方方面面的硬核創(chuàng)新。
2000年中國的研發(fā)經費為896億元,2001年超過1000億元,2012年超過1萬億元,2019年超過2萬億元,2022年超過3萬億元,2024年超過3.6萬億元。過去1/4個世紀,中國在研發(fā)方面的復合增速遠超GDP增速。創(chuàng)新研發(fā)的后勁正在爆發(fā)。
去年我提出,未來中國經濟有兩大戰(zhàn)略機遇,一是從世界的工廠、工地到世界的市場和創(chuàng)新場,二是走出去,實現(xiàn)中國能力的全球化,再造一個“經濟中國”。從DeepSeek時刻到中國制造的脫胎換骨,大致可以下一個判斷,即中國的硬核創(chuàng)新時代已經來臨,中國成為世界的創(chuàng)新場并非虛幻,已在不可抑制地強力啟動。
如此再腳踏實地,專心專精,干上十年二十年,則中國巍然屹立于世界科技創(chuàng)新之林,當不容動搖。
本文為專欄作者授權創(chuàng)業(yè)邦發(fā)表,版權歸原作者所有。文章系作者個人觀點,不代表創(chuàng)業(yè)邦立場,轉載請聯(lián)系原作者。如有任何疑問,請聯(lián)系editor@cyzone.cn。