編者按:本文來自微信公眾號 華商韜略(ID:hstl8888),作者:劉柏鋮,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
DeepSeek之后,中國AI加速。
國內(nèi)一、二線城市們的焦慮也進一步加深。
但北京,有些不一樣。
AI,離不開北京
北京似乎不擔(dān)心“會不會錯過DeepSeek”,因為DeepSeek更擔(dān)心自己錯過北京。
尤其是錯過這里的人。
先后爆火的DeepSeek和Manus,明面上是分別起家于杭州和武漢,但其核心團隊卻均身處北京,甚至其各自的北京分公司比本地分公司成立還要早。
曾有創(chuàng)業(yè)者調(diào)侃“只要人不走(出北京),事兒就不走(出北京)了”。
21世紀(jì)最貴的人才,北京就是有人才。
做AI,更離不開人才,北京是中國AI人才第一城。
2018年,距離ChatGPT席卷全球還有4年,一場有關(guān)AI的頂級會議已在北京召開,會議的重點只有一個:“如何提升當(dāng)下的科研水平”。
彼時,谷歌剛剛提出突破性的Transformer架構(gòu)——此后的多年,不論是ChatGPT還是DeepSeek均是在此基礎(chǔ)上誕生。
而事實上,Transformer架構(gòu)的相關(guān)理念,早在谷歌之前就已被中國AI奠基人、中科院院士張鈸提出。
為什么北京沒有把張院士的理念變成現(xiàn)實,把Transformer架構(gòu)做出來?往后如何不再有這樣的遺憾?
會議上各種方案爭論很久,期間前微軟亞洲研究院創(chuàng)始人CEO張宏江站了起來:“美國有個OpenAI,是一個非盈利民間機構(gòu),這種形式很新穎”。
本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個人觀點,不代表創(chuàng)業(yè)邦立場,轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問,請聯(lián)系editor@cyzone.cn。而張宏江接下來提出的想法更加新穎,甚至過于理想化,以至于對國內(nèi)的科研體系都是一種挑戰(zhàn)。
他提議成立一個機構(gòu),把人工智能相關(guān)的優(yōu)秀科研工作者都聯(lián)合起來。
從清華、北大、中科院等知名高校到百度、字節(jié)、小米、美團等知名企業(yè),都是他聯(lián)合的對象。
他認(rèn)為,有必要突破性地跳脫出傳統(tǒng)的權(quán)利體系,做一個獨立于政府、商業(yè)、高校之外,徹底定位為一所民間、非營利、新型科研機構(gòu)。
就連張宏江自己也知道其中難度,畢竟企業(yè)投錢,想追求金錢回報,政府投錢,同樣需要對其有一定的要求。
結(jié)果,北京市政府竟然展現(xiàn)出驚人的魄力,當(dāng)即拍板,親自出面牽頭,聯(lián)合科技部成立了北京智源人工智能研究院(BAAI),并將其作為北京最重要的三所研發(fā)機構(gòu)之一建設(shè)。
甚至,一不做二不休,北京市還幾乎拿出了所有的資源,將政府、企業(yè)和社會數(shù)據(jù)集合到這一平臺上,建設(shè)新的開源AI工具,同時整合大學(xué)和大企業(yè)的計算能力,向各類AI研發(fā)機構(gòu)開放,歡迎全球的人工智能研究人員參與使用。
僅僅三個月后,清華東南門外,快門閃過,智源正式成立了。
這是中國AI發(fā)展史中濃墨重彩的一筆。
幾乎所有人都懷揣著理想主義,沒有論資排輩,不看“帽子”,只看其是否有取得標(biāo)桿性成就的潛力。
至今,面壁智能聯(lián)合創(chuàng)始人劉知遠(yuǎn)仍對智源念念不忘。
彼時,劉知遠(yuǎn)還未評上清華大學(xué)副教授,在AI領(lǐng)域也算不上什么有話語權(quán)的人。
只是抱著“試一試”的態(tài)度,他向智源申請了大模型訓(xùn)練的立項,沒想到立即獲得上千萬人民幣的資源投入。
“如果沒有智源,以我當(dāng)時的學(xué)術(shù)職稱很難調(diào)度這么大的資源?!?/p>
就在這樣的理想主義中,智源研究院拿出了僅次于OpenAI、谷歌的大型AI研究項目——“悟道”,成為了AI屆的“黃埔軍?!薄?/strong>
智譜創(chuàng)立發(fā)起人唐杰、面壁智能聯(lián)合創(chuàng)始人劉知遠(yuǎn)、月之暗面創(chuàng)始人楊植麟……這些響當(dāng)當(dāng)?shù)拇竽P兔餍莿?chuàng)業(yè)企業(yè)發(fā)起人、創(chuàng)始人,都曾在智源深度參與大模型研究。
如今,北京匯聚了全國最頂尖的大學(xué)和科研機構(gòu),90多所知名高校、1000多家科研院所、120個國家重點實驗室,全國60%的人工智能人才集中在北京,龐大的人才寶庫,為北京的AI發(fā)展打下基礎(chǔ),也吸引來其他城市的目光。
北京,反哺全國
DeepSeek、Manus接連刺激著中國各大城市的神經(jīng)。
上海遭吐槽“被‘小弟’偷家”、深圳被懟“只懂拿來主義”、南京更是連續(xù)被省委機關(guān)報“敲打”……
反思的文章一篇接一篇,政策也緊鑼密鼓,接連被推出。
事實上,2023年初,ChatGPT風(fēng)靡全球,AI被突然加速,各大城市的AI爭奪戰(zhàn)就已打響。
北京提供算力補貼和場景測試支持,降低企業(yè)研發(fā)成本。上海、廣東除了政策上的綠燈,還直接給予最高500萬元、2000萬元的資助。
城市在爭奪相關(guān)企業(yè),企業(yè)在爭奪人才。
遠(yuǎn)在美國的張宏江也接到了一位智源骨干焦急的電話。
“怎么辦,他們一定會挖我們的人?!?/p>
“慌什么?!?/p>
張宏江已經(jīng)有所預(yù)料,只是沒想到,這種挖角持續(xù)了很久。
一次,張宏江在同行的交流會中,當(dāng)著某知名創(chuàng)業(yè)者的面狠狠夸獎了一位很受智源重視的年輕人。而過了沒多久,這位年輕人就被那位知名創(chuàng)業(yè)者挖走。
這件事,讓張宏江憂郁很久。
同樣的故事,在北京各處上演。
2024年3月,上海在知名地標(biāo)西岸藝術(shù)中心召開了2024年全球開發(fā)者先鋒大會。
這個位置可不是隨意選擇的,距離此地1公里的模速空間,有著“AI超級工廠”之稱,也被定位為“全球最大的人工智能孵化器”,其聚集的大模型企業(yè)之多,“上下樓就是上下游”。
而其中,竟有一半企業(yè)來自北京。
原來,在2023年8月模速空間啟動建設(shè)時,上海相關(guān)負(fù)責(zé)人就專門跑去北京,挨家挨戶敲門訪問AI企業(yè)。
企業(yè)外遷,北京不會睜只眼閉只眼。
就在模速空間啟動一個月后,北京專門設(shè)立了北京市人工智能產(chǎn)業(yè)投資基金,基金總規(guī)模達(dá)100億元,其中一個最大的投資訴求就是:
只投資北京本土AI企業(yè),并且被投后必須長期扎根北京,不然就會觸發(fā)回購操作。
眼見“爭奪戰(zhàn)”愈演愈烈,國家也開始出手。
2024年8月,《公平競爭審查條例》正式實施,綜合整治地區(qū)“掃樓式”搶挖企業(yè)和不正常的“內(nèi)卷式”競爭,規(guī)范地方政府和企業(yè)行為。
一盆水潑下,大家的腦子都冷靜不少。
北京上下,也從混亂中找回初心。
張宏江更加淡然:“如果智源的一些人到了某些公司成為了核心骨干,把公司做成了,我會非常開心。我們的代碼、我們的系統(tǒng)被別人用來做他們的產(chǎn)品,做得很好我也會非常開心,這本來就應(yīng)該是一家非營利研究機構(gòu)的價值所在?!?/p>
海淀區(qū)也逐漸大度:“企業(yè)根據(jù)自身的發(fā)展需求,走向全國市場,對全國的產(chǎn)業(yè)發(fā)展是有帶動作用的”“如果只是盯著數(shù)據(jù),那是很傳統(tǒng)的“看攤”思維”。
目前,北京已經(jīng)擁有AI相關(guān)企業(yè)數(shù)量約為2200家,占全國的40%左右;規(guī)模在10億參數(shù)以上的大模型廠商約有一半在北京,數(shù)量達(dá)到122家。
顯然,對于北京,視野已經(jīng)不能僅僅停留于國內(nèi),理應(yīng)站上更高的高度。
“建成世界主要科學(xué)中心和創(chuàng)新高地”“致力于發(fā)展未來產(chǎn)業(yè),建設(shè)具有全球影響力的創(chuàng)新策源地和產(chǎn)業(yè)高地”。
相關(guān)言論不斷出現(xiàn)在北京的各種政策目標(biāo)中。
目標(biāo),是全世界!
目標(biāo),唯有登頂
“小心陷入‘無源之水’的困境!”
整個2023年,中國工程院院士戴瓊海四處奔波,不斷警醒著人們。
彼時,以美國方案為主的大模型技術(shù)已經(jīng)對我國形成了嚴(yán)峻的知識產(chǎn)權(quán)壁壘。而截至2023年5月,大模型和Transformer相關(guān)的知識產(chǎn)權(quán)總數(shù)有2899項,美國占據(jù)71%,可我國僅占據(jù)25%。
時至今日,國內(nèi)外發(fā)布的不少大模型,仍有不少基于谷歌的Transformer方案。
面對日益復(fù)雜的國際關(guān)系,依附性創(chuàng)新模式風(fēng)險不小,甚至有專家警告:“人工智能產(chǎn)業(yè)將淪為技術(shù)殖民地的裝配車間?!?/p>
作為中國AI的發(fā)源地、中國AI人才的大本營,北京有義務(wù)也有實力去做一些不一樣的事。
就在DeepSeek爆火之后的這波反思潮中,不少媒體也指向這一個關(guān)鍵節(jié)點:
Transformer架構(gòu)出世后,北京在迅速跟進有自主知識產(chǎn)權(quán)的變體模型,而不是基于Transformer訓(xùn)練出更多相對同質(zhì)化的大模型。
智譜創(chuàng)立發(fā)起人、清華教授唐杰高呼“打破西方的路徑壟斷”,堅決選擇不夠成熟的GLM路徑,打造中國自己的預(yù)訓(xùn)練模型框架,并公開表態(tài):“如果成功了,那至少證明中國的大模型公司,技術(shù)能力也能達(dá)到世界級水平?!?/p>
彩云科技創(chuàng)始人袁行遠(yuǎn),同樣投身于挑戰(zhàn)Transformer架構(gòu)的事業(yè)。
彼時,很多投資人無法理解智譜和彩云科技做的事,“大部分人不相信作為一個中國初創(chuàng)公司能做出什么技術(shù)創(chuàng)新,所以你就去抄美國就完了?!?/p>
就連袁行遠(yuǎn)自己都遭受不小的刺激,看到周邊一家家公司拿到巨額融資,開始“懷疑自己到底在干什么”。
但最后,大家還是堅定,要走自己的路。
北京的AI學(xué)者,從業(yè)者,創(chuàng)業(yè)者在前方背水一戰(zhàn)。
北京則在發(fā)展規(guī)劃中不斷明確自身的道路。
2023年一年,北京連續(xù)發(fā)布《北京市加快建設(shè)具有全球影響力的人工智能創(chuàng)新策源地實施方案(2023-2025年)》和《北京市促進通用人工智能創(chuàng)新發(fā)展的若干措施》《人工智能算力券實施方案(2023-2025年)》。
尤其在北京市人工智能產(chǎn)業(yè)投資基金成立后,北京僅一個月間就接連舉辦多場關(guān)于AI技術(shù)的閉門活動,不斷強調(diào)將重點投向底層技術(shù)領(lǐng)域、新技術(shù)創(chuàng)新等關(guān)鍵領(lǐng)域,要“攻堅突破”“布局前沿技術(shù)”“彎道超車”“換道超車”……
如今,位于北京的彩云科技和智譜已經(jīng)各自拿出足以挑戰(zhàn)Transformer架構(gòu)的底層架構(gòu)。
其中彩云科技提出的DCFormer架構(gòu),不但可以讓原本基于Transformer的大模型無縫嵌套和應(yīng)用DCFormer,甚至還能比Transformer的性能提升1.7-2倍。
而業(yè)內(nèi)對各個城市的AI產(chǎn)業(yè)分析也逐漸統(tǒng)一:
北京用領(lǐng)先的技術(shù)輻射全國,帶動中國AI產(chǎn)業(yè)發(fā)展,其余城市則各自“因地制宜”,將領(lǐng)先的技術(shù)賦能到相關(guān)應(yīng)用產(chǎn)業(yè)。
北京已經(jīng)找到自身的優(yōu)勢。
在2025年的新春第一會上,北京海淀發(fā)布《中關(guān)村科學(xué)城加快建設(shè)具有全球影響力人工智能產(chǎn)業(yè)高地的若干措施》,每年10億元,拿出空間、資金和場景,致力于發(fā)展未來產(chǎn)業(yè),建設(shè)具有全球影響力的創(chuàng)新策源地和產(chǎn)業(yè)高地。
未來,北京的優(yōu)勢只會越來越強大。
三次問鼎計算機視覺領(lǐng)域國際最高獎項馬爾獎的朱松純教授、“計算機圖形學(xué)超級新星”胡淵鳴、曾提出LAMB優(yōu)化器的潞晨科技創(chuàng)始人尤洋等頂級學(xué)者……
國際頂級學(xué)者接連來到北京,或坐鎮(zhèn)院校,或創(chuàng)辦企業(yè)。
然而來到北京的又何止國際頂級學(xué)者。
一直到DeepSeek爆火,人們驚訝地發(fā)現(xiàn):
就在DeepSeek的北京辦公地融科資訊中心,竟匯聚著Google、英偉達(dá)、AMD、蘋果、intel、華為、ARM、百度風(fēng)投、襄禾資本(月之暗面投資方)等國際知名巨頭。
而以融科資訊中心畫圓,則是清華大學(xué)、北京大學(xué)、北京航空航天大學(xué)等41所高校,206家中國科學(xué)院為代表的國家(市)科研院所,67個國家重點實驗室,27個國家工程研究中心,28個國家工程技術(shù)研究中心,是中國人才和智力資源最密集的區(qū)域。
因此有人感嘆,中國城市AI大戰(zhàn),北京只出一棟樓就已經(jīng)贏了。