編者按:本文來(lái)自微信公眾號(hào) 華商韜略(ID:hstl8888),作者:劉柏鋮,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
DeepSeek之后,中國(guó)AI加速。
國(guó)內(nèi)一、二線城市們的焦慮也進(jìn)一步加深。
但北京,有些不一樣。
AI,離不開(kāi)北京
北京似乎不擔(dān)心“會(huì)不會(huì)錯(cuò)過(guò)DeepSeek”,因?yàn)镈eepSeek更擔(dān)心自己錯(cuò)過(guò)北京。
尤其是錯(cuò)過(guò)這里的人。
先后爆火的DeepSeek和Manus,明面上是分別起家于杭州和武漢,但其核心團(tuán)隊(duì)卻均身處北京,甚至其各自的北京分公司比本地分公司成立還要早。
曾有創(chuàng)業(yè)者調(diào)侃“只要人不走(出北京),事兒就不走(出北京)了”。
21世紀(jì)最貴的人才,北京就是有人才。
做AI,更離不開(kāi)人才,北京是中國(guó)AI人才第一城。
2018年,距離ChatGPT席卷全球還有4年,一場(chǎng)有關(guān)AI的頂級(jí)會(huì)議已在北京召開(kāi),會(huì)議的重點(diǎn)只有一個(gè):“如何提升當(dāng)下的科研水平”。
彼時(shí),谷歌剛剛提出突破性的Transformer架構(gòu)——此后的多年,不論是ChatGPT還是DeepSeek均是在此基礎(chǔ)上誕生。
而事實(shí)上,Transformer架構(gòu)的相關(guān)理念,早在谷歌之前就已被中國(guó)AI奠基人、中科院院士張鈸提出。
為什么北京沒(méi)有把張?jiān)菏康睦砟钭兂涩F(xiàn)實(shí),把Transformer架構(gòu)做出來(lái)?往后如何不再有這樣的遺憾?
會(huì)議上各種方案爭(zhēng)論很久,期間前微軟亞洲研究院創(chuàng)始人CEO張宏江站了起來(lái):“美國(guó)有個(gè)OpenAI,是一個(gè)非盈利民間機(jī)構(gòu),這種形式很新穎”。
本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn),不代表創(chuàng)業(yè)邦立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問(wèn),請(qǐng)聯(lián)系editor@cyzone.cn。而張宏江接下來(lái)提出的想法更加新穎,甚至過(guò)于理想化,以至于對(duì)國(guó)內(nèi)的科研體系都是一種挑戰(zhàn)。
他提議成立一個(gè)機(jī)構(gòu),把人工智能相關(guān)的優(yōu)秀科研工作者都聯(lián)合起來(lái)。
從清華、北大、中科院等知名高校到百度、字節(jié)、小米、美團(tuán)等知名企業(yè),都是他聯(lián)合的對(duì)象。
他認(rèn)為,有必要突破性地跳脫出傳統(tǒng)的權(quán)利體系,做一個(gè)獨(dú)立于政府、商業(yè)、高校之外,徹底定位為一所民間、非營(yíng)利、新型科研機(jī)構(gòu)。
就連張宏江自己也知道其中難度,畢竟企業(yè)投錢,想追求金錢回報(bào),政府投錢,同樣需要對(duì)其有一定的要求。
結(jié)果,北京市政府竟然展現(xiàn)出驚人的魄力,當(dāng)即拍板,親自出面牽頭,聯(lián)合科技部成立了北京智源人工智能研究院(BAAI),并將其作為北京最重要的三所研發(fā)機(jī)構(gòu)之一建設(shè)。
甚至,一不做二不休,北京市還幾乎拿出了所有的資源,將政府、企業(yè)和社會(huì)數(shù)據(jù)集合到這一平臺(tái)上,建設(shè)新的開(kāi)源AI工具,同時(shí)整合大學(xué)和大企業(yè)的計(jì)算能力,向各類AI研發(fā)機(jī)構(gòu)開(kāi)放,歡迎全球的人工智能研究人員參與使用。
僅僅三個(gè)月后,清華東南門外,快門閃過(guò),智源正式成立了。
這是中國(guó)AI發(fā)展史中濃墨重彩的一筆。
幾乎所有人都懷揣著理想主義,沒(méi)有論資排輩,不看“帽子”,只看其是否有取得標(biāo)桿性成就的潛力。
至今,面壁智能聯(lián)合創(chuàng)始人劉知遠(yuǎn)仍對(duì)智源念念不忘。
彼時(shí),劉知遠(yuǎn)還未評(píng)上清華大學(xué)副教授,在AI領(lǐng)域也算不上什么有話語(yǔ)權(quán)的人。
只是抱著“試一試”的態(tài)度,他向智源申請(qǐng)了大模型訓(xùn)練的立項(xiàng),沒(méi)想到立即獲得上千萬(wàn)人民幣的資源投入。
“如果沒(méi)有智源,以我當(dāng)時(shí)的學(xué)術(shù)職稱很難調(diào)度這么大的資源?!?/p>
就在這樣的理想主義中,智源研究院拿出了僅次于OpenAI、谷歌的大型AI研究項(xiàng)目——“悟道”,成為了AI屆的“黃埔軍?!?。
智譜創(chuàng)立發(fā)起人唐杰、面壁智能聯(lián)合創(chuàng)始人劉知遠(yuǎn)、月之暗面創(chuàng)始人楊植麟……這些響當(dāng)當(dāng)?shù)拇竽P兔餍莿?chuàng)業(yè)企業(yè)發(fā)起人、創(chuàng)始人,都曾在智源深度參與大模型研究。
如今,北京匯聚了全國(guó)最頂尖的大學(xué)和科研機(jī)構(gòu),90多所知名高校、1000多家科研院所、120個(gè)國(guó)家重點(diǎn)實(shí)驗(yàn)室,全國(guó)60%的人工智能人才集中在北京,龐大的人才寶庫(kù),為北京的AI發(fā)展打下基礎(chǔ),也吸引來(lái)其他城市的目光。
北京,反哺全國(guó)
DeepSeek、Manus接連刺激著中國(guó)各大城市的神經(jīng)。
上海遭吐槽“被‘小弟’偷家”、深圳被懟“只懂拿來(lái)主義”、南京更是連續(xù)被省委機(jī)關(guān)報(bào)“敲打”……
反思的文章一篇接一篇,政策也緊鑼密鼓,接連被推出。
事實(shí)上,2023年初,ChatGPT風(fēng)靡全球,AI被突然加速,各大城市的AI爭(zhēng)奪戰(zhàn)就已打響。
北京提供算力補(bǔ)貼和場(chǎng)景測(cè)試支持,降低企業(yè)研發(fā)成本。上海、廣東除了政策上的綠燈,還直接給予最高500萬(wàn)元、2000萬(wàn)元的資助。
城市在爭(zhēng)奪相關(guān)企業(yè),企業(yè)在爭(zhēng)奪人才。
遠(yuǎn)在美國(guó)的張宏江也接到了一位智源骨干焦急的電話。
“怎么辦,他們一定會(huì)挖我們的人?!?/p>
“慌什么?!?/p>
張宏江已經(jīng)有所預(yù)料,只是沒(méi)想到,這種挖角持續(xù)了很久。
一次,張宏江在同行的交流會(huì)中,當(dāng)著某知名創(chuàng)業(yè)者的面狠狠夸獎(jiǎng)了一位很受智源重視的年輕人。而過(guò)了沒(méi)多久,這位年輕人就被那位知名創(chuàng)業(yè)者挖走。
這件事,讓張宏江憂郁很久。
同樣的故事,在北京各處上演。
2024年3月,上海在知名地標(biāo)西岸藝術(shù)中心召開(kāi)了2024年全球開(kāi)發(fā)者先鋒大會(huì)。
這個(gè)位置可不是隨意選擇的,距離此地1公里的模速空間,有著“AI超級(jí)工廠”之稱,也被定位為“全球最大的人工智能孵化器”,其聚集的大模型企業(yè)之多,“上下樓就是上下游”。
而其中,竟有一半企業(yè)來(lái)自北京。
原來(lái),在2023年8月模速空間啟動(dòng)建設(shè)時(shí),上海相關(guān)負(fù)責(zé)人就專門跑去北京,挨家挨戶敲門訪問(wèn)AI企業(yè)。
企業(yè)外遷,北京不會(huì)睜只眼閉只眼。
就在模速空間啟動(dòng)一個(gè)月后,北京專門設(shè)立了北京市人工智能產(chǎn)業(yè)投資基金,基金總規(guī)模達(dá)100億元,其中一個(gè)最大的投資訴求就是:
只投資北京本土AI企業(yè),并且被投后必須長(zhǎng)期扎根北京,不然就會(huì)觸發(fā)回購(gòu)操作。
眼見(jiàn)“爭(zhēng)奪戰(zhàn)”愈演愈烈,國(guó)家也開(kāi)始出手。
2024年8月,《公平競(jìng)爭(zhēng)審查條例》正式實(shí)施,綜合整治地區(qū)“掃樓式”搶挖企業(yè)和不正常的“內(nèi)卷式”競(jìng)爭(zhēng),規(guī)范地方政府和企業(yè)行為。
一盆水潑下,大家的腦子都冷靜不少。
北京上下,也從混亂中找回初心。
張宏江更加淡然:“如果智源的一些人到了某些公司成為了核心骨干,把公司做成了,我會(huì)非常開(kāi)心。我們的代碼、我們的系統(tǒng)被別人用來(lái)做他們的產(chǎn)品,做得很好我也會(huì)非常開(kāi)心,這本來(lái)就應(yīng)該是一家非營(yíng)利研究機(jī)構(gòu)的價(jià)值所在?!?/p>
海淀區(qū)也逐漸大度:“企業(yè)根據(jù)自身的發(fā)展需求,走向全國(guó)市場(chǎng),對(duì)全國(guó)的產(chǎn)業(yè)發(fā)展是有帶動(dòng)作用的”“如果只是盯著數(shù)據(jù),那是很傳統(tǒng)的“看攤”思維”。
目前,北京已經(jīng)擁有AI相關(guān)企業(yè)數(shù)量約為2200家,占全國(guó)的40%左右;規(guī)模在10億參數(shù)以上的大模型廠商約有一半在北京,數(shù)量達(dá)到122家。
顯然,對(duì)于北京,視野已經(jīng)不能僅僅停留于國(guó)內(nèi),理應(yīng)站上更高的高度。
“建成世界主要科學(xué)中心和創(chuàng)新高地”“致力于發(fā)展未來(lái)產(chǎn)業(yè),建設(shè)具有全球影響力的創(chuàng)新策源地和產(chǎn)業(yè)高地”。
相關(guān)言論不斷出現(xiàn)在北京的各種政策目標(biāo)中。
目標(biāo),是全世界!
目標(biāo),唯有登頂
“小心陷入‘無(wú)源之水’的困境!”
整個(gè)2023年,中國(guó)工程院院士戴瓊海四處奔波,不斷警醒著人們。
彼時(shí),以美國(guó)方案為主的大模型技術(shù)已經(jīng)對(duì)我國(guó)形成了嚴(yán)峻的知識(shí)產(chǎn)權(quán)壁壘。而截至2023年5月,大模型和Transformer相關(guān)的知識(shí)產(chǎn)權(quán)總數(shù)有2899項(xiàng),美國(guó)占據(jù)71%,可我國(guó)僅占據(jù)25%。
時(shí)至今日,國(guó)內(nèi)外發(fā)布的不少大模型,仍有不少基于谷歌的Transformer方案。
面對(duì)日益復(fù)雜的國(guó)際關(guān)系,依附性創(chuàng)新模式風(fēng)險(xiǎn)不小,甚至有專家警告:“人工智能產(chǎn)業(yè)將淪為技術(shù)殖民地的裝配車間?!?/p>
作為中國(guó)AI的發(fā)源地、中國(guó)AI人才的大本營(yíng),北京有義務(wù)也有實(shí)力去做一些不一樣的事。
就在DeepSeek爆火之后的這波反思潮中,不少媒體也指向這一個(gè)關(guān)鍵節(jié)點(diǎn):
Transformer架構(gòu)出世后,北京在迅速跟進(jìn)有自主知識(shí)產(chǎn)權(quán)的變體模型,而不是基于Transformer訓(xùn)練出更多相對(duì)同質(zhì)化的大模型。
智譜創(chuàng)立發(fā)起人、清華教授唐杰高呼“打破西方的路徑壟斷”,堅(jiān)決選擇不夠成熟的GLM路徑,打造中國(guó)自己的預(yù)訓(xùn)練模型框架,并公開(kāi)表態(tài):“如果成功了,那至少證明中國(guó)的大模型公司,技術(shù)能力也能達(dá)到世界級(jí)水平?!?/p>
彩云科技創(chuàng)始人袁行遠(yuǎn),同樣投身于挑戰(zhàn)Transformer架構(gòu)的事業(yè)。
彼時(shí),很多投資人無(wú)法理解智譜和彩云科技做的事,“大部分人不相信作為一個(gè)中國(guó)初創(chuàng)公司能做出什么技術(shù)創(chuàng)新,所以你就去抄美國(guó)就完了。”
就連袁行遠(yuǎn)自己都遭受不小的刺激,看到周邊一家家公司拿到巨額融資,開(kāi)始“懷疑自己到底在干什么”。
但最后,大家還是堅(jiān)定,要走自己的路。
北京的AI學(xué)者,從業(yè)者,創(chuàng)業(yè)者在前方背水一戰(zhàn)。
北京則在發(fā)展規(guī)劃中不斷明確自身的道路。
2023年一年,北京連續(xù)發(fā)布《北京市加快建設(shè)具有全球影響力的人工智能創(chuàng)新策源地實(shí)施方案(2023-2025年)》和《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施》《人工智能算力券實(shí)施方案(2023-2025年)》。
尤其在北京市人工智能產(chǎn)業(yè)投資基金成立后,北京僅一個(gè)月間就接連舉辦多場(chǎng)關(guān)于AI技術(shù)的閉門活動(dòng),不斷強(qiáng)調(diào)將重點(diǎn)投向底層技術(shù)領(lǐng)域、新技術(shù)創(chuàng)新等關(guān)鍵領(lǐng)域,要“攻堅(jiān)突破”“布局前沿技術(shù)”“彎道超車”“換道超車”……
如今,位于北京的彩云科技和智譜已經(jīng)各自拿出足以挑戰(zhàn)Transformer架構(gòu)的底層架構(gòu)。
其中彩云科技提出的DCFormer架構(gòu),不但可以讓原本基于Transformer的大模型無(wú)縫嵌套和應(yīng)用DCFormer,甚至還能比Transformer的性能提升1.7-2倍。
而業(yè)內(nèi)對(duì)各個(gè)城市的AI產(chǎn)業(yè)分析也逐漸統(tǒng)一:
北京用領(lǐng)先的技術(shù)輻射全國(guó),帶動(dòng)中國(guó)AI產(chǎn)業(yè)發(fā)展,其余城市則各自“因地制宜”,將領(lǐng)先的技術(shù)賦能到相關(guān)應(yīng)用產(chǎn)業(yè)。
北京已經(jīng)找到自身的優(yōu)勢(shì)。
在2025年的新春第一會(huì)上,北京海淀發(fā)布《中關(guān)村科學(xué)城加快建設(shè)具有全球影響力人工智能產(chǎn)業(yè)高地的若干措施》,每年10億元,拿出空間、資金和場(chǎng)景,致力于發(fā)展未來(lái)產(chǎn)業(yè),建設(shè)具有全球影響力的創(chuàng)新策源地和產(chǎn)業(yè)高地。
未來(lái),北京的優(yōu)勢(shì)只會(huì)越來(lái)越強(qiáng)大。
三次問(wèn)鼎計(jì)算機(jī)視覺(jué)領(lǐng)域國(guó)際最高獎(jiǎng)項(xiàng)馬爾獎(jiǎng)的朱松純教授、“計(jì)算機(jī)圖形學(xué)超級(jí)新星”胡淵鳴、曾提出LAMB優(yōu)化器的潞晨科技創(chuàng)始人尤洋等頂級(jí)學(xué)者……
國(guó)際頂級(jí)學(xué)者接連來(lái)到北京,或坐鎮(zhèn)院校,或創(chuàng)辦企業(yè)。
然而來(lái)到北京的又何止國(guó)際頂級(jí)學(xué)者。
一直到DeepSeek爆火,人們驚訝地發(fā)現(xiàn):
就在DeepSeek的北京辦公地融科資訊中心,竟匯聚著Google、英偉達(dá)、AMD、蘋果、intel、華為、ARM、百度風(fēng)投、襄禾資本(月之暗面投資方)等國(guó)際知名巨頭。
而以融科資訊中心畫圓,則是清華大學(xué)、北京大學(xué)、北京航空航天大學(xué)等41所高校,206家中國(guó)科學(xué)院為代表的國(guó)家(市)科研院所,67個(gè)國(guó)家重點(diǎn)實(shí)驗(yàn)室,27個(gè)國(guó)家工程研究中心,28個(gè)國(guó)家工程技術(shù)研究中心,是中國(guó)人才和智力資源最密集的區(qū)域。
因此有人感嘆,中國(guó)城市AI大戰(zhàn),北京只出一棟樓就已經(jīng)贏了。