編者按:本文來自微信公眾號 三言Pro( ID:sycaijing),作者: 三言Pro,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
近日,DeepSeek發(fā)布的R1模型可以說對整個科技圈造成了巨大轟動,尤其是一直處于領(lǐng)先地位的美國AI領(lǐng)域。????
R1模型以更低的價格實現(xiàn)超越多個美國頭部模型,而且還完全開源,甚至有美國Meta員工爆料稱公司“感到恐慌”。??????
而本周一,DeepSeek帶來的沖擊仍在持續(xù),具體表現(xiàn)在美股大跌,尤其是半導(dǎo)體股,從盤前到收盤,一路“綠燈”。??????
英偉達更是創(chuàng)下周一收跌16.79%,市值蒸發(fā)5900億美元,創(chuàng)下美國金融史記錄。?????????
周一收盤美股重挫
英偉達股價報118.42美元,跌幅16.97%,單日蒸發(fā)市值近6000億美元,創(chuàng)美股最高紀錄;
臺積電股價報192.52美元,跌幅13.23%;
ARM股價報145.96美元,跌幅10.19%;
阿斯麥股價報690.15美元,跌幅5.75%;
美光科技股價報91.11美元,跌幅11.71%。
此外,美股三大指數(shù)收盤漲跌不一,道指漲0.65%,標普500指數(shù)跌1.46%,納指跌3.07%。
DeepSeek給了美國科技巨頭一點“中國震撼”,英偉達發(fā)言人27日表示,“DeepSeek是一項出色的人工智能進步,也是測試時間縮放的完美例子。”“DeepSeek的工作說明了如何使用該技術(shù)創(chuàng)建新模型,利用廣泛可用的模型和完全符合出口管制的計算?!?/p>
再出殺招,進軍文生圖:發(fā)布新開源多模態(tài)AI模型
但DeepSeek顯然不準備止步于此。?
1月28日凌晨,DeepSeek發(fā)布了名為Janus-Pro和JanusFlow的一系列開源多模態(tài)AI模型。
DeepSeek表示,這款大模型是2024年11月發(fā)布的JanusFlow大模型的高級版本;相較前代模型,Janus-Pro優(yōu)化了訓(xùn)練策略、擴展訓(xùn)練數(shù)據(jù),模型也更大。Janus-Pro在多模態(tài)理解和文本到圖像的指令更總功能方面取得重大進步,還增強了文本到圖像生成的穩(wěn)定性。
DeepSeek的展示圖顯示,在文生圖GenEval和DPG-Bench基準測試中,Janus-Pro-7B的準確率較前代Janus大幅提高,準確率測試結(jié)果分別為80%和84.2%,高于包括OpenAI DALL-E 3在內(nèi)的其他對比模型,Janus的準確率分別為61%和79.7%。
其中,Janus-Pro是統(tǒng)一多模態(tài)與生成的創(chuàng)新框架,通過解耦視覺編碼的方式,提升模型在不同任務(wù)中的適配行與性能。
該模型機可適配視覺問答、圖像標注等多模態(tài)場景。
而JanusFlow是通過生成流與自回歸語言模型融合實現(xiàn)統(tǒng)一框架;不僅能處理理解任務(wù),還能夠生成高質(zhì)量圖像。
這標志著DeepSeek將進軍文生圖領(lǐng)域。
DeepSeek 創(chuàng)始人梁文鋒:中國AI不可能永遠處在跟隨位置??
之所以DeepSeek的R1模型能讓美國眾科技公司關(guān)注,而且還對美股造成巨大影響,主要有兩個核心原因。???????????????????
一是在目前中美都在AI賽道發(fā)力的前提下,DeepSeek撼動了美國一直以來保持領(lǐng)先的地位。??
自2022年底GPT3.5發(fā)布以來,無論是OpenAI,還是谷歌、蘋果,美國科技公司在大模型領(lǐng)域都是引領(lǐng)者姿態(tài);而中國的科技公司雖然也緊隨其后地開發(fā)出多個大模型,且也有一定的實際應(yīng)用,但一直處于追趕者地位似乎是圈里共識。??????????????
而DeepSeek打破了這種“刻板印象”,其R1模型在第三方測試中,表現(xiàn)全部優(yōu)于美國一眾頭部模型。??????
因此,Meta等公司對此“表現(xiàn)緊張”不難理解。?????
第二個核心原因則是,當前受美國制裁影響,中國公司無法使用高端芯片,在算力資源上處于劣勢。?????
然而,就是在這種情況下,DeepSeek仍然能夠開發(fā)出領(lǐng)先模型,一定程度上說明當前AI大模型所需的算力資源被高估了。???????????
舉個例子,此前被認為需要1萬塊頂級GPU才能開發(fā)的產(chǎn)品,而現(xiàn)在100塊“閹割版”GPU也能實現(xiàn)。????????????
DeepSeek為其他科技公司提供了新的選擇,即在有限條件下,是可以通過技術(shù)優(yōu)化而非大量購買芯片進行AI研發(fā)的。????????????
所以這就對AI高端芯片產(chǎn)品需求造成影響,因此英偉達、臺積電、阿斯麥等芯片產(chǎn)業(yè)鏈企業(yè)股價和市值下挫。?????
此前,DeepSeek創(chuàng)始人梁文鋒在接受36氪旗下“暗涌”團隊采訪時表示,中國AI不可能永遠處在跟隨的位置。經(jīng)常說中國AI跟美國有一兩年差距,但真實的差距是原創(chuàng)和模仿之差。如果這個不改變,中國永遠只是追隨者,所以有些探索也是逃不掉的。??????????
英偉達的領(lǐng)先,不只是一個公司的努力,而是整個西方技術(shù)社區(qū)和產(chǎn)業(yè)共同努力的結(jié)果。他們能看到下一代的技術(shù)趨勢,手里有路線圖。中國 AI 的發(fā)展,同樣需要這樣的生態(tài)。很多國產(chǎn)芯片發(fā)展不起來,也是因為缺乏配套的技術(shù)社區(qū),只有第二手消息,所以中國必然需要有人站到技術(shù)的前沿。
本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個人觀點,不代表創(chuàng)業(yè)邦立場,轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問,請聯(lián)系editor@cyzone.cn。