智駕領域的“終場哨”尚未吹響,真正的終局屬于那些能把“說話”和“想象”融合成“思考”的玩家。
原創(chuàng)?新熵 新能源車組
作者丨茯神 編輯丨思原、九黎
當理想i8在暴雨中的山區(qū)公路上自動識別出被沖垮的路肩,平穩(wěn)減速并規(guī)劃出繞行路線時;當小鵬P7 Ultra僅憑視覺傳感器就精準避讓了橫穿馬路的流浪貓與突發(fā)變道的貨車時,智能駕駛行業(yè)悄然迎來了一場技術革命的臨界點。
新能源汽車的市場淘汰賽已進程過半,從電池續(xù)航、充電速度到座艙智能化,競爭之下市場早已進入紅海,甚至智駕能力也正從爭議不斷的“加分項”轉(zhuǎn)變?yōu)闆Q定車企生死的“生存項”。
今年8月,理想、小鵬、元戎啟行在兩周內(nèi)先后宣布VLA(Vision-Language-Action)大模型上車,規(guī)劃幀率從10Hz跳到20Hz,端到端時延壓進100ms?;蛟S就在同時,華為在松山湖實驗室里正演示著,一輛搭載激光雷達的轎車在仿真機里連續(xù)“想象”未來5秒,把自己從暴雨+錐桶+逆行三輪車的死局中救了出來,用的正是WA(World Action)世界模型。
▲圖/小紅書截圖
兩條不同的路線,卻是同樣的終局。VLA讓汽車“開口說話”,WA讓汽車“動腦想象”。誰先把“說話”變成“思考”,誰就在新能源淘汰賽的最后一節(jié)拿到發(fā)球權(quán)。
后端到端時代
在智能駕駛行業(yè)的早期發(fā)展階段,硬件無疑是競爭的核心所在。車企們深知,要想讓車輛具備智能駕駛的能力,首先得讓車輛“看”得見、“聽”得清、“反應”得快。因此,它們在傳感器、芯片等硬件上投入了大量的資金和精力。
傳感器就如同車輛的“眼睛”和“耳朵”,能夠感知周圍的環(huán)境信息。激光雷達、攝像頭、毫米波雷達等不同類型的傳感器各有優(yōu)劣,車企們需要根據(jù)自身的技術路線和成本預算進行選擇和搭配。
芯片則是車輛的“大腦”,負責對傳感器采集到的數(shù)據(jù)進行快速處理和決策。高性能的芯片能夠提供強大的計算能力,支持復雜的算法運行,從而實現(xiàn)更高級的智能駕駛功能。英偉達、英特爾等芯片巨頭,推出的自動駕駛芯片在算力、功耗等方面不斷取得突破,為智能駕駛的發(fā)展提供了有力的支持,自然成了車企們爭相合作的對象。
▲圖/英偉達旗艦智駕芯片Thor
然而在之前的硬件競賽邏輯里,車企們普遍認為“傳感器數(shù)量決定感知能力”,但這種思路很快陷入了高成本與低效率的雙重困境。以激光雷達為例,2020年一顆高性能激光雷達的成本超過1萬美元,搭載3顆激光雷達的車型僅硬件成本就增加3萬美元,這直接導致早期智駕車型的售價普遍超過50萬元,難以進入主流市場。
小鵬P7早期版本因搭載兩顆激光雷達,售價較同配置無激光雷達版本高出8萬元,上市后月銷長期徘徊在3000輛以下,直到推出簡化激光雷達配置的版本才實現(xiàn)銷量突破。
2019年,作為端到端路線的先行者,特斯拉為智能駕駛技術的發(fā)展開辟了一條新的道路。該路線的核心思想是通過大量實際路測數(shù)據(jù)訓練模型,讓車輛直接從傳感器輸入到控制輸出,實現(xiàn)自動駕駛技術的快速迭代。
特斯拉利用其龐大的車隊規(guī)模和廣泛的用戶群體,收集了海量實際路測數(shù)據(jù),這些數(shù)據(jù)涵蓋了各種不同的路況、天氣條件和駕駛場景。再通過對這些數(shù)據(jù)的分析和訓練,自動駕駛模型不斷優(yōu)化和改進,最終實現(xiàn)自動輔助導航駕駛、自動變道、自動泊車等一系列高級功能。
國內(nèi)車企在看到端到端路線的成功之后,隨即紛紛效仿。它們加大了在數(shù)據(jù)采集和模型訓練方面的投入,希望能夠在這場智能駕駛的競賽中占據(jù)一席之地。
不過,端到端路線并非完美無缺,它在處理長尾場景時存在著明顯的局限,比如突然出現(xiàn)的行人、違規(guī)行駛的車輛、惡劣天氣下的道路狀況等。由于這些場景在實際路測中出現(xiàn)的頻率較低,端到端模型很難通過少量的數(shù)據(jù)進行充分的學習和訓練,因此在面對這些情況時往往難以做出準確的判斷和決策。
VLA閃電逆襲
端到端路線的局限,為VLA路線的崛起埋下了伏筆。
2023年底,理想汽車率先提出VLA技術概念,其核心是通過整合視覺、語言、行動三種模態(tài),讓智駕系統(tǒng)像人類一樣“觀察、推理、決策”。
與端到端的“數(shù)據(jù)映射”不同,VLA系統(tǒng)能夠?qū)⒁曈X感知到的信息轉(zhuǎn)化為語言描述,再通過語言模型進行邏輯推理,最后輸出具體的行動指令。
在智能駕駛的賽道上,“先發(fā)優(yōu)勢”曾被視為不可逾越的壁壘。華為早在2019年就推出了ADS(高階智能駕駛系統(tǒng)),憑借激光雷達+高精地圖的組合,一度成為行業(yè)技術標桿;百度Apollo更是從2013年就開始布局智駕,累計投入超過500億元。然而,VLA路線的出現(xiàn),讓理想、小鵬等“后發(fā)者”實現(xiàn)了閃電逆襲,徹底改寫了行業(yè)競爭格局。
理想用戶在日常使用汽車的過程中,車輛會持續(xù)收集各種駕駛數(shù)據(jù),包括道路信息、交通狀況、駕駛行為等。這些數(shù)據(jù)不僅數(shù)量龐大,而且涵蓋了多種不同的場景和情況,為VLA模型的訓練提供了豐富的素材。通過對這些數(shù)據(jù)的分析和挖掘,理想汽車的研發(fā)團隊能夠深入了解用戶的需求和駕駛習慣,針對性地對VLA模型進行優(yōu)化和改進,提高模型的準確性和適應性。
小鵬汽車則在算力方面加大投入,構(gòu)建起強大的云端訓練集群,為VLA模型的高效訓練提供了有力支持。
其研發(fā)團隊可以利用云端訓練集群同時運行多個模型訓練任務,大大提高了訓練效率。此外,云端訓練集群還具有可擴展性,能夠根據(jù)研發(fā)需求隨時增加計算資源和存儲容量,滿足VLA模型不斷迭代和優(yōu)化的需求。
當然,并不是所有玩家都有理想、小鵬的體量。成立于2019年的元戎啟行,2024年只交付了3.4萬輛,卻選擇“All in VLA”。其CEO周光算過一筆賬:做10萬輛車、每車每天跑50公里、回傳率20%,一年就能攢到18億公里數(shù)據(jù),剛好跨過“冷啟動死亡谷”。
為了搶時間,元戎把DeepRoute IO 2.0平臺開放給五家主機廠共享數(shù)據(jù)、共享算力,換取“上車量”。今年8月26日,元戎發(fā)布VLA量產(chǎn)版本,宣稱“Orin-X+征程5”雙芯片方案就能跑通20Hz規(guī)劃幀率,把BOM成本壓到5500元人民幣,比華為MDC 810低32%。對于年銷量較低且資金不充裕的企業(yè)而言,這幾乎是唯一可選的“船票”。周光直言:“VLA讓中小車企第一次有機會用低成本復制頭部體驗,窗口期18個月,錯過就沒了?!?/p>
WA才是終極?
與全民VLA的喧囂不同,華為、蔚來卻選擇了一條更為“激進”的技術路線——WA(World Model,世界模型)。
WA路線的核心邏輯是,讓智駕系統(tǒng)通過云端模擬數(shù)據(jù)構(gòu)建一個“數(shù)字孿生世界”,從而實現(xiàn)對真實世界的深度理解。與VLA的“從數(shù)據(jù)到?jīng)Q策”不同,WA試圖讓系統(tǒng)“先理解世界,再作出決策”,這種思路被不少專家視為智駕的“終極答案”。
華為ADS研發(fā)負責人王軍,曾用一個生動的比喻解釋WA的優(yōu)勢:“如果把智駕系統(tǒng)比作學生,VLA是通過做海量習題來應對考試,遇到?jīng)]見過的題目就會束手無策;而WA是先理解知識點,無論遇到什么新題目,都能通過規(guī)律推導得出答案。”蔚來的李斌也曾在內(nèi)部郵件中稱:“WA讓車擁有‘想象力’,而不是‘記憶力’。”
從理論上看,WA系統(tǒng)能夠從根本上解決VLA系統(tǒng)對數(shù)據(jù)的依賴,尤其是在處理長尾場景時,具備更強的通用性和適應性。
不過,這些優(yōu)勢目前還是基于理論,想要實現(xiàn)商業(yè)化落地,WA路線仍需突破資金、數(shù)據(jù)、模擬與現(xiàn)實平衡的三重考驗,也使其暫時成為了“巨頭專屬”。
構(gòu)建數(shù)字孿生世界,涵蓋硬件設備、軟件研發(fā)、場景建模等多個領域。華為在WA路線上的投入已超過200億元,其中僅數(shù)字孿生平臺的服務器集群就耗資50億元,每年的電力和維護成本高達8億元;蔚來為了研發(fā)WA系統(tǒng),專門成立了 “世界模型實驗室”,截至2024年,累計投入超過150億元,占其總研發(fā)費用的40%。
這種級別的資金投入,將絕大多數(shù)中小車企拒之門外。某新勢力車企創(chuàng)始人曾坦言:“我們不是不想做WA,而是做不起。僅構(gòu)建基礎的數(shù)字孿生場景,就需要至少50億元,這相當于我們3年的研發(fā)預算,根本無法承擔。”相比之下,VLA路線的研發(fā)投入僅為WA的十分之一,更適合資金有限的企業(yè)。
VLA讓汽車先學會“說話”,WA讓汽車再學會“想象”。前者或許是眼下的賽點,后者則可能是三年之后的終點。對于理想、小鵬,VLA是逆襲的通行證;對于華為、蔚來來說,WA是護城河的奠基石。而更多年銷量不過十萬輛的品牌,只能在窗口期里拼命擠上船,哪怕船票是成為“代工廠”。
智駕領域的“終場哨”尚未吹響,真正的終局,屬于那些能把“說話”和“想象”融合成“思考”的玩家。在這場沒有硝煙的戰(zhàn)爭中,只有那些既能把握當下市場需求,又能洞察未來技術趨勢的企業(yè),才能在新能源汽車的淘汰賽中笑到最后。
參考資料:
經(jīng)濟觀察報,《理想的VLA“長征”》
虎嗅,《新一輪智駕PK,邁入實戰(zhàn)時刻》
遠川汽車評論,《讓一部分輔助駕駛先學會思考》
42號車庫,《元戎啟行發(fā)布VLA模型,起點是讓AI學會害怕?》