編者按:本文來自微信公眾號(hào) 遠(yuǎn)川汽車評(píng)論(ID:yuanchuanqiche),編輯:羅松松,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
在比亞迪宣布開啟全民智駕之后,吉利、奇瑞等車企都紛紛跟進(jìn),就連最接地氣的五菱最近也發(fā)布了靈犀智駕。比亞迪創(chuàng)始人王傳福在今年的“百人會(huì)”活動(dòng)上表示:“一旦用了智駕車,就很難回去”。
過去兩年,隨著智駕的覆蓋范圍和能力上限不斷取得突破,加上硬件成本逐年走低,智駕正在從過去錦上添花的賣點(diǎn)成為實(shí)打?qū)嵉漠a(chǎn)品力,而且正在快速下沉,售價(jià)不到10萬的車也能實(shí)現(xiàn)高速領(lǐng)航。
與之呼應(yīng)的是,車企們?cè)谥邱{賽道的比拼已經(jīng)不滿足單點(diǎn)功能如何如何,智駕能不能覆蓋全場景,底層架構(gòu)有沒有延展性,如何平衡“安全、舒適與效率”,成了新的競爭點(diǎn),也是智能電動(dòng)車決勝下半場的關(guān)鍵。
消費(fèi)者對(duì)智駕的需求正倒逼行業(yè)重構(gòu)技術(shù)底座。如何突破傳統(tǒng)架構(gòu)的局限成為了關(guān)鍵。
傳統(tǒng)智駕算法先天不足
智駕,是從簡單的泊車功能慢慢發(fā)展起來的。
車速低不易發(fā)生事故、停車場景數(shù)量有限容易寫規(guī)控算法、封閉環(huán)境對(duì)感知硬件要求不高,泊車功能的這些特征,影響了智駕算法框架的建立,最終形成“感知→規(guī)劃→控制”的基本框架。
感知模塊負(fù)責(zé)收集和處理攝像頭和雷達(dá)等傳感器數(shù)據(jù),然后將其傳給決策模塊,決策模塊根據(jù)信息輸入規(guī)劃路徑或動(dòng)作,再傳給規(guī)控模塊執(zhí)行。
就像在飯店后廚里,洗切、調(diào)味、掌勺、裝盤、上桌,每個(gè)環(huán)節(jié)都有專人負(fù)責(zé),大家配合協(xié)作,用流水線操作的模式,共同完成任務(wù)。
隨后,這一套“先感知,后決策,再控制”的邏輯被應(yīng)用到了高快速路上。雖然相較于泊車,高快速路場景的車速提高了,場景數(shù)量變多了,規(guī)控邏輯復(fù)雜了,但相應(yīng)地,智駕的感知精度、算力大小、算法成熟度和代碼數(shù)量也都提升了不止一個(gè)等級(jí)。從實(shí)際效果來看,智駕在高快速路上的表現(xiàn),還算是游刃有余的。
但隨著智駕應(yīng)用場景的進(jìn)一步開放,由感知、決策、控制三大獨(dú)立模塊共同托舉起來的智駕功能,在復(fù)雜多變的城市道路面前,開始顯得捉襟見肘了。
首當(dāng)其沖的是長尾場景難以覆蓋。
異形交通燈、臨時(shí)交通管制、施工圍擋、被涂抹又重新畫上的道路線、公交車道通行時(shí)間、以及動(dòng)向不可捉摸的行人、非機(jī)動(dòng)車,甚至是流浪動(dòng)物和逆順光線的變化……成千上萬種元素排列組合,構(gòu)成成千上萬種交通路況。
這對(duì)從算法規(guī)則庫來說,簡直就是災(zāi)難——路況無法窮舉,意味著規(guī)則算法永遠(yuǎn)無法完整,意味著,一旦出現(xiàn)以前沒見過的長尾場景,智駕就處于“無例可循”的宕機(jī)狀態(tài),應(yīng)用范圍受限事小,瞎規(guī)劃亂行動(dòng)事大。
其二,存在時(shí)效低,數(shù)據(jù)信號(hào)損耗的問題。
三大模塊之間的數(shù)據(jù)傳輸接口由人定義,有固定數(shù)據(jù)傳遞格式和內(nèi)容。一些可能對(duì)決策有幫助的細(xì)節(jié),會(huì)因?yàn)椴辉谝?guī)范定義范圍內(nèi)而被過濾掉,也就是俗稱的“數(shù)據(jù)損耗”。
比如雷達(dá)和攝像頭探測到的信息經(jīng)過人工算法的簡化處理后,只向規(guī)控模塊提供了前方動(dòng)態(tài)障礙物的速度和車道線邊界,但丟失了道路表面材質(zhì)信息之類(結(jié)冰路面)的細(xì)微差異,這就會(huì)影響車輛緊急制動(dòng)的規(guī)控策略,容易造成剎車不及的追尾事故。
路面結(jié)冰
或者是數(shù)據(jù)在人為定義范圍內(nèi),但模塊之間的信號(hào)傳遞需要時(shí)間,等規(guī)控接收到感知模塊給的信息,已經(jīng)來不及通知控制模塊采取行動(dòng)了。行車噩夢(mèng)“鬼探頭”就是典型例子。
就像功能手機(jī)無法運(yùn)行智能應(yīng)用,以規(guī)則窮舉為底層邏輯的算法規(guī)則庫無法覆蓋所有可能出現(xiàn)的道路情況,模塊拼接的架構(gòu)也無法解決數(shù)據(jù)損耗和實(shí)時(shí)性的瓶頸難題。
先天不足的傳統(tǒng)智駕架構(gòu),已經(jīng)無法滿足如今全民智駕、智駕平權(quán)的切實(shí)需求了。
智駕的“奇異博士”:端到端架構(gòu)
明確問題本質(zhì),是解決問題的前提,車企深諳這個(gè)道理。
根據(jù)《端到端智駕行業(yè)研究報(bào)告》顯示,已經(jīng)有87%的車企啟動(dòng)端到端研發(fā),試圖一次掃清傳統(tǒng)智駕算法的短板和缺陷。
相比傳統(tǒng)智駕算法,只能照本宣科地按照預(yù)設(shè)菜譜(規(guī)則算法庫)做菜,超出菜譜范圍就只能歇菜,端到端大模型架構(gòu),更像是個(gè)全能型廚師,一個(gè)人負(fù)責(zé)所有步驟一個(gè)人就是一個(gè)團(tuán)隊(duì),沒有固定菜譜(人工規(guī)則代碼),靠觀摩各種做菜視頻,慢慢學(xué)習(xí)模仿,自學(xué)成才。
端到端大模型的顛覆性在于其構(gòu)建的“數(shù)據(jù)即算法”閉環(huán)——傳感器獲取的感知數(shù)據(jù)直接輸入端到端大模型。沒有損耗丟失,也不存在人為過濾,避免了重要信息丟失影響決策的可能性。
感知、決策和控制模塊“三合一”,沒了橋接的數(shù)據(jù)鏈路,就不存在系統(tǒng)延時(shí),整體響應(yīng)更加迅速。飽和式投入海量訓(xùn)練集,最大限度地覆蓋長尾場景,徹底解決傳統(tǒng)智駕算法的核心痛點(diǎn)。
同樣是處理“車輛右拐遭遇行人橫穿馬路”的場景,傳統(tǒng)智駕的規(guī)則算法的處理方式是僵硬地遵循“先查看環(huán)境識(shí)別到行人→再思考自車行動(dòng)是剎車還是行車→最后再調(diào)用方向盤和油門剎車”的分布操作。
如果行人有走動(dòng)或其他行為,傳統(tǒng)的規(guī)則算法要么是重復(fù)上述步驟,駕乘人員會(huì)在剎停、啟動(dòng),再剎停、再啟動(dòng)之間搖搖晃晃,毫無體感舒適度;要么就是受規(guī)則限制,索性停車等候,直接影響道路通行效率。
端到端大模型的處理方式就非常擬人,屬于“邊看路邊思考邊動(dòng)方向盤”的下意識(shí)反應(yīng),持續(xù)觀察行人位置,預(yù)判行人動(dòng)態(tài),在接近行人時(shí)提前減速,在和行人保持安全距離后,又及時(shí)加速駛離,整個(gè)過程絲滑流暢,不存在卡頓或急剎急停的情況。
智駕技術(shù)底層邏輯的變化,催生了對(duì)數(shù)據(jù)和算力的全新需求。數(shù)據(jù)處理,模型訓(xùn)練,算力支撐,決定了端到端大模型對(duì)對(duì)復(fù)雜場景的理解能力和決策能力的優(yōu)劣,也決定了智駕水平和用戶體驗(yàn)的下限和上限。
華為云八爪魚智駕云服務(wù)所提供的全鏈路解決方案,正在成為其中重要的賦能者。
智駕的“古一法師”:數(shù)據(jù)
華為云八爪魚智駕云服務(wù)具備多重核心能力:即能為車企提供智駕“超級(jí)工具箱”,又是高質(zhì)量數(shù)據(jù)的“黃金礦工”,還能兼做智駕的虛擬駕校訓(xùn)練師,全流程全方位地為車企的智駕研發(fā)保駕護(hù)航。
智駕的“超級(jí)工具箱”,指的是華為云可以提供一套從數(shù)據(jù)到模型的完整開發(fā)工具。工具箱包里自帶了參考算法和數(shù)據(jù)集,車企可以直接上手,像“搭積木”一樣方便快捷地訓(xùn)練自家的智駕系統(tǒng),無需再投入額外的人力物力,做到“開箱即用,萬物通用”。
智駕的“黃金礦工”,指的是華為云又快又準(zhǔn)的搜索能力。搜索引擎可以從數(shù)百億條數(shù)據(jù)里迅速找到正確且有用的內(nèi)容,投喂給大模型進(jìn)行訓(xùn)練。類似制作“專屬錯(cuò)題集”,針對(duì)薄弱環(huán)節(jié)進(jìn)行專項(xiàng)訓(xùn)練和復(fù)習(xí),直至答出正確答案。
智駕的“虛擬駕?!?,指的是華為云通過生成式AI創(chuàng)造出一個(gè)和現(xiàn)實(shí)相同的道路環(huán)境,再為不同車企的不同智駕系統(tǒng)量身定做海量的“地獄級(jí)難度”考題,對(duì)智駕系統(tǒng)的極限能力進(jìn)行不斷試煉。
在這種虛擬駕校模式下,智駕系統(tǒng)的測試效率比傳統(tǒng)方法快5倍,相當(dāng)于一天測完過去五天的量。也只有從這全程模擬測試的“修羅場”里闖出來的智駕系統(tǒng),才能夠算得上“千錘百煉”。
端到端大模型通過汲取海量數(shù)據(jù)信息自學(xué)成才,靠模仿做到分毫不差,固然是重點(diǎn),知其然又知其所以然,也同樣重要。
尤其在面對(duì)比如僅小車通行標(biāo)識(shí)、公交車道限時(shí)使用標(biāo)識(shí)等復(fù)雜交通標(biāo)識(shí)時(shí),單純模仿歷史數(shù)據(jù)的端到端模型,是無法理解這些標(biāo)識(shí)的含義的,也就更談不上按標(biāo)識(shí)提示規(guī)劃行車路徑。
VLM/VLA融合多模態(tài)解決方案的出現(xiàn),很好地給端到端模型打上了補(bǔ)丁。
作為獨(dú)立系統(tǒng),VLM(Visual-Language Model視覺語言模型)提前對(duì)潮汐車道、公交車道之類的道路標(biāo)志和通用交通規(guī)則等進(jìn)行預(yù)訓(xùn)練。結(jié)合當(dāng)下時(shí)間點(diǎn),判斷是否可以駛?cè)牍卉嚨?,繼而向端到端模型發(fā)出“向左變道避讓”或“直行進(jìn)入公交車道”的指令,再由其生成具體行動(dòng)軌跡。
VLA(Visual-Language-Action Model視覺 - 語言 - 動(dòng)作模型)則更進(jìn)一步,直接融合“看、想、做”三個(gè)動(dòng)作。
華為云的AI訓(xùn)練標(biāo)注功能對(duì)原始數(shù)據(jù)(如圖像、文本、音頻、視頻等)添加注釋或標(biāo)簽,明確指出輸入數(shù)據(jù)的含義,相當(dāng)于“老師在考前給學(xué)生劃知識(shí)重點(diǎn)”,讓車能360度無死角“看”清自車周圍的道路環(huán)境。
大語言模型提前對(duì)抽象的交通標(biāo)志進(jìn)行理解,預(yù)測道路參與者的下一步行動(dòng)意圖,整個(gè)過程完全“類人”,幫助端到端大模型從單純地“依葫蘆畫瓢”直接進(jìn)化成“有思想有邏輯有判斷有預(yù)測”的硅基工具。
在研發(fā)前期,為車企提供趁手的開發(fā)工具;在研發(fā)過程中,為智駕提供海量的有效訓(xùn)練數(shù)據(jù);在檢驗(yàn)驗(yàn)收階段,為車企提供全流程仿真測試,持續(xù)拔高智駕模型的上限。華為云八爪魚智駕云服務(wù)在智駕數(shù)據(jù)方面的能力,可以為車企的智駕研發(fā)帶來持續(xù)加成。
智駕的“法器”:算力
如果說數(shù)據(jù)是智駕的核心燃料,那么算力就是動(dòng)力引擎。
端到端模型的參數(shù)量巨大,計(jì)算密集。單次訓(xùn)練就需要數(shù)千張GPU并行計(jì)算。訓(xùn)練一個(gè)城市NOA模型,就可能需要數(shù)PB數(shù)據(jù)和數(shù)周算力資源。換句話說,算力大小,決定了模型的規(guī)模和復(fù)雜度。
華為昇騰AI云服務(wù)擁有目前國內(nèi)最全的云服務(wù)“組合拳”,三大萬卡智駕集群+昇騰算子+全場景AI框架+工具鏈+大規(guī)模集群訓(xùn)推平臺(tái)。
95%的故障,可在幾分鐘內(nèi)完成監(jiān)測和故障診斷;故障快速恢復(fù)架構(gòu),能夠在30分鐘內(nèi)完成自我修復(fù),成功率高達(dá)95%;大模型長穩(wěn)訓(xùn)練能實(shí)現(xiàn)40天不中斷,相比業(yè)內(nèi)千億參數(shù)模型訓(xùn)練平均2.8天無中斷的數(shù)據(jù),穩(wěn)定性翻了14倍。
澎湃算力和超強(qiáng)穩(wěn)定性,是昇騰AI云服務(wù)向車企用戶做出的承諾。
在不改變用戶使用習(xí)慣的前提下,全流程的昇騰遷移工具鏈,能夠支持主流場景算法快速遷移,可提供專業(yè)服務(wù),從環(huán)境準(zhǔn)備、模型開發(fā)遷移、到精度對(duì)齊、模型調(diào)優(yōu)等環(huán)節(jié)上,幫助車企將算法從英偉達(dá)“無感遷移”到昇騰上。
同時(shí),華為云還設(shè)有業(yè)界首個(gè)汽車數(shù)據(jù)安全合規(guī)的汽車專區(qū),可以支持國內(nèi)多個(gè)資質(zhì)圖商協(xié)同服務(wù)。嚴(yán)格遵循“物理隔離、公網(wǎng)隔離、數(shù)據(jù)不出云”的管控要求,符合測繪級(jí)合規(guī)要求,能為車企徹底解除數(shù)據(jù)隱私和合規(guī)性方面的后顧之憂。
尾聲
技術(shù)革新,往往帶來腥風(fēng)血雨的產(chǎn)業(yè)權(quán)力更替,但智能駕駛領(lǐng)域,開放融合、協(xié)作發(fā)展才是主旋律。
華為云始終以開放姿態(tài)攜手各方生態(tài)伙伴,圍繞國產(chǎn)工具鏈自主可控和大模型應(yīng)用進(jìn)行聯(lián)合創(chuàng)新。生態(tài)伙伴間的每一次協(xié)作,都是對(duì)端到端智駕模型技術(shù)閉環(huán)的補(bǔ)全,更是對(duì)國產(chǎn)智駕生態(tài)筋骨的打磨。
在工具鏈層面,華為云將昇騰AI云服務(wù)、全場景AI框架、遷移工具鏈等核心能力與伙伴共享,助力車企構(gòu)建自主可控的研發(fā)體系;
在大模型應(yīng)用領(lǐng)域,和圖商(四維圖新),智駕方案商(禾多科技)等伙伴一起,依托華為云的算力和云計(jì)算能力,讓地圖數(shù)據(jù)標(biāo)注、仿真場景搭建、算法訓(xùn)練糾錯(cuò)等環(huán)節(jié)的效率大幅提升。
華為云和生態(tài)伙伴攜手并進(jìn),組成了智能駕駛領(lǐng)域的“超級(jí)賦能團(tuán)”,讓端到端大模型從“能用”變得“好用”,推動(dòng)車企完成從“造車”到“造智能”的跨越,打造了一個(gè)全新的,共贏的智駕生態(tài)圈。
本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn),不代表創(chuàng)業(yè)邦立場,轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問,請(qǐng)聯(lián)系editor@cyzone.cn。