來(lái)源丨創(chuàng)業(yè)邦(ID:ichuangyebang)
作者丨潘磊
編輯丨海腰
圖源丨midjourney
“今天L4公司都在痛苦地猶豫是否該轉(zhuǎn)入端到端,我個(gè)人的建議是別猶豫,趕緊改,后面那個(gè)才是大家伙”。
這是小鵬汽車(chē)董事長(zhǎng)何小鵬,最近從美國(guó)考察游歷一番后,對(duì)智駕進(jìn)入“端到端時(shí)代”的最新判斷。
在大約兩周前的小鵬汽車(chē)技術(shù)發(fā)布會(huì)上,何小鵬更是興奮地宣布,2024年就是智能駕駛的拐點(diǎn)。
他認(rèn)為,“大模型+端到端”已經(jīng)把智駕能力進(jìn)展從以前的按“年”計(jì)算,提升到按天計(jì)算。
換句話說(shuō),這就是對(duì)智駕領(lǐng)域的一次洗牌,要么跟上,要么出局。
何小鵬從特斯拉獲得啟發(fā)符合邏輯——事實(shí)上正是特斯拉FSD在去年率先搞出“端到端”技術(shù)方案,并把這個(gè)看上去晦澀難懂的術(shù)語(yǔ)變成了智駕圈的流行語(yǔ)。
所謂“端到端”,就是把之前與自動(dòng)駕駛有關(guān)的感知、決策和執(zhí)行等相對(duì)分散的核心模塊整合在一起,從傳感器端輸入信號(hào)開(kāi)始,中間經(jīng)歷一個(gè)AI大模型,再到輸出端發(fā)出信號(hào)控制車(chē)輛。
這就及其考驗(yàn)?zāi)莻€(gè)能夠搞定“感知決策執(zhí)行一體化”的AI大模型的水平。
作為一個(gè)“學(xué)習(xí)系統(tǒng)”,貫通感知決策執(zhí)行的AI大模型,能夠通過(guò)從傳感器獲得的原始數(shù)據(jù)中不斷“學(xué)習(xí)”,并自動(dòng)生成人們想要的那種結(jié)果輸出。
這被認(rèn)為智能駕駛“擬人化”的開(kāi)始。
在特斯拉FSD V12版本之前,這種智駕系統(tǒng)擁有和其他同類(lèi)系統(tǒng)差不多的通病——比如在復(fù)雜路況中,智駕系統(tǒng)突如其來(lái)的剎車(chē)會(huì)帶來(lái)一種明顯的“機(jī)械感”,從而讓用戶(hù)恐慌。
但是到了引入端到端的V12版本后,這套系統(tǒng)看上去擁有了一些“博弈”能力,比如能夠更加絲滑地應(yīng)對(duì)加減速和轉(zhuǎn)向控制。
而在這之前,智駕系統(tǒng)每遇到一個(gè)場(chǎng)景,就需要工程師專(zhuān)門(mén)通過(guò)代碼給出解決方案,然后才能搞定一個(gè)所謂的Corner case。
FSD V12版本引入端到端后,相當(dāng)于擁有了一定的自我學(xué)習(xí)能力,工程師無(wú)需再為無(wú)法預(yù)知、無(wú)法窮盡的Corner case逐個(gè)編寫(xiě)代碼了,所以代碼從30多萬(wàn)行縮減為僅有3000多行。
何小鵬說(shuō),他相信2025年就將是完全自動(dòng)駕駛的“ChatGPT 時(shí)刻”。
中國(guó)車(chē)企早已開(kāi)始跟風(fēng)端到端
“小鵬是全球唯二實(shí)現(xiàn)端到端大模型量產(chǎn)落地的車(chē)企”。
在7月底的“小鵬汽車(chē)AI智駕技術(shù)發(fā)布會(huì)”上,何小鵬表示,“端到端大模型”讓小鵬智駕技術(shù)進(jìn)步實(shí)現(xiàn)了前所未有的加速?!懊?天迭代一次版本”。
此時(shí)距離小鵬汽車(chē)官宣智駕進(jìn)入端到端時(shí)代僅2個(gè)月。
但看上去,小鵬正在加速把智駕系統(tǒng)從“全國(guó)都能開(kāi)”,進(jìn)化成“全國(guó)都好用”,即不限城市、不限路線、不限路況。
這是一個(gè)驚人的躍遷。
因?yàn)樵谶@之前,智駕系統(tǒng)的PK,基本都是圍繞“開(kāi)城”來(lái)展開(kāi)。
“開(kāi)城”的本質(zhì)是,車(chē)企的智駕技術(shù)人員在目標(biāo)城市完成場(chǎng)景數(shù)據(jù)收集和填充,然后“灌進(jìn)”智駕系統(tǒng),從而實(shí)現(xiàn)城市NOA(領(lǐng)航輔助駕駛)。
但這種高階輔助駕駛上限很低,很難上升到L3或者更高級(jí)別。
因?yàn)榇嬖诓簧傩枰祟?lèi)接管的場(chǎng)景,比如小區(qū)內(nèi)部、收費(fèi)站等。
解決這類(lèi)問(wèn)題,就需要工程師根據(jù)特定場(chǎng)景寫(xiě)代碼,從而解決所謂的Corner case。
顯而易見(jiàn),這種場(chǎng)景無(wú)窮無(wú)盡。
何小鵬說(shuō),在這種規(guī)則下,智能駕駛再搞十年也看不到盡頭。
但引入端到端和大模型之后,這個(gè)瓶頸迎刃而解。
小鵬為此調(diào)整了組織架構(gòu),以更加聚焦于端到端+大模型的組合。
跟何小鵬的看法類(lèi)似還有理想汽車(chē)董事長(zhǎng)兼CEO李想。
他在今年6月初的2024中國(guó)汽車(chē)重慶論壇上提出了一個(gè)問(wèn)題,即人類(lèi)開(kāi)車(chē)為什么不涉及學(xué)習(xí)Corner case?
在他看來(lái),如果不解決這個(gè)問(wèn)題,那么自動(dòng)駕駛團(tuán)隊(duì)每天干的活,就是靠人工去調(diào)試各種Corner case,而且會(huì)發(fā)現(xiàn)你放的人越多,Corner case就越多,距離實(shí)現(xiàn)真正的自動(dòng)駕駛就越遠(yuǎn)。
他給出的方案也是端到端加上VLM視覺(jué)語(yǔ)言模型,以及一個(gè)生成式世界模型組成的全新自動(dòng)駕駛技術(shù)架構(gòu)。
李想表示,這是理想在過(guò)去一段時(shí)間內(nèi),最重要的一個(gè)技術(shù)突破。
基于此,理想汽車(chē)將會(huì)在今年三季度向所有用戶(hù)正式推送全國(guó)無(wú)圖NOA。
他還相信,無(wú)監(jiān)督的L4級(jí)自動(dòng)駕駛至少3年內(nèi)就能實(shí)現(xiàn)。
理想也成立了“端到端自動(dòng)駕駛”實(shí)體組織,據(jù)稱(chēng)整體規(guī)模超過(guò)200人。
蔚來(lái)汽車(chē)也把感知和規(guī)控團(tuán)隊(duì)合并為大模型團(tuán)隊(duì),探索用端到端和世界大模型實(shí)現(xiàn)高階智能駕駛。
梳理來(lái)看,這些變化都發(fā)生在今年年初特斯拉發(fā)布FSD V12版本之后,也意味著特斯拉率先引入的端到端大模型技術(shù)再次引領(lǐng)智駕新趨勢(shì)。
另外,華為在去年9月就發(fā)布了“盤(pán)古汽車(chē)大模型”,可在數(shù)字孿生空間生成復(fù)雜場(chǎng)景樣本,讓自動(dòng)駕駛學(xué)習(xí)訓(xùn)練周期從2周以上縮短到2天內(nèi)。
再次陷入Corner case怪圈?
特斯拉FSD的最新版本為中國(guó)車(chē)企提供了有關(guān)端到端和大模型的啟示,實(shí)現(xiàn)自動(dòng)駕駛的路徑近在眼前。
這讓“摸著特斯拉的石頭過(guò)河”,再次成為可能。
但其中的問(wèn)題在于,特斯拉究竟是如何做到這一點(diǎn)的,卻是一個(gè)不傳之秘。
何小鵬坦承,大模型迭代過(guò)程中會(huì)出現(xiàn)“不穩(wěn)定”現(xiàn)象。
在5月份,他也提到了有關(guān)“端到端”的不確定性。
他認(rèn)為所有大模型上都有不確定因素,重要的是如何去構(gòu)建你的控制器,就像控制剎車(chē)一樣,構(gòu)建針對(duì)黑盒的安全系統(tǒng)。
看上去即便是端到端,也在進(jìn)入一個(gè)更加復(fù)雜化,甚至是自我束縛的囚徒困境。
這甚至已經(jīng)從特斯拉CEO埃隆·馬斯克處獲得了證實(shí)。
6月中旬的特斯拉2024年年度股東大會(huì)上,馬斯克承認(rèn)FSD面臨新的挑戰(zhàn)。
他稱(chēng),改進(jìn)一個(gè)模型可能解決一個(gè)問(wèn)題,但同時(shí)可能引入一個(gè)新問(wèn)題。
看上去,這跟引入端到端之前的那種Corner case無(wú)法完全解決的情況很接近。
而且隨著人類(lèi)接管的減少,評(píng)估模型性能的難度在增加。
這是另一個(gè)悖論——接管減少表明性能優(yōu)秀,但另一方面也表明隨著模型變“大”,其更新也將會(huì)變慢,表現(xiàn)得不像一個(gè)能給自動(dòng)駕駛帶來(lái)顛覆性變革的路徑。
而最近公布的一個(gè)交通事故表明,特斯拉的一臺(tái)車(chē)在開(kāi)啟FSD模式下撞死了一個(gè)摩托車(chē)手。
就在7月底,Truist Securities分析師威廉·斯坦因在體驗(yàn)特斯拉FSD時(shí)險(xiǎn)些撞車(chē)。
巧合的是,華為終端董事長(zhǎng)、智能汽車(chē)解決方案BU董事長(zhǎng)余承東近日也表示,F(xiàn)SD上限挺高,但下限也很低。
另外,前圖森未來(lái)創(chuàng)始人,現(xiàn)Bot.Auto創(chuàng)始人侯曉迪近期也針對(duì)端到端,發(fā)表了一些不一樣的觀點(diǎn)。
侯曉迪認(rèn)為,端到端是一種新思路,但是否為最先進(jìn),目前尚無(wú)定論。
同時(shí),端到端的“技術(shù)黑盒”具有不可解釋性,無(wú)法帶來(lái)確定的安全感。
基于此,端到端并非一個(gè)一頭輸入信息,另一頭就能輸出結(jié)果的“自動(dòng)工廠”,還具有不確定性,不要過(guò)度神話。
極越CEO夏一平則認(rèn)為,現(xiàn)在還沒(méi)有100%的端到端,都是營(yíng)銷(xiāo)噱頭。
端到端背后
是包括算力在內(nèi)的體系PK
根據(jù)馬斯克的說(shuō)法,預(yù)計(jì)今年年底將會(huì)在中國(guó)和歐洲落地FSD。
其實(shí)在這之前,有關(guān)FSD將會(huì)成為智駕領(lǐng)域“鯰魚(yú)”的說(shuō)法就已經(jīng)層出不窮。
但從中國(guó)主流車(chē)企對(duì)“端到端”的追隨來(lái)看,F(xiàn)SD已經(jīng)開(kāi)始對(duì)中國(guó)智駕的技術(shù)路線產(chǎn)生深遠(yuǎn)影響。
這也再次驗(yàn)證了特斯拉的視覺(jué)方案更加接近“第一性原理”——正如李想所說(shuō),人類(lèi)駕車(chē)就不涉及學(xué)習(xí)Corner case的問(wèn)題。
因?yàn)槿搜劬皖?lèi)似于傳感器,大腦作為神經(jīng)網(wǎng)絡(luò)對(duì)接收到的信號(hào)進(jìn)行推理判斷后,做出反應(yīng)并執(zhí)行。
車(chē)路云一體化,以及高精地圖方案,也因此都有各自的短板。
到目前為止,特斯拉還未使用激光雷達(dá)。
對(duì)此余承東表示,特斯拉的優(yōu)點(diǎn)在于車(chē)輛多、數(shù)據(jù)多,F(xiàn)SD做的不錯(cuò)。
但經(jīng)過(guò)在美國(guó)和加拿大的測(cè)試對(duì)比后,他認(rèn)為華為的體驗(yàn)略?xún)?yōu)一些。
“特斯拉沒(méi)用激光雷達(dá),我們用了,彌補(bǔ)了感知能力”。
目前華為備受關(guān)注的ADS3.0也是端到端“類(lèi)人”智駕,采用的是GOD感知神經(jīng)網(wǎng)絡(luò),以及 PDP(Prediction-Decision- Planning, 預(yù)測(cè)決策規(guī)控)決策規(guī)劃網(wǎng)絡(luò),這被稱(chēng)為兩段式端到端。
跟特斯拉FSD輸入傳感器數(shù)據(jù),直接輸出路徑規(guī)劃的一個(gè)模型相比,華為的“兩段式”端到端區(qū)分了感知和規(guī)控,更容易定位,從而增加了可解釋性。
但真正具有顛覆性的自動(dòng)駕駛技術(shù)架構(gòu)終局,就是生成式端到端大模型。
這對(duì)于包括算力在內(nèi)的基礎(chǔ)設(shè)施來(lái)說(shuō),是一個(gè)極大的考驗(yàn)。
對(duì)于特斯拉來(lái)說(shuō),逡巡多年才實(shí)現(xiàn)端到端多模塊融合的背后,是其DOJO超算中心高達(dá)35000塊英偉達(dá)H100GPU的算力資源。
根據(jù)馬斯克的說(shuō)法,到今年年底特斯拉將擁有8.5萬(wàn)塊英偉達(dá)H100GPU用于訓(xùn)練人工智能。
換句話說(shuō),特斯拉FSD端到端的背后,是一個(gè)巨型體系在支撐。
何小鵬表示,他已經(jīng)在AI訓(xùn)練上投入了35億費(fèi)用。
但作為對(duì)比,馬斯克聲稱(chēng)今年將花費(fèi)100億美元用于AI的訓(xùn)練和推理,光是向英偉達(dá)購(gòu)買(mǎi)AI芯片就要花費(fèi)30--40億美元。
他甚至表示,任何支出達(dá)不到每年100億美元水平或者無(wú)法高效部署的公司,都無(wú)法在市場(chǎng)上競(jìng)爭(zhēng)。
按他的標(biāo)準(zhǔn),沒(méi)有任何一家中國(guó)車(chē)企能夠跟特斯拉競(jìng)爭(zhēng)。
這很大程度上屬于事實(shí)——中國(guó)車(chē)企甚至連H100GPU都無(wú)法買(mǎi)到。
華為顯然能夠提供一些替代品,這也為未來(lái)的自動(dòng)駕駛時(shí)代競(jìng)爭(zhēng)提供了足夠的懸念。
本文為創(chuàng)業(yè)邦原創(chuàng),未經(jīng)授權(quán)不得轉(zhuǎn)載,否則創(chuàng)業(yè)邦將保留向其追究法律責(zé)任的權(quán)利。如需轉(zhuǎn)載或有任何疑問(wèn),請(qǐng)聯(lián)系editor@cyzone.cn。