电竞比分网-中国电竞赛事及体育赛事平台

分享

新一輪智駕PK,邁入實戰(zhàn)時刻

 大智若愚wxy 2025-08-28 發(fā)布于重慶
新一輪智駕PK,邁入實戰(zhàn)時刻

打開今日頭條查看圖片詳情

出品丨虎嗅汽車組

作者丨李賡

頭圖丨AI生成

如果不是年初官方按下智駕宣傳的“急停鍵”,近期“智駕”或許早已再次被炒上了天。

原因無他,只因中國最頭部的一批智駕勢力,幾乎都選擇了在近期落地自己最新的智駕能力:

  • 理想汽車借i8上市,推送 “VLA 司機大模型”;

  • Momenta攜手智己,完成R6飛輪大模型上車;

  • 元戎昨天(8月26日)發(fā)布了自己的VLA大模型;

  • 小鵬今天(8月27日)的新P7發(fā)布會上發(fā)布自己全新的VLA大模型;

  • 華為透露9月即將推送的ADS 4。

如此整齊劃一的步調(diào),不禁讓人想起上一次“端到端”模型引領(lǐng)的行業(yè)浪潮。但這一次,變革的深度與廣度,已有過之而無不及。這輪競賽為何集中爆發(fā)?各家命名不同的模型背后,隱藏著怎樣的技術(shù)分野?新一代智駕,究竟“聰明”在了哪里?

本期《智駕雷達》VOL.5,我們就來提前“縱覽”一下智駕圈即將發(fā)生的這一輪競賽,并嘗試為你先講清楚其中的脈絡(luò)。

新一輪智駕競賽,時候到了

首先是第一個問題:為什么行業(yè)內(nèi)的動作如此集中?虎嗅汽車綜合多家智駕勢力的信息,總結(jié)出了四大關(guān)鍵驅(qū)動力:

  • 監(jiān)管加強和輿情時間拖后了部分公司的既定節(jié)奏;

  • 各家公司智駕技術(shù)和產(chǎn)品,最底層是AI最底層的創(chuàng)新突破,時間起點相近;

  • 將AI底層技術(shù)套用到智駕上,需要相當多的訓練和調(diào)整投入,需要的時間周期相對固定;

  • 各家公司都看到了這一輪智駕能力提升的潛力,對其他家優(yōu)先發(fā)布技術(shù)和產(chǎn)品擔心,基本都選擇了先發(fā)布“基礎(chǔ)版”再優(yōu)化的思路。

其中最重要的必然是第4點。元戎啟行CEO周光在昨天的發(fā)布會上就專門表示:VLA模型(當前版本)的下限已超過端到端(可以簡單理解為2024年中的大模型技術(shù)水平)的上限,未來會越來越好。

新一輪智駕PK,邁入實戰(zhàn)時刻

打開今日頭條查看圖片詳情

注:E2E 1.0模型可以看到中間的模型部分存在“分塊”,對應E2E 2.0的VLA模型則為一體

周光也在現(xiàn)場通過PPT解釋出了這個趨勢的底層原因:相比第一代“端到端”,VLA大模型實際上去掉了規(guī)控時代留下的“環(huán)節(jié)”(不再在大模型中劃分感知、定位導航、預測、規(guī)劃等環(huán)節(jié)),不再是單個環(huán)節(jié)內(nèi)一個CNN模型,最后再將多個模型拉通形成一個“大模型”。而是從傳感器到控制端只有一個完整的模型。

其次是模型本身從CNN(早期AI圍棋、人臉識別等應用的底層技術(shù))為底層核心升級為Transformer(就是GPT等大語言模型崛起的核心底層技術(shù))為核心,大幅提升了智駕大模型對人類大腦的模仿學習能力。

新一輪智駕PK,邁入實戰(zhàn)時刻

打開今日頭條查看圖片詳情

相比智駕行業(yè)上一輪普及的VLM大模型,VLA大模型在架構(gòu)和能力上更貼近智駕能力的需求

這種技術(shù)深層次的改變,讓VLA具備了思維鏈(CoT)能力,模型本身不再是一個從感知輸入(視覺)到控制輸出(行為)的 “黑箱”,而是通過引入語言作為媒介,模仿人類駕駛員的思考模式,將復雜的駕駛決策分解為一系列連貫、有邏輯的中間推理步驟。

同是端到端模型,VLA也獲得了能力上的大幅提升:

  • 增強決策的邏輯性和可靠性:面對復雜或罕見的(長尾)路況,具備Cot能力的VLA模型能夠一步步分析:“識別校車,需減速慢行”>“檢測到路邊兒童,存在突然橫穿馬路的風險”>“綜合判斷。這種分步推理遠比單一的、直覺式的端到端輸出更為可靠和安全;


  • 提升系統(tǒng)的可解釋性和透明度:Cot將模型的決策依據(jù)以人類可以理解的語言形式展現(xiàn)出來。極大地幫助了研發(fā)人員進行模型的調(diào)試和優(yōu)化,也為事故追溯、責任界定提供了清晰的依據(jù),從而增強了用戶和監(jiān)管機構(gòu)對自動駕駛系統(tǒng)的信任;


  • 提升模型的泛化能力和處理復雜場景的能力:通過在海量數(shù)據(jù)中學習推理邏輯,Cot使得VLA模型能夠舉一反三,將學到的駕駛知識和常識應用到從未見過的新場景中。它不再是單純地記憶駕駛行為,而是學會了“如何思考”,讓應對現(xiàn)實世界中層出不窮的復雜交通狀況成為了可能。

除了VLA路線,目前華為和蔚來主推的是另一條路線:世界模型。后者雖然更強調(diào)“海量使用云端模擬的數(shù)據(jù)、來讓大模型'理解’世界而學會駕駛”,但其最底層的世界模型仍需要Transformer技術(shù)驅(qū)動。華為此前在和和浙大、港科大的相關(guān)科研成果中,多次提到這一點。

新一代模型,讓AI“學會害怕”?

理論上的強大,最終要靠體驗說話。在對元戎啟行VLA模型的實際測試中,最令人印象深刻的,是其“防御性駕駛”能力的提升。

周光用了一個非常人性化的詞來形容這種能力——“讓AI學會害怕”。這種“害怕”并非遲疑,而是一種高級的智能表現(xiàn):像人類駕駛員一樣,對潛在風險保持先驗性的警覺。

新一輪智駕PK,邁入實戰(zhàn)時刻

打開今日頭條查看圖片詳情

右下角為VLA模型的CoT運行界面,包含對環(huán)境的文字定義、推理和決策(下同)

在深圳常見的立交橋下輔道,人車混行,視野狹窄,VLA模型會持續(xù)進行自我推理,主動將車速降至絕對安全的范圍。

新一輪智駕PK,邁入實戰(zhàn)時刻

打開今日頭條查看圖片詳情

在被花壇遮擋視線的路口,當感知到對向車道有電瓶車高速駛來,它的駕駛決策會立刻從“控速”升級為“主動降速”,預留出足夠的反應空間。

新一輪智駕PK,邁入實戰(zhàn)時刻

打開今日頭條查看圖片詳情

在丁字路口的匯入場景,VLA也能在沒有駛?cè)肼房谥?,提前分析識別,降低車速再進行匯入車流的動作,避免因為車速過快導致車輛被迫拐入其他車道。

新一輪智駕PK,邁入實戰(zhàn)時刻

打開今日頭條查看圖片詳情

在老城區(qū)復雜的十字路口,它能綜合天氣、路邊違停、行人動態(tài)等信息,推理出潛在風險,以一種近乎“敬畏”的姿態(tài),緩慢而安全地通過。

總而言之,新模型的體驗提升并非體現(xiàn)在某個單一功能上,而是一種綜合性的飛躍——更順滑的控車、更果斷的反應和貫穿全程的“安全感”。盡管在極端場景(全程共兩次,一次是在盲區(qū)狀況下低速變道遇到了施工路段,另一次是路口臨停車多導致轉(zhuǎn)向過晚)下仍需人類接管,但那種駕駛時“心里有底”的信任感,是此前任何系統(tǒng)都難以給予的。

值得一提的是,因為文字指令的關(guān)系,這套智駕系統(tǒng)已經(jīng)可以用語音進行基礎(chǔ)性的操作,例如“請開快、開慢一點”等指令能夠被系統(tǒng)接收,并以決策的形式給到操縱端。VLA也已經(jīng)可以直接讀取交通標識上的文字說明,并且按照指示優(yōu)化駕駛(例如有些路口左轉(zhuǎn)紅燈可以進待行區(qū))。

接下來的智駕競賽,將會如何展開?

在昨天的發(fā)布會交流環(huán)節(jié)上,周光自己表示:VLA目前還沒有完全實現(xiàn)思維鏈(CoT),目前這一技術(shù)路線的得分也只是到6而已(滿分10分),還有大量的優(yōu)化要做。

接下來的主要任務主要是兩項,一是持續(xù)收集和豐富自有測試車隊、量產(chǎn)車數(shù)據(jù),以及生成數(shù)據(jù);另一個是看清技術(shù)趨勢,持續(xù)完善VLA的后訓練,不斷優(yōu)化大模型的表現(xiàn)。

對于行業(yè)接下來的發(fā)展,周光也提了一些觀點,其中最重要的三點是:

  • VLA的成本差異主要在芯片,具體的成本差異不確定,但目前來看15萬元以上的車型都可以適配,10萬元級別的車型通過優(yōu)化也有機會搭載;


  • 早期的智駕芯片主要針對CNN設(shè)計優(yōu)化,VLA模型應用之后,芯片一定會加強對Transformer的支持,尤其是在FP4、FP6等精度的算力優(yōu)化上;


  • 如果車企或供應商想自研輔助駕駛系統(tǒng),也很難跳過從規(guī)則算法、端到端1.0到VLA模型的過程,每個發(fā)展過程有自己的Know-How。頂多可以壓縮某些階段的時間,但不可能完全繞過。

如何讓AI真正地“理解”并“敬畏”真實世界,從“會開車”到“會思考”,智駕技術(shù)和產(chǎn)品正悄然邁入一個新的實戰(zhàn)時刻。

本文來自虎嗅,原文鏈接:
https://www.huxiu.com/article/4742364.html?f=jinritoutiao

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多