下載客戶端

登錄

智能駕駛的中場戰(zhàn)事，如何降本增效穿越周期？

2025-01-09 16:52

來源：澎湃新聞·澎湃號·湃客

80%的數(shù)據(jù)+20%的模型=更好的AI。

這是人工智能領(lǐng)域權(quán)威學(xué)者、斯坦福大學(xué)計(jì)算機(jī)科學(xué)教授吳恩達(dá)（Andrew Ng）在他45歲生日當(dāng)天提出的人工智能“二八定律”。他表示，“如果我們80%的工作是數(shù)據(jù)準(zhǔn)備，那么確保數(shù)據(jù)質(zhì)量是人工智能團(tuán)隊(duì)的重要工作?！?/p>

由此延伸至端到端智能駕駛領(lǐng)域，智駕這盤菜看起來誘人，但車企想要吃到嘴里并沒有那么容易，這既要有數(shù)據(jù)作為原料食材，也要有算力燃料把火燒得旺，還要配合算法的烹調(diào)。優(yōu)質(zhì)的數(shù)據(jù)和充足的算力是一切技術(shù)迭代升級的先決條件，沒有好的食材和火候，再先進(jìn)的算法也無法發(fā)揮出最大效用。

當(dāng)智駕迎來最為關(guān)鍵的中場戰(zhàn)事，行業(yè)的重心不再是招募更多頂級的工程人才，而切換到模型設(shè)計(jì)、工具鏈開發(fā)以及模型的測試驗(yàn)證上。一個(gè)非常明顯的現(xiàn)象是，業(yè)界曾經(jīng)以團(tuán)隊(duì)規(guī)模作為描述先進(jìn)性的一項(xiàng)指標(biāo)，而到了2024下半年，行業(yè)比拼的關(guān)鍵指標(biāo)變成了云端算力和數(shù)據(jù)質(zhì)量。

從2023年的開城大戰(zhàn)，到2024年的“車位到車位”大戰(zhàn)，這其中如何形成數(shù)據(jù)閉環(huán)成？如何建好算力“蓄水池”？如何最大化利用數(shù)據(jù)和算力資源并實(shí)現(xiàn)最優(yōu)算法？都是車企決勝智駕下半場必須要解決的問題。

“冰山之下”的數(shù)據(jù)閉環(huán)能力

端到端下的智能駕駛技術(shù)，是數(shù)據(jù)和算力的合謀。

隨著智駕系統(tǒng)中感知定位、決策規(guī)劃和控制模塊的實(shí)現(xiàn)方式由基于規(guī)則的代碼向AI模型轉(zhuǎn)變，智駕系統(tǒng)開發(fā)范式也從規(guī)則驅(qū)動(dòng)逐漸過渡到了數(shù)據(jù)驅(qū)動(dòng)，當(dāng)系統(tǒng)越來越依賴數(shù)據(jù)驅(qū)動(dòng)，意味著數(shù)據(jù)閉環(huán)對智駕系統(tǒng)越來越關(guān)鍵了。

所謂數(shù)據(jù)閉環(huán)，是從數(shù)據(jù)采集、存儲(chǔ)、挖掘、標(biāo)注到模型訓(xùn)練、仿真驗(yàn)證、集成部署的整個(gè)開發(fā)工作流。數(shù)據(jù)閉環(huán)完成的是對數(shù)據(jù)價(jià)值的提取工作，其本質(zhì)是將隱藏在一個(gè)又一個(gè)駕駛數(shù)據(jù)片段中的人類駕駛知識慢慢地遷移到智駕系統(tǒng)模型的參數(shù)文件里，從而使智駕系統(tǒng)的表現(xiàn)更加趨向擬人化，大幅提升駕駛體驗(yàn)的自然性和舒適性。

從數(shù)據(jù)閉環(huán)發(fā)展階段看，在第一階段，智能駕駛技術(shù)主要采取硬件驅(qū)動(dòng)的方式進(jìn)行研發(fā)，數(shù)據(jù)閉環(huán)概念初現(xiàn)。進(jìn)入第二階段，算法和軟件的重要性不斷提升，智能駕駛開始嘗試采用小模型、基于規(guī)則驅(qū)動(dòng)的方法來解決智能駕駛問題。隨著智駕技術(shù)的提升，智駕系統(tǒng)對于數(shù)據(jù)的需求劇增，其優(yōu)化對數(shù)據(jù)閉環(huán)的要求越來越高，因此數(shù)據(jù)閉環(huán)已逐漸進(jìn)入由數(shù)據(jù)驅(qū)動(dòng)的第三階段。

對于端到端智駕系統(tǒng)所需要的數(shù)據(jù)，特斯拉曾給出過一些判斷標(biāo)準(zhǔn)：一個(gè)端到端自動(dòng)駕駛訓(xùn)練至少需要100萬個(gè)、分布多樣、高質(zhì)量的視頻片段才能正常工作。如果片段達(dá)到1000萬個(gè)，系統(tǒng)能力會(huì)變得難以置信。

理想表示，最晚今年年初，會(huì)推出大概超過1000萬個(gè)片段訓(xùn)練出來的端到端+VLM。前段時(shí)間小鵬智駕負(fù)責(zé)人也公開表示，小鵬端到端模型的訓(xùn)練數(shù)據(jù)量已達(dá)到2000萬個(gè)片段。

當(dāng)前，車企和智駕企業(yè)獲取數(shù)據(jù)主要有兩種方式：

一是從量產(chǎn)車上挖掘。比如針對車企賣出的幾十萬臺(tái)車，工程師會(huì)寫下專門規(guī)則，如果用戶的駕駛行為符合條件，特定數(shù)據(jù)（經(jīng)過脫敏處理）會(huì)被上傳。車企用戶也可以主動(dòng)上傳一些特別案例。

二是在存量數(shù)據(jù)中挖掘數(shù)據(jù)。在早期智駕還不成熟的階段，車企和智駕企業(yè)往往積累大量數(shù)據(jù)，很多都是無效數(shù)據(jù)，工程師只能通過一些算法規(guī)則來挖取。

高質(zhì)量數(shù)據(jù)作為養(yǎng)料，會(huì)決定智駕系統(tǒng)迭代的質(zhì)量，也持續(xù)考驗(yàn)著車企的智駕自動(dòng)化閉環(huán)能力。

最近幾年，隨著量產(chǎn)車的規(guī)模化落地，很多車企都開始轉(zhuǎn)向采用量產(chǎn)車的影子模式采集數(shù)據(jù)，但這種模式依然面臨艱巨的挑戰(zhàn)。

首先，是采集策略問題，即如何平衡數(shù)據(jù)的長尾問題（有效性）和數(shù)據(jù)的規(guī)模問題（成本）。如果采集策略比較寬松，往往采集回來的數(shù)據(jù)大部分是垃圾數(shù)據(jù)，根本沒有使用價(jià)值；如果采集策略過于嚴(yán)格，又擔(dān)心丟失大量有價(jià)值的數(shù)據(jù)。

其次，是數(shù)據(jù)質(zhì)量問題，如何定義數(shù)據(jù)質(zhì)量是個(gè)艱巨的產(chǎn)品問題，“壞數(shù)據(jù)”（不熟練的駕駛、糟糕的駕駛習(xí)慣、違反交通規(guī)則等）會(huì)向下拖曳大模型的訓(xùn)練效果。因此，如何精準(zhǔn)地挑選出高質(zhì)量的數(shù)據(jù)又是一個(gè)復(fù)雜的技術(shù)問題。

第三，是數(shù)據(jù)分布問題，如何從海量的視頻片段中提取有效的特征、如何統(tǒng)計(jì)數(shù)據(jù)的分布、應(yīng)該考慮哪些維度，都需要大量的工作。

對于大部分車企和智駕企業(yè)，還會(huì)面臨嚴(yán)重的數(shù)據(jù)泛化問題，因?yàn)椴煌能囆蛡鞲衅髋渲貌町惥薮?，采集的?shù)據(jù)往往難以復(fù)用，而國內(nèi)車企普遍車型眾多，最后很可能是采了一堆數(shù)據(jù)放在那沒法使用，看起來是數(shù)據(jù)資產(chǎn)，其實(shí)都是存儲(chǔ)成本。毫不夸張地說，數(shù)據(jù)會(huì)占據(jù)端到端智駕系統(tǒng)開發(fā)中80%以上的研發(fā)成本。

因此，越早形成數(shù)據(jù)閉環(huán)能力，就越有助于車企構(gòu)筑既寬且深的技術(shù)與產(chǎn)品護(hù)城河，也就越有機(jī)會(huì)將競爭者拒之門外。

“算力軍備競賽”愈演愈烈

由AI大模型催生的搶購算力潮，從去年開始陡然遷移到了汽車行業(yè)。以理想、華為和小鵬汽車為首的新勢力車企和智駕企業(yè)尤為激進(jìn)。

和AI大模型技術(shù)趨同，端到端的智駕技術(shù)，同樣有數(shù)十億參數(shù)，也在向百億級進(jìn)發(fā)。對算力資源的拼搶成為智駕領(lǐng)域繼數(shù)據(jù)之后又一個(gè)新的制勝法則。

實(shí)際上，智駕的算力軍備競賽早已愈演愈烈。一方面，隨著智駕系統(tǒng)的迭代升級，智能汽車所搭載的傳感器數(shù)量與類型進(jìn)一步增多，智駕系統(tǒng)需要實(shí)時(shí)采集海量傳感器數(shù)據(jù)并進(jìn)行融合處理，做出合理決策與路徑規(guī)劃，將決策實(shí)時(shí)傳送到執(zhí)行部件。在海量數(shù)據(jù)處理以及超低時(shí)延的需求之下，智駕系統(tǒng)計(jì)算量激增，算力需求呈現(xiàn)指數(shù)級增長。

一般認(rèn)為，自動(dòng)駕駛等級每增加一級，所需要的芯片算力就會(huì)呈現(xiàn)十倍的上升。根據(jù)Intel的推算，L5級別的全自動(dòng)駕駛時(shí)代，每秒需要芯片處理的數(shù)據(jù)大約為4000G。

另一方面，智能座艙與智能車聯(lián)的發(fā)展也對算力提出了新的要求。座艙交互體驗(yàn)的升級與第三生活空間趨勢之下，“顯示屏”逐漸替代車內(nèi)其它顯示方式，車載娛樂與服務(wù)進(jìn)一步豐富，多模態(tài)交互成為趨勢。這些都對整車算力提出了更高的要求。

去年7月，理想汽車云端算力為2.4 EFLOPS，截至11月算力已達(dá)6.83 EFLOPS。小鵬汽車計(jì)劃到2025年，云端算力將從目前的2.51 EFLOPS增加到10 EFLOPS。華為智駕也在兩個(gè)月內(nèi)迅速將云端算力規(guī)模從5 EFLOPS擴(kuò)張到7.5 EFLOPS。

當(dāng)前汽車算力主要來源仍是車載計(jì)算平臺(tái)，車載算力上限決定了未來汽車能夠承載的軟件服務(wù)升級上限，進(jìn)而決定汽車全生命周期價(jià)值。因此，在軟件技術(shù)仍處于持續(xù)升級迭代的當(dāng)下，主機(jī)廠通過硬件堆砌，預(yù)埋足夠大的算力，以期在未來能更大程度地獲取軟件服務(wù)收入。

但在摩爾定律之下，車載計(jì)算平臺(tái)的算力終有上限，而汽車的商品屬性也無法承受不計(jì)成本的硬件堆砌。對數(shù)據(jù)的實(shí)時(shí)分析處理吞噬著飛速上漲的算力數(shù)值，這一場算力軍備競賽也逐漸演變?yōu)楸绕此懔?shù)值大小的盲目競爭，引發(fā)主機(jī)廠的算力焦慮。

為了緩解算力供給緊張，云端大模型成為可行的方案。

從目前行業(yè)主流的三種端到端技術(shù)發(fā)展路線看，一種是通過大量規(guī)則和小模型堆疊而成的“大模型”，其需要大量的優(yōu)秀規(guī)則工程師；一種是“車端大模型”，即直接將端到端模型部署于車輛上，雖然見效快，但受限于車端算力，且隨著后期訓(xùn)練數(shù)據(jù)量的增加，容易陷入瓶頸；第三種便是云端大模型（Foundation Model），其參數(shù)量是車端模型的幾十倍甚至數(shù)百倍，這是單純的車端大模型所不可企及的。

但訓(xùn)練一個(gè)云端大模型，也對大規(guī)模高性能算力以及數(shù)據(jù)存儲(chǔ)和處理提出了非常高的要求。

第一，是提高并行訓(xùn)練性能和利用率的要求，這對云基礎(chǔ)設(shè)施包括網(wǎng)絡(luò)互聯(lián)、帶寬，以及系統(tǒng)軟件優(yōu)化等帶來了挑戰(zhàn)。

第二，是對模型訓(xùn)練持久穩(wěn)定性的要求，比如模型訓(xùn)練中斷，訓(xùn)練出現(xiàn)問題后能否快速拉起任務(wù)，縮短故障時(shí)間。

第三，大規(guī)模多模態(tài)數(shù)據(jù)的存儲(chǔ)與處理能力，實(shí)現(xiàn)并行訓(xùn)練的高性能、高吞吐，滿足模型訓(xùn)練不斷提升的數(shù)據(jù)量增長需求。

第四，海量數(shù)據(jù)的存儲(chǔ)成本要求，在滿足數(shù)據(jù)處理性能要求的前提下，通過支持?jǐn)?shù)據(jù)分層存儲(chǔ)，實(shí)現(xiàn)最優(yōu)的成本。

從整車角度上，當(dāng)車端架構(gòu)和云端架構(gòu)進(jìn)一步統(tǒng)一后，接下來的競爭是數(shù)據(jù)挖掘、數(shù)據(jù)的有效利用以及整個(gè)技術(shù)棧對數(shù)據(jù)的理解，以及如何在大規(guī)模的基礎(chǔ)設(shè)施上平衡整個(gè)計(jì)算效率。

換句話說，就是需要獲得高質(zhì)量、大規(guī)模的數(shù)據(jù)，再配合高算力，來訓(xùn)練和迭代算法能力，建立“冰山之下”車端和云端之間的數(shù)據(jù)閉環(huán)能力，來讓這“三大件”的能力更有效率和更低成本地運(yùn)轉(zhuǎn)起來。

如何為智駕“降本增效”？

智能網(wǎng)聯(lián)汽車的底色，是汽車的AI化。無論是智能駕駛、智能座艙，又或者是車路云一體化，都在向著人工智能的方向進(jìn)化。深度學(xué)習(xí)、大模型等技術(shù)，亦深度嵌入功能開發(fā)過程中。

對于智能汽車而言，智駕水平的高低體現(xiàn)在對環(huán)境的實(shí)時(shí)感知和對數(shù)據(jù)的分析處理能力方面，而這又需要龐大且優(yōu)質(zhì)的數(shù)據(jù)集和充足的算力作支撐。在資源有限的情況下，集通信、感知、計(jì)算于一體的車路云網(wǎng)絡(luò)有望為智駕的降本增效提供新途徑。

通過車路云網(wǎng)絡(luò)，可以建立一個(gè)橫跨車端、路側(cè)和云端的體系化閉環(huán)，路側(cè)收集的數(shù)據(jù)上傳到云端，在云端匯集并對這些數(shù)據(jù)進(jìn)行標(biāo)注處理和用于算法訓(xùn)練。完成后，云端再把訓(xùn)練好的算法模型數(shù)據(jù)發(fā)到車端，進(jìn)行OTA部署及更新。

同時(shí)，路側(cè)數(shù)據(jù)可以彌補(bǔ)車端的天然局限（視線盲區(qū)、超視距感知能力不足、極端天氣感知精度下降等），豐富車端的全局?jǐn)?shù)據(jù)，從而進(jìn)一步提升智駕能力和安全性。三端數(shù)據(jù)進(jìn)行協(xié)同互補(bǔ)，推動(dòng)完成了智駕技術(shù)的迭代與進(jìn)化。

車路云網(wǎng)絡(luò)的本質(zhì)是“通感算”網(wǎng)絡(luò)，核心功能是對實(shí)體世界實(shí)時(shí)數(shù)字化，通過深度融合通信、感知、計(jì)算的能力，為所有智能設(shè)備提供實(shí)時(shí)的數(shù)據(jù)服務(wù)，助力交通乃至更多產(chǎn)業(yè)領(lǐng)域?qū)崿F(xiàn)更高效協(xié)作、決策和處理。

車路云網(wǎng)絡(luò)大規(guī)模應(yīng)用的挑戰(zhàn)在于數(shù)據(jù)質(zhì)量，高質(zhì)量數(shù)據(jù)是數(shù)據(jù)上車的前提和基礎(chǔ)，數(shù)據(jù)上車是實(shí)現(xiàn)車路云一體化商業(yè)閉環(huán)的關(guān)鍵，將充分釋放車路云一體化的應(yīng)用價(jià)值。車路云一體化能“真正用起來”的核心有兩點(diǎn)：第一，單節(jié)點(diǎn)的數(shù)據(jù)質(zhì)量需要足夠高，保證數(shù)據(jù)質(zhì)量的核心并不只是路側(cè)設(shè)備，而是系統(tǒng)和算法；第二，深入了解車企的真正需求，與車企真正打通。

交通行業(yè)是個(gè)復(fù)雜系統(tǒng)，人工智能在其中目前只呈現(xiàn)碎片化應(yīng)用，比如識別信號燈、識別違章等，想要真正解決問題，需要用大模型這根線把車流、道路、交通信號等所有的散點(diǎn)串聯(lián)起來，形成更高維度的全局智能，通過對車、路、云等交通關(guān)鍵節(jié)點(diǎn)開展智能協(xié)同，形成對交通態(tài)勢的全面、及時(shí)、精準(zhǔn)的感知、控制與決策。

引入多模態(tài)大模型后，車路云網(wǎng)絡(luò)可以提升視覺分析的精準(zhǔn)度、泛化能力和場景適應(yīng)性，小模型算法面臨的問題可以通過多模態(tài)大模型進(jìn)行優(yōu)化。同時(shí)，考慮成本及帶寬等問題，多模態(tài)大模型應(yīng)用也需要有前端小模型來做相應(yīng)支撐，大小模型協(xié)同應(yīng)用其實(shí)是多級協(xié)同計(jì)算，多級協(xié)同計(jì)算可能是未來發(fā)展的主要應(yīng)用點(diǎn)。

前端小模型進(jìn)行實(shí)時(shí)檢測，快速分析，后端大模型進(jìn)行深度推理、二次判斷，減少誤報(bào)，最后通過人類反饋強(qiáng)化學(xué)習(xí)的方法實(shí)現(xiàn)整個(gè)算法模型的優(yōu)化提升，這其中，結(jié)合了小模型計(jì)算快、成本低優(yōu)勢的同時(shí)，運(yùn)用了大模型預(yù)測準(zhǔn)確、方法能力強(qiáng)的優(yōu)點(diǎn)。

車路云一體化場景中，云計(jì)算聚焦非實(shí)時(shí)、長周期數(shù)據(jù)的大數(shù)據(jù)分析，能夠?yàn)闃I(yè)務(wù)決策支撐提供依據(jù)，實(shí)現(xiàn)新應(yīng)用服務(wù)開發(fā)的快速、靈活部署，并為整車OTA數(shù)據(jù)進(jìn)行存儲(chǔ)、計(jì)算和分析，管理和簡化車端電子設(shè)備與軟件的復(fù)雜性。

邊緣計(jì)算則聚焦實(shí)時(shí)、短周期數(shù)據(jù)的分析，能更好地支撐車端實(shí)時(shí)智能化處理與執(zhí)行。車路云網(wǎng)絡(luò)可以在路側(cè)運(yùn)用邊緣小模型進(jìn)行快速感知，在邊緣云端運(yùn)用大模型推理進(jìn)行二次預(yù)警，在中心云端運(yùn)用行業(yè)大模型進(jìn)行優(yōu)化，整體利用多級協(xié)同計(jì)算來實(shí)現(xiàn)事件感知的準(zhǔn)確。

在交通流預(yù)測方面，業(yè)界基本使用時(shí)序數(shù)據(jù)進(jìn)行預(yù)測，包括實(shí)時(shí)監(jiān)測、短時(shí)預(yù)測、長期預(yù)測等。但交通流預(yù)測是一個(gè)復(fù)雜任務(wù)：交通流組成復(fù)雜、交通流參數(shù)之間并非簡單的線性關(guān)系，會(huì)受到外部因素比如天氣、特殊事件等因素的干擾，交通系統(tǒng)存在動(dòng)態(tài)性和不確定性；同時(shí)也需要考慮交通數(shù)據(jù)的質(zhì)量和可用性問題。將數(shù)據(jù)預(yù)測結(jié)合交通環(huán)境的實(shí)時(shí)數(shù)字孿生，可以為路網(wǎng)管控決策提供量化支撐。

在車路云網(wǎng)絡(luò)下，車、道路、交通路口可能都是智能體，智能體發(fā)展最重要的是要進(jìn)行人機(jī)協(xié)同，也就是說由人來設(shè)置目標(biāo)，智能體再將目標(biāo)拆分成不同步驟，讓智能體來決定每個(gè)步驟使用大模型還是小模型，最后形成完整的閉環(huán)鏈條，保障智能體的運(yùn)行。

此前交通事件處置有很多預(yù)案，大部分很難定量和定性，比如無法準(zhǔn)確知道擁堵成因和程度，也就是說以前的預(yù)案相當(dāng)于知識庫，在每個(gè)步驟上不同的人的理解不同，處理方式也就不一樣。通過智能體的應(yīng)用將預(yù)案知識庫轉(zhuǎn)向智能體模式，可以更加靈活的完成步驟分發(fā)和調(diào)度，從而形成對交通事件的準(zhǔn)確分析和理解，便于交通管理部門實(shí)現(xiàn)更精細(xì)化的交通管理。

智駕技術(shù)的演進(jìn)，好似從冷兵器時(shí)代到熱兵器時(shí)代，不同技術(shù)階段具有明顯的代際差異。過去的輔助駕駛依靠有限的規(guī)則、單一的功能依然有獲勝的希望，但到了端到端智駕時(shí)代，需要的是更大算力和更多數(shù)據(jù)，以及讓算力和數(shù)據(jù)流轉(zhuǎn)起來的機(jī)制和工程能力，任何一環(huán)的缺失都會(huì)給這場競賽帶來變數(shù)。

到目前為止，堅(jiān)持單車智能路線的車企還是占大多數(shù)，但車路云一體化的潛力已不可忽視。究竟是各自發(fā)展，還是最終走向融合，目前仍沒有統(tǒng)一的答案。然而，大家都無法回避的是，智駕對降本增效的需求越來越高，數(shù)據(jù)和算力供給不僅要多，也更要精，期望靠堆卡、堆數(shù)據(jù)就能做好智駕的日子已經(jīng)一去不復(fù)返。

特別聲明

本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布，僅代表該作者或機(jī)構(gòu)觀點(diǎn)，不代表澎湃新聞的觀點(diǎn)或立場，澎湃新聞僅提供信息發(fā)布平臺(tái)。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

我要舉報(bào)