- +1
智能駕駛的中場戰(zhàn)事,如何降本增效穿越周期?
80%的數(shù)據(jù)+20%的模型=更好的AI。
這是人工智能領(lǐng)域權(quán)威學(xué)者、斯坦福大學(xué)計(jì)算機(jī)科學(xué)教授吳恩達(dá)(Andrew Ng)在他45歲生日當(dāng)天提出的人工智能“二八定律”。他表示,“如果我們80%的工作是數(shù)據(jù)準(zhǔn)備,那么確保數(shù)據(jù)質(zhì)量是人工智能團(tuán)隊(duì)的重要工作?!?/p>
由此延伸至端到端智能駕駛領(lǐng)域,智駕這盤菜看起來誘人,但車企想要吃到嘴里并沒有那么容易,這既要有數(shù)據(jù)作為原料食材,也要有算力燃料把火燒得旺,還要配合算法的烹調(diào)。優(yōu)質(zhì)的數(shù)據(jù)和充足的算力是一切技術(shù)迭代升級的先決條件,沒有好的食材和火候,再先進(jìn)的算法也無法發(fā)揮出最大效用。
當(dāng)智駕迎來最為關(guān)鍵的中場戰(zhàn)事,行業(yè)的重心不再是招募更多頂級的工程人才,而切換到模型設(shè)計(jì)、工具鏈開發(fā)以及模型的測試驗(yàn)證上。一個(gè)非常明顯的現(xiàn)象是,業(yè)界曾經(jīng)以團(tuán)隊(duì)規(guī)模作為描述先進(jìn)性的一項(xiàng)指標(biāo),而到了2024下半年,行業(yè)比拼的關(guān)鍵指標(biāo)變成了云端算力和數(shù)據(jù)質(zhì)量。
從2023年的開城大戰(zhàn),到2024年的“車位到車位”大戰(zhàn),這其中如何形成數(shù)據(jù)閉環(huán)成?如何建好算力“蓄水池”?如何最大化利用數(shù)據(jù)和算力資源并實(shí)現(xiàn)最優(yōu)算法?都是車企決勝智駕下半場必須要解決的問題。

“冰山之下”的數(shù)據(jù)閉環(huán)能力
端到端下的智能駕駛技術(shù),是數(shù)據(jù)和算力的合謀。
隨著智駕系統(tǒng)中感知定位、決策規(guī)劃和控制模塊的實(shí)現(xiàn)方式由基于規(guī)則的代碼向AI模型轉(zhuǎn)變,智駕系統(tǒng)開發(fā)范式也從規(guī)則驅(qū)動(dòng)逐漸過渡到了數(shù)據(jù)驅(qū)動(dòng),當(dāng)系統(tǒng)越來越依賴數(shù)據(jù)驅(qū)動(dòng),意味著數(shù)據(jù)閉環(huán)對智駕系統(tǒng)越來越關(guān)鍵了。
所謂數(shù)據(jù)閉環(huán),是從數(shù)據(jù)采集、存儲(chǔ)、挖掘、標(biāo)注到模型訓(xùn)練、仿真驗(yàn)證、集成部署的整個(gè)開發(fā)工作流。數(shù)據(jù)閉環(huán)完成的是對數(shù)據(jù)價(jià)值的提取工作,其本質(zhì)是將隱藏在一個(gè)又一個(gè)駕駛數(shù)據(jù)片段中的人類駕駛知識慢慢地遷移到智駕系統(tǒng)模型的參數(shù)文件里,從而使智駕系統(tǒng)的表現(xiàn)更加趨向擬人化,大幅提升駕駛體驗(yàn)的自然性和舒適性。

從數(shù)據(jù)閉環(huán)發(fā)展階段看,在第一階段,智能駕駛技術(shù)主要采取硬件驅(qū)動(dòng)的方式進(jìn)行研發(fā),數(shù)據(jù)閉環(huán)概念初現(xiàn)。進(jìn)入第二階段,算法和軟件的重要性不斷提升,智能駕駛開始嘗試采用小模型、基于規(guī)則驅(qū)動(dòng)的方法來解決智能駕駛問題。隨著智駕技術(shù)的提升,智駕系統(tǒng)對于數(shù)據(jù)的需求劇增,其優(yōu)化對數(shù)據(jù)閉環(huán)的要求越來越高,因此數(shù)據(jù)閉環(huán)已逐漸進(jìn)入由數(shù)據(jù)驅(qū)動(dòng)的第三階段。
對于端到端智駕系統(tǒng)所需要的數(shù)據(jù),特斯拉曾給出過一些判斷標(biāo)準(zhǔn):一個(gè)端到端自動(dòng)駕駛訓(xùn)練至少需要100萬個(gè)、分布多樣、高質(zhì)量的視頻片段才能正常工作。如果片段達(dá)到1000萬個(gè),系統(tǒng)能力會(huì)變得難以置信。
理想表示,最晚今年年初,會(huì)推出大概超過1000萬個(gè)片段訓(xùn)練出來的端到端+VLM。前段時(shí)間小鵬智駕負(fù)責(zé)人也公開表示,小鵬端到端模型的訓(xùn)練數(shù)據(jù)量已達(dá)到2000萬個(gè)片段。
當(dāng)前,車企和智駕企業(yè)獲取數(shù)據(jù)主要有兩種方式:
一是從量產(chǎn)車上挖掘。比如針對車企賣出的幾十萬臺(tái)車,工程師會(huì)寫下專門規(guī)則,如果用戶的駕駛行為符合條件,特定數(shù)據(jù)(經(jīng)過脫敏處理)會(huì)被上傳。車企用戶也可以主動(dòng)上傳一些特別案例。
二是在存量數(shù)據(jù)中挖掘數(shù)據(jù)。在早期智駕還不成熟的階段,車企和智駕企業(yè)往往積累大量數(shù)據(jù),很多都是無效數(shù)據(jù),工程師只能通過一些算法規(guī)則來挖取。
高質(zhì)量數(shù)據(jù)作為養(yǎng)料,會(huì)決定智駕系統(tǒng)迭代的質(zhì)量,也持續(xù)考驗(yàn)著車企的智駕自動(dòng)化閉環(huán)能力。
最近幾年,隨著量產(chǎn)車的規(guī)模化落地,很多車企都開始轉(zhuǎn)向采用量產(chǎn)車的影子模式采集數(shù)據(jù),但這種模式依然面臨艱巨的挑戰(zhàn)。
首先,是采集策略問題,即如何平衡數(shù)據(jù)的長尾問題(有效性)和數(shù)據(jù)的規(guī)模問題(成本)。如果采集策略比較寬松,往往采集回來的數(shù)據(jù)大部分是垃圾數(shù)據(jù),根本沒有使用價(jià)值;如果采集策略過于嚴(yán)格,又擔(dān)心丟失大量有價(jià)值的數(shù)據(jù)。
其次,是數(shù)據(jù)質(zhì)量問題,如何定義數(shù)據(jù)質(zhì)量是個(gè)艱巨的產(chǎn)品問題,“壞數(shù)據(jù)”(不熟練的駕駛、糟糕的駕駛習(xí)慣、違反交通規(guī)則等)會(huì)向下拖曳大模型的訓(xùn)練效果。因此,如何精準(zhǔn)地挑選出高質(zhì)量的數(shù)據(jù)又是一個(gè)復(fù)雜的技術(shù)問題。
第三,是數(shù)據(jù)分布問題,如何從海量的視頻片段中提取有效的特征、如何統(tǒng)計(jì)數(shù)據(jù)的分布、應(yīng)該考慮哪些維度,都需要大量的工作。
對于大部分車企和智駕企業(yè),還會(huì)面臨嚴(yán)重的數(shù)據(jù)泛化問題,因?yàn)椴煌能囆蛡鞲衅髋渲貌町惥薮?,采集的?shù)據(jù)往往難以復(fù)用,而國內(nèi)車企普遍車型眾多,最后很可能是采了一堆數(shù)據(jù)放在那沒法使用,看起來是數(shù)據(jù)資產(chǎn),其實(shí)都是存儲(chǔ)成本。毫不夸張地說,數(shù)據(jù)會(huì)占據(jù)端到端智駕系統(tǒng)開發(fā)中80%以上的研發(fā)成本。
因此,越早形成數(shù)據(jù)閉環(huán)能力,就越有助于車企構(gòu)筑既寬且深的技術(shù)與產(chǎn)品護(hù)城河,也就越有機(jī)會(huì)將競爭者拒之門外。
“算力軍備競賽”愈演愈烈
由AI大模型催生的搶購算力潮,從去年開始陡然遷移到了汽車行業(yè)。以理想、華為和小鵬汽車為首的新勢力車企和智駕企業(yè)尤為激進(jìn)。
和AI大模型技術(shù)趨同,端到端的智駕技術(shù),同樣有數(shù)十億參數(shù),也在向百億級進(jìn)發(fā)。對算力資源的拼搶成為智駕領(lǐng)域繼數(shù)據(jù)之后又一個(gè)新的制勝法則。
實(shí)際上,智駕的算力軍備競賽早已愈演愈烈。一方面,隨著智駕系統(tǒng)的迭代升級,智能汽車所搭載的傳感器數(shù)量與類型進(jìn)一步增多,智駕系統(tǒng)需要實(shí)時(shí)采集海量傳感器數(shù)據(jù)并進(jìn)行融合處理,做出合理決策與路徑規(guī)劃,將決策實(shí)時(shí)傳送到執(zhí)行部件。在海量數(shù)據(jù)處理以及超低時(shí)延的需求之下,智駕系統(tǒng)計(jì)算量激增,算力需求呈現(xiàn)指數(shù)級增長。
一般認(rèn)為,自動(dòng)駕駛等級每增加一級,所需要的芯片算力就會(huì)呈現(xiàn)十倍的上升。根據(jù)Intel的推算,L5級別的全自動(dòng)駕駛時(shí)代,每秒需要芯片處理的數(shù)據(jù)大約為4000G。

另一方面,智能座艙與智能車聯(lián)的發(fā)展也對算力提出了新的要求。座艙交互體驗(yàn)的升級與第三生活空間趨勢之下,“顯示屏”逐漸替代車內(nèi)其它顯示方式,車載娛樂與服務(wù)進(jìn)一步豐富,多模態(tài)交互成為趨勢。這些都對整車算力提出了更高的要求。
去年7月,理想汽車云端算力為2.4 EFLOPS,截至11月算力已達(dá)6.83 EFLOPS。小鵬汽車計(jì)劃到2025年,云端算力將從目前的2.51 EFLOPS增加到10 EFLOPS。華為智駕也在兩個(gè)月內(nèi)迅速將云端算力規(guī)模從5 EFLOPS擴(kuò)張到7.5 EFLOPS。
當(dāng)前汽車算力主要來源仍是車載計(jì)算平臺(tái),車載算力上限決定了未來汽車能夠承載的軟件服務(wù)升級上限,進(jìn)而決定汽車全生命周期價(jià)值。因此,在軟件技術(shù)仍處于持續(xù)升級迭代的當(dāng)下,主機(jī)廠通過硬件堆砌,預(yù)埋足夠大的算力,以期在未來能更大程度地獲取軟件服務(wù)收入。
但在摩爾定律之下,車載計(jì)算平臺(tái)的算力終有上限,而汽車的商品屬性也無法承受不計(jì)成本的硬件堆砌。對數(shù)據(jù)的實(shí)時(shí)分析處理吞噬著飛速上漲的算力數(shù)值,這一場算力軍備競賽也逐漸演變?yōu)楸绕此懔?shù)值大小的盲目競爭,引發(fā)主機(jī)廠的算力焦慮。
為了緩解算力供給緊張,云端大模型成為可行的方案。
從目前行業(yè)主流的三種端到端技術(shù)發(fā)展路線看,一種是通過大量規(guī)則和小模型堆疊而成的“大模型”,其需要大量的優(yōu)秀規(guī)則工程師;一種是“車端大模型”,即直接將端到端模型部署于車輛上,雖然見效快,但受限于車端算力,且隨著后期訓(xùn)練數(shù)據(jù)量的增加,容易陷入瓶頸;第三種便是云端大模型(Foundation Model),其參數(shù)量是車端模型的幾十倍甚至數(shù)百倍,這是單純的車端大模型所不可企及的。
但訓(xùn)練一個(gè)云端大模型,也對大規(guī)模高性能算力以及數(shù)據(jù)存儲(chǔ)和處理提出了非常高的要求。
第一,是提高并行訓(xùn)練性能和利用率的要求,這對云基礎(chǔ)設(shè)施包括網(wǎng)絡(luò)互聯(lián)、帶寬,以及系統(tǒng)軟件優(yōu)化等帶來了挑戰(zhàn)。
第二,是對模型訓(xùn)練持久穩(wěn)定性的要求,比如模型訓(xùn)練中斷,訓(xùn)練出現(xiàn)問題后能否快速拉起任務(wù),縮短故障時(shí)間。
第三,大規(guī)模多模態(tài)數(shù)據(jù)的存儲(chǔ)與處理能力,實(shí)現(xiàn)并行訓(xùn)練的高性能、高吞吐,滿足模型訓(xùn)練不斷提升的數(shù)據(jù)量增長需求。
第四,海量數(shù)據(jù)的存儲(chǔ)成本要求,在滿足數(shù)據(jù)處理性能要求的前提下,通過支持?jǐn)?shù)據(jù)分層存儲(chǔ),實(shí)現(xiàn)最優(yōu)的成本。
從整車角度上,當(dāng)車端架構(gòu)和云端架構(gòu)進(jìn)一步統(tǒng)一后,接下來的競爭是數(shù)據(jù)挖掘、數(shù)據(jù)的有效利用以及整個(gè)技術(shù)棧對數(shù)據(jù)的理解,以及如何在大規(guī)模的基礎(chǔ)設(shè)施上平衡整個(gè)計(jì)算效率。
換句話說,就是需要獲得高質(zhì)量、大規(guī)模的數(shù)據(jù),再配合高算力,來訓(xùn)練和迭代算法能力,建立“冰山之下”車端和云端之間的數(shù)據(jù)閉環(huán)能力,來讓這“三大件”的能力更有效率和更低成本地運(yùn)轉(zhuǎn)起來。
如何為智駕“降本增效”?
智能網(wǎng)聯(lián)汽車的底色,是汽車的AI化。無論是智能駕駛、智能座艙,又或者是車路云一體化,都在向著人工智能的方向進(jìn)化。深度學(xué)習(xí)、大模型等技術(shù),亦深度嵌入功能開發(fā)過程中。
對于智能汽車而言,智駕水平的高低體現(xiàn)在對環(huán)境的實(shí)時(shí)感知和對數(shù)據(jù)的分析處理能力方面,而這又需要龐大且優(yōu)質(zhì)的數(shù)據(jù)集和充足的算力作支撐。在資源有限的情況下,集通信、感知、計(jì)算于一體的車路云網(wǎng)絡(luò)有望為智駕的降本增效提供新途徑。
通過車路云網(wǎng)絡(luò),可以建立一個(gè)橫跨車端、路側(cè)和云端的體系化閉環(huán),路側(cè)收集的數(shù)據(jù)上傳到云端,在云端匯集并對這些數(shù)據(jù)進(jìn)行標(biāo)注處理和用于算法訓(xùn)練。完成后,云端再把訓(xùn)練好的算法模型數(shù)據(jù)發(fā)到車端,進(jìn)行OTA部署及更新。
同時(shí),路側(cè)數(shù)據(jù)可以彌補(bǔ)車端的天然局限(視線盲區(qū)、超視距感知能力不足、極端天氣感知精度下降等),豐富車端的全局?jǐn)?shù)據(jù),從而進(jìn)一步提升智駕能力和安全性。三端數(shù)據(jù)進(jìn)行協(xié)同互補(bǔ),推動(dòng)完成了智駕技術(shù)的迭代與進(jìn)化。

車路云網(wǎng)絡(luò)的本質(zhì)是“通感算”網(wǎng)絡(luò),核心功能是對實(shí)體世界實(shí)時(shí)數(shù)字化,通過深度融合通信、感知、計(jì)算的能力,為所有智能設(shè)備提供實(shí)時(shí)的數(shù)據(jù)服務(wù),助力交通乃至更多產(chǎn)業(yè)領(lǐng)域?qū)崿F(xiàn)更高效協(xié)作、決策和處理。
車路云網(wǎng)絡(luò)大規(guī)模應(yīng)用的挑戰(zhàn)在于數(shù)據(jù)質(zhì)量,高質(zhì)量數(shù)據(jù)是數(shù)據(jù)上車的前提和基礎(chǔ),數(shù)據(jù)上車是實(shí)現(xiàn)車路云一體化商業(yè)閉環(huán)的關(guān)鍵,將充分釋放車路云一體化的應(yīng)用價(jià)值。車路云一體化能“真正用起來”的核心有兩點(diǎn):第一,單節(jié)點(diǎn)的數(shù)據(jù)質(zhì)量需要足夠高,保證數(shù)據(jù)質(zhì)量的核心并不只是路側(cè)設(shè)備,而是系統(tǒng)和算法;第二,深入了解車企的真正需求,與車企真正打通。
交通行業(yè)是個(gè)復(fù)雜系統(tǒng),人工智能在其中目前只呈現(xiàn)碎片化應(yīng)用,比如識別信號燈、識別違章等,想要真正解決問題,需要用大模型這根線把車流、道路、交通信號等所有的散點(diǎn)串聯(lián)起來,形成更高維度的全局智能,通過對車、路、云等交通關(guān)鍵節(jié)點(diǎn)開展智能協(xié)同,形成對交通態(tài)勢的全面、及時(shí)、精準(zhǔn)的感知、控制與決策。
引入多模態(tài)大模型后,車路云網(wǎng)絡(luò)可以提升視覺分析的精準(zhǔn)度、泛化能力和場景適應(yīng)性,小模型算法面臨的問題可以通過多模態(tài)大模型進(jìn)行優(yōu)化。同時(shí),考慮成本及帶寬等問題,多模態(tài)大模型應(yīng)用也需要有前端小模型來做相應(yīng)支撐,大小模型協(xié)同應(yīng)用其實(shí)是多級協(xié)同計(jì)算,多級協(xié)同計(jì)算可能是未來發(fā)展的主要應(yīng)用點(diǎn)。
前端小模型進(jìn)行實(shí)時(shí)檢測,快速分析,后端大模型進(jìn)行深度推理、二次判斷,減少誤報(bào),最后通過人類反饋強(qiáng)化學(xué)習(xí)的方法實(shí)現(xiàn)整個(gè)算法模型的優(yōu)化提升,這其中,結(jié)合了小模型計(jì)算快、成本低優(yōu)勢的同時(shí),運(yùn)用了大模型預(yù)測準(zhǔn)確、方法能力強(qiáng)的優(yōu)點(diǎn)。
車路云一體化場景中,云計(jì)算聚焦非實(shí)時(shí)、長周期數(shù)據(jù)的大數(shù)據(jù)分析,能夠?yàn)闃I(yè)務(wù)決策支撐提供依據(jù),實(shí)現(xiàn)新應(yīng)用服務(wù)開發(fā)的快速、靈活部署,并為整車OTA數(shù)據(jù)進(jìn)行存儲(chǔ)、計(jì)算和分析,管理和簡化車端電子設(shè)備與軟件的復(fù)雜性。
邊緣計(jì)算則聚焦實(shí)時(shí)、短周期數(shù)據(jù)的分析,能更好地支撐車端實(shí)時(shí)智能化處理與執(zhí)行。車路云網(wǎng)絡(luò)可以在路側(cè)運(yùn)用邊緣小模型進(jìn)行快速感知,在邊緣云端運(yùn)用大模型推理進(jìn)行二次預(yù)警,在中心云端運(yùn)用行業(yè)大模型進(jìn)行優(yōu)化,整體利用多級協(xié)同計(jì)算來實(shí)現(xiàn)事件感知的準(zhǔn)確。
在交通流預(yù)測方面,業(yè)界基本使用時(shí)序數(shù)據(jù)進(jìn)行預(yù)測,包括實(shí)時(shí)監(jiān)測、短時(shí)預(yù)測、長期預(yù)測等。但交通流預(yù)測是一個(gè)復(fù)雜任務(wù):交通流組成復(fù)雜、交通流參數(shù)之間并非簡單的線性關(guān)系,會(huì)受到外部因素比如天氣、特殊事件等因素的干擾,交通系統(tǒng)存在動(dòng)態(tài)性和不確定性;同時(shí)也需要考慮交通數(shù)據(jù)的質(zhì)量和可用性問題。將數(shù)據(jù)預(yù)測結(jié)合交通環(huán)境的實(shí)時(shí)數(shù)字孿生,可以為路網(wǎng)管控決策提供量化支撐。
在車路云網(wǎng)絡(luò)下,車、道路、交通路口可能都是智能體,智能體發(fā)展最重要的是要進(jìn)行人機(jī)協(xié)同,也就是說由人來設(shè)置目標(biāo),智能體再將目標(biāo)拆分成不同步驟,讓智能體來決定每個(gè)步驟使用大模型還是小模型,最后形成完整的閉環(huán)鏈條,保障智能體的運(yùn)行。
此前交通事件處置有很多預(yù)案,大部分很難定量和定性,比如無法準(zhǔn)確知道擁堵成因和程度,也就是說以前的預(yù)案相當(dāng)于知識庫,在每個(gè)步驟上不同的人的理解不同,處理方式也就不一樣。通過智能體的應(yīng)用將預(yù)案知識庫轉(zhuǎn)向智能體模式,可以更加靈活的完成步驟分發(fā)和調(diào)度,從而形成對交通事件的準(zhǔn)確分析和理解,便于交通管理部門實(shí)現(xiàn)更精細(xì)化的交通管理。
智駕技術(shù)的演進(jìn),好似從冷兵器時(shí)代到熱兵器時(shí)代,不同技術(shù)階段具有明顯的代際差異。過去的輔助駕駛依靠有限的規(guī)則、單一的功能依然有獲勝的希望,但到了端到端智駕時(shí)代,需要的是更大算力和更多數(shù)據(jù),以及讓算力和數(shù)據(jù)流轉(zhuǎn)起來的機(jī)制和工程能力,任何一環(huán)的缺失都會(huì)給這場競賽帶來變數(shù)。
到目前為止,堅(jiān)持單車智能路線的車企還是占大多數(shù),但車路云一體化的潛力已不可忽視。究竟是各自發(fā)展,還是最終走向融合,目前仍沒有統(tǒng)一的答案。然而,大家都無法回避的是,智駕對降本增效的需求越來越高,數(shù)據(jù)和算力供給不僅要多,也更要精,期望靠堆卡、堆數(shù)據(jù)就能做好智駕的日子已經(jīng)一去不復(fù)返。
本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺(tái)。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司