长兴郴障科技有限公司

澎湃Logo
下載客戶端

登錄

  • +1

從具身智能到車路云,一場數(shù)字未來的浩瀚遠征

2024-12-21 19:15
來源:澎湃新聞·澎湃號·湃客
字號

詩人艾略特所言:“我們不停止探索,最終所有的探索都將回到起點,并且對這個起點有了新的認識。”

發(fā)生在距今5.2億年前的寒武紀生命大爆發(fā)是地球生命史上里程碑式的演化事件,其規(guī)模和強度前所未有,與之前生命世界形成截然不同的反差,更是深刻影響了后來地球生命史的發(fā)展,開啟了通向現(xiàn)代生物多樣性的浩瀚遠征。

2024年,可以算是科技界的“寒武紀”大爆發(fā)之年,具身智能、自動駕駛、大模型、車路云一體化等眾多新技術在這一年相互交匯、彼此融合,并釋放出巨大的技術應用潛力和極具想象力的商業(yè)化前景,不僅打開了通往未來世界的大門,也為產業(yè)升級找到了進階之路,讓人們看到了數(shù)字未來的無限可能。

具身智能通往AGI的野望

從圖靈測試到深度學習,從專家系統(tǒng)到大語言模型,人工智能的每一次進化都在拓展著人類對智能的理解邊界。人工智能與具身智能的結合,一直是行業(yè)領域研究探索的重要方向。

繼大模型后,具身智能成為今年科技界的新熱點。通過賦予人工智能以具體的物理實體(如機器人和自動化設備等),具身智能可以與現(xiàn)實世界進行交互,被認為是推動通用人工智能(AGI)發(fā)展的關鍵技術。比亞迪、華為、廣汽集團以及美團、阿里巴巴、騰訊等企業(yè)都已親自下場,欲在這片混沌初開的市場中搶占一席之地。

作為該領域最具代表性的實體,人形機器人正在大模型催化下加速產業(yè)化落地。目前業(yè)內普遍認為,人形機器人是具身智能落地的最佳硬件載體。

高盛數(shù)據(jù)顯示,在理想情況下,預計到2035年,人形機器人市場空間有望達到1540億美元,約合11037.3億元人民幣,這一規(guī)模相當于2021年智能手機市場的三分之一。花旗銀行發(fā)布的最新報告預測,到2050年,全球人形機器人市場規(guī)模將達7萬億美元,全球人形機器人數(shù)量將達到6.48億臺。

如果將大模型視為“有趣的靈魂”,“具身智能”賦能的人形機器人則有了“好看的皮囊”,大模型與機器人快速融合正在成為具身智能持續(xù)進化的必然趨勢。

2022年8月,谷歌PaLM-SayCan首次將語言模型與物理機器人結合,通過預訓練在大型語言模型中提取知識,讓機器人依據(jù)高級文本指令完成物理任務。

隨后,機器人與大模型的融合逐步加深。2023年7月,谷歌DeepMind推出了Robotics Transformer 2(RT-2),是全球第一個控制機器人的視覺-語言-動作(VLA)模型。RT-2可使機器人直接通過拍攝或感知環(huán)境的方式獲取視覺信息,并理解人類語言指令,然后通過動作執(zhí)行模塊進行相應的動作操作。

2024年3月,F(xiàn)igure發(fā)布OpenAI大模型加持的機器人Figure 01,F(xiàn)igure 01采用端到端神經網絡,由OpenAI大模型提供高級視覺和語言智能功能,神經網絡進行底層的控制,能夠與人類進行對話交互,理解并執(zhí)行人類指令。

雖然人形機器人在2024年取得了“技驚四座”的進展:優(yōu)必選人形機器人Walker聚焦汽車、3C等制造業(yè)重點領域,已進入多家車廠實訓;宇樹科技機器人實現(xiàn)了完全仿人的自然行走;波士頓動力的新版Atlas機器人可在工廠里不同儲物柜之間絲滑搬動零件;特斯拉人形機器人擎天柱(Optimus)計劃在2025年量產……

但正如波士頓動力創(chuàng)始人Marc Raibert所說,目前人形機器人“在某種程度上是一種炫耀,而不是一種生產力”。具身智能固然是通往AGI大門的一把鑰匙,但目前行業(yè)還是沒有找到使用這把鑰匙的正確方式,并且低估了AGI的實現(xiàn)難度。

不同于快速收斂的大模型,具身智能涉及的模態(tài)空前復雜,需要同時具備多模態(tài)感知、具身決策與規(guī)劃和操作執(zhí)行能力,在發(fā)展過程中仍面臨多項挑戰(zhàn)。

首先,是要適應非結構化真實環(huán)境。與預設規(guī)則和模式驅動的傳統(tǒng)人工智能系統(tǒng)不同,具身智能必須在一個充滿復雜性和不可預測性的非結構化環(huán)境中找到立足點。在這種環(huán)境中,信息的稀缺和場景的多變性,要求人工智能系統(tǒng)具備更加先進和靈活的計算能力,以便能夠適應環(huán)境的不斷變化和不確定性。

其次,是要發(fā)展更高級的認知策略。在自然界中,生物體通過視覺、聽覺和觸覺等多種感覺途徑獲得復雜的感知信息,并在大腦中進行有效的多模態(tài)信息融合。具身智能同樣需要模仿這種高效的多模態(tài)融合過程,以更全面地理解和適應其所處的環(huán)境。

第三,涌現(xiàn)式創(chuàng)新與突破的缺乏影響著具身智能的進化程度。生物群體能夠展現(xiàn)出令人驚嘆的集體智慧,主要歸功于其中個體之間的協(xié)同作用。對具身智能來說,一個重要的挑戰(zhàn)是模仿這種群體智能系統(tǒng)。這意味著需要將智能分散到多個實體中,并通過它們之間的協(xié)作,實現(xiàn)更高級別的認知和決策能力,以實現(xiàn)分工協(xié)作和動態(tài)任務分配,從而能夠更靈活地應對多種情境。

第四,具身智能在與真實環(huán)境進行交互并充分學習時,勢必會收集和處理大量數(shù)據(jù)。這就引出了一個關鍵問題:如何在實時交互中確保這些數(shù)據(jù)的安全性和隱私性,同時具身智能在決策時還需要考慮倫理和道德問題,以確保其行為符合道德原則和社會價值觀。

具身智能的發(fā)展不僅是技術革新的過程,更是對人類理解、倫理道德和社會影響的深思,相關研究在推動科技邊界的同時,還將深刻影響人類社會的方方面面。

智能駕駛的夢想照進現(xiàn)實

當自動駕駛汽車的夢想在20年前被點燃時,誰能想到這條道路會如此坎坷?美國國防部高級研究計劃局(DARPA)發(fā)起的挑戰(zhàn)賽仿佛打開了一個新世界,激發(fā)了無數(shù)科技公司的熱情。然而,現(xiàn)實卻遠比想象中復雜。

縱觀自動駕駛技術的發(fā)展歷程,人工智能的不斷突破顯著提升了自動駕駛的感知性能。從卷積神經網(CNN)的引入,到循環(huán)神經網絡(RNN)的應用,再到結合鳥瞰圖(BEV)與Transformer(自注意力機制的神經網絡架構)的創(chuàng)新,新技術的迭代涌現(xiàn)在不斷增強自動駕駛的精確度與安全性。

尤其是在“BEV+Transformer”與OCC(占用網絡)之后,端到端(End-to-End)自動駕駛技術開始受到廣泛關注。可以看到,2024年高階智駕產品渴望商業(yè)成熟,但仍處于技術劇烈變革階段。

隨著神經網絡智駕算法的崛起,自動駕駛進入數(shù)據(jù)驅動時代,通過大量數(shù)據(jù)訓練出能夠高度模擬人類駕駛習慣的人工智能,在達到一定的仿真閾值后,得出一套根據(jù)可靠性和符合人類乘車習慣的系統(tǒng)。

隨著智能駕駛技術的不斷成熟,車企逐步加大了在智能駕駛領域的投入。特斯拉、蔚來、小鵬、理想等廠商在智能駕駛技術的研發(fā)上已形成了自己的技術路線。

特斯拉作為智能駕駛領域的領軍者,通過影子模式進行數(shù)據(jù)收集,將系統(tǒng)決策與駕駛員行為不斷進行比對,當兩者不一致時,系統(tǒng)將場景判定為“極端工況”,進而觸發(fā)數(shù)據(jù)回傳。因此特斯拉收集的數(shù)據(jù)越多,對于人類駕駛習慣的模擬就越精準,進而加速特斯拉FSD的車端部署,形成數(shù)據(jù)閉環(huán)。

蔚來通過引入高精地圖和Lidar技術,打造其獨特的NAD系統(tǒng);小鵬則在其XNGP系統(tǒng)中引入了輕量化的傳感器方案,并計劃在未來通過端到端大模型進一步提升系統(tǒng)性能。華為則通過與多個整車廠商的合作,推動其ADS系統(tǒng)的廣泛應用。各大整車廠商在智駕領域的戰(zhàn)略布局,將在未來幾年內決定市場的競爭格局。

盡管智能駕駛技術已經取得了顯著進展,但在實現(xiàn)全面普及之前仍面臨諸多挑戰(zhàn)。首先,算法的可靠性和安全性仍需進一步提升,特別是在應對復雜的城市交通環(huán)境時,智能駕駛系統(tǒng)需要能夠處理各種突發(fā)狀況和極端條件。

其次,智能駕駛系統(tǒng)的性能高度依賴于算力與算法的優(yōu)化。在端到端大模型的架構下,算力需求呈指數(shù)級增長,特別是在進行大規(guī)模數(shù)據(jù)訓練和實時決策時。為了應對這一挑戰(zhàn),業(yè)界正在探索基于云計算和邊緣計算的混合架構,通過將計算任務分布在云端和本地設備之間,以提高系統(tǒng)的響應速度和計算效率。

算法的優(yōu)化也面臨著諸多挑戰(zhàn)。傳統(tǒng)的機器學習算法在處理長尾問題時表現(xiàn)不佳,而智能駕駛系統(tǒng)必須具備應對這些情況的能力。強化學習和生成對抗網絡(GAN)等新型算法在解決這些問題上展示出了潛力,但如何將這些算法應用到實際駕駛場景中,仍需要進一步研究和探索。

隨著智能駕駛系統(tǒng)的普及,數(shù)據(jù)隱私和網絡安全問題日益突出。智能駕駛系統(tǒng)依賴于大量的傳感器數(shù)據(jù)和用戶行為數(shù)據(jù),這些數(shù)據(jù)的收集、傳輸和存儲都可能面臨安全風險。如何保護用戶數(shù)據(jù)的隱私,防止數(shù)據(jù)被非法獲取和濫用,是當前智能駕駛技術面臨的一個重要挑戰(zhàn)。

智能駕駛不僅是技術發(fā)展的新方向,更是汽車產業(yè)未來的重要增長點,2024年是智能駕駛技術從高端市場走向主流市場的關鍵節(jié)點。車企在智能駕駛領域的布局,將在很大程度上決定未來的市場格局。

為了將自動駕駛系統(tǒng)部署到更多車型上,模型壓縮和優(yōu)化技術將成為關鍵,我們將看到更加輕量級、高效的自動駕駛模型問世,這些模型將在保持性能的同時,大幅降低對硬件資源的需求。

車路云新基建“加速器”

如果說,具身智能和自動駕駛還只是停留在場景應用層面,那么車路云一體化則是圍繞底層交通基礎設施智能化升級下的一盤“大棋”。

車路云網絡的本質是通感算網絡,其將通信、感知與計算深度融合,通過集成通信基站、衛(wèi)星通信和定位、各類傳感器、云控平臺等關鍵基礎設施,形成一個信息共享、高效協(xié)同的網絡空間,成為未來智能城市的底層系統(tǒng)。

作為龐大的實時數(shù)據(jù)網絡,車路云網絡可以大規(guī)模獲取實體世界的全局數(shù)字化信息,為普通汽車、智能汽車、機器人、無人機、低空飛行器等智能設備提供系統(tǒng)級的實時數(shù)據(jù)服務,這些智能設備可以基于全局數(shù)據(jù)信息進行實時決策和精準規(guī)劃,實現(xiàn)更高效的協(xié)作。

同時,這些數(shù)據(jù)還可以用來反哺自動駕駛模型、機器人模型的訓練。比如可以根據(jù)不同城市特點,訓練最適合當?shù)伛{駛行為的自動駕駛模型;根據(jù)不同工作和工種特點,訓練最適合不同工作場景的機器人。

當智能設備規(guī)模越來越大,最具合理性的方式一定是盡可能降低對單體設備在計算能力和實時感知能力方面的依賴,通過整個網絡來承載巨量的數(shù)據(jù)處理和計算分析。這將有助于推動數(shù)字智能社會進入到一個整合系統(tǒng),也就是從單體智能設備變成群體智能系統(tǒng),并將整合地面網絡、低空網絡、衛(wèi)星網絡,形成空天地一體化的通感算網絡,為智能體的大規(guī)模運行與自主交互協(xié)作提供重要支撐。

2024年,是我國全面布局車路云一體化的“元年”。年初,工信部發(fā)布的《關于開展智能網聯(lián)汽車“車路云一體化”應用試點工作的通知》提出,要建設智能化路側基礎設施,實現(xiàn)試點區(qū)域5G通信網絡全覆蓋,部署LTE-V2X直連通信路側單元等在內的C-V2X基礎設施。通過新一代移動通信技術將人、車、路、云一體化,建立系統(tǒng)性數(shù)據(jù)平臺,產業(yè)化規(guī)模落地應用,就是智能駕駛的“中國方案”。

7月初,工信部公布了20個城市(聯(lián)合體)為“車路云一體化”應用試點城市。車路云一體化作為優(yōu)化交通運效率、提升城市治理水平的技術手段,其重要性日益凸顯,已成為加速智能駕駛全面落地的關鍵所在。

10月,工信部相關負責人在國新辦新聞發(fā)布會上表示,下一步將深入開展智能網聯(lián)汽車準入和上路通行試點、“車路云一體化”試點,穩(wěn)妥推進自動駕駛技術產業(yè)化。

目前,中國已經形成相對成熟的車路云一體化建設方案,主要由設備端、通信服務、云平臺、車路云應用、車路云安全等部分組成。其中,在政府機構主導的項目推動下,路側基礎設施及平臺建設率先開展。

數(shù)據(jù)顯示,2025年、2030年“車路云一體化”智能網聯(lián)汽車產值預計為7295億元、25825億元,年均復合增長率為28.8%。面向未來,車路云一體化要以應用為出發(fā)點,不僅賦能具有自動駕駛功能的車輛,還要著眼于存量的智能網聯(lián)汽車和普通汽車。

對此,要挖掘更多應用場景并形成可復制的方案。當前,車路云一體化平臺已經能夠對路端的設備信息、預警結果等數(shù)據(jù)進行較為穩(wěn)定的接入與處理,路云已經基本實現(xiàn)協(xié)同連接,利用云端多車數(shù)據(jù)進行交通智能調度管理、提高協(xié)作效率的場景將成為主流,車云協(xié)同也將迎來新發(fā)展。

同時,要進一步探索車路云一體化更多商業(yè)價值。車路云一體化市場規(guī)模的增長依賴于各城市車路云項目的擴張和落地,對于技術服務商而言需要更多的“增長曲線”維持業(yè)務運轉。

一方面,通過基礎設施類項目向車端協(xié)議棧的滲透是可行方案;另一方面,將平臺沉淀的高質量數(shù)據(jù)賦能車企等對數(shù)據(jù)有海量需求的終端用戶,也不失為一種新的探索方向。

蘑菇車聯(lián)創(chuàng)始人兼CEO朱磊認為,車路云網絡最需要的是操作系統(tǒng)和算法,數(shù)據(jù)質量是推動整個產業(yè)向前發(fā)展的關鍵所在。車路云網絡產生的數(shù)據(jù)能否給車輛使用以及如何使用是核心標準。目前這部分工作剛剛起步,還遠沒有到成熟階段。

從數(shù)據(jù)應用角度,車路云“數(shù)據(jù)上車”可以分為五個階段:

第一,路側基礎設施建設階段。主要將“通感算”的硬件設備部署在路側;

第二,數(shù)據(jù)質量達標階段。針對單節(jié)點數(shù)據(jù)質量進行測試,可參考行業(yè)權威標準,比如信通院的“雙SL3”;

第三,數(shù)據(jù)上車初級應用階段。通過車路云系統(tǒng),將信號燈數(shù)據(jù)、路側識別到的事件類數(shù)據(jù)賦能智能網聯(lián)車輛;

第四,數(shù)據(jù)上車高級應用階段。通過車路云系統(tǒng),將實時孿生數(shù)據(jù)賦能給智能網聯(lián)車輛和自動駕駛車輛,真正實現(xiàn)協(xié)同感知、協(xié)同決策;

第五,量產車型大規(guī)模應用階段。與車企進行量產車合作,保證車輛大規(guī)模接入車路云網絡,并享受各類實時數(shù)據(jù)服務。

第五階段的實現(xiàn),需要政府、行業(yè)組織、車企、車路云技術公司等多方面開展協(xié)作,在政策、法規(guī)、標準等層面形成合力,共同推動數(shù)據(jù)上車大規(guī)模應用,最終讓人們真實享受到車路云建設帶來的安全、效率、智能和便利。

此外,構建互聯(lián)互通的車路云網絡形態(tài)有助于促進產業(yè)規(guī)模發(fā)展。隨著國家層面政策推動與地方試點項目的成功經驗積累,車路云網絡必將逐步擴展至全國范圍,形成覆蓋高速公路、城市道路、鄉(xiāng)村公路的全域智能交通網絡。

未來,車路云一體化的定位將不再限于汽車產業(yè)本身,而是與交通、城市管理、通信等多領域深度融合的新型基礎設施體系,數(shù)據(jù)作為“橋梁”,構建起高效協(xié)同的多業(yè)務系統(tǒng),從而全面提升城市的智能化、精細化管理水平。

每一次技術浪潮的來臨都伴隨著泡沫,但這并不意味著我們應該回避。因為在這泡沫之下,隱藏著無數(shù)的機遇。創(chuàng)新往往發(fā)生在邊界之外,但又在跨界之中,來源于那些看似無用卻能激發(fā)無限可能的探索。

    本文為澎湃號作者或機構在澎湃新聞上傳并發(fā)布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯(lián)網新聞信息服務許可證:31120170006

            增值電信業(yè)務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業(yè)有限公司

            反饋
            网上百家乐大赢家筹码| 太阳城札记| 百家乐官网高返水| 博彩网18good| 百家乐六手变化混合赢家打| 马牌百家乐现金网| 伯爵百家乐官网赌场娱乐网规则 | 永利高倒闭| 百家乐微笑不倒| 百家乐庄闲最佳打法| 百家乐官网技巧赚钱| 百家乐官网的打法技巧| 桐庐棋牌世界| 百家乐游戏新| 豪华百家乐人桌| 百家乐中的概率| 试玩百家乐官网的玩法技巧和规则| 德州扑克视频教学| 海燕百家乐论| 百家乐双龙| 玩百家乐凤凰娱乐城| 女神百家乐官网的玩法技巧和规则 | 现金百家乐技巧| 百家乐现金平台排名| 百家乐官网社区| 黄金城百家乐官网苹果版| 大世界百家乐官网的玩法技巧和规则| 百家乐官网高科技出千工具| 网络百家乐官网玩法| 百家乐官网赌场信息| 百家乐官网讯特| 百家乐官网暗红色桌布| 中国百家乐官网技巧软件| 百家乐官网路单破解软件| 六合彩官方| 网络赌球| 昆明市| 百家乐官网好的平台| 嘉兴市| 太阳城百家乐官网手机投注| 百家乐官网澳门路规则算法|