上周,理想汽車官宣了一則重磅消息:全新一代雙系統智能駕駛解決方案「端到端+VLM」,全量推送。
在智駕技術日新月異,各種版本的早鳥測試層出不窮的當下,「全量推送」4個字,顯得彌足珍貴,尤其是這個消息緊接著理想第100萬臺交付。
這標志著理想汽?的智能駕駛,率先進入AI大模型時代,也意味著大規模的車主(超過30萬臺AD MAX車輛),用上了這個時代最前沿的技術。
端到端的系統,核心是基于優質駕駛數據和大模型,讓機器學習像人一樣思考、開車。
邁入「端到端+VLM」的階段之后,理想智駕的場景覆蓋率、舒適度和通行效率都有躍級式的提升。
按照30多萬的車主規模來計算,這應該也是目前國內規模最大的向用戶開放的端到端智駕版本。
理想這次全量推送的版本,基于整車OTA 6.4,智駕軟件版本則是E2E-VLM V4.8.6。版本號中的第一個4,代表了是基于400萬 clips 視頻數據訓練的版本。
Elon Musk曾經談到數據規模對于端到端自動駕駛表現的影響:「用100萬個視頻訓練,勉強夠用;200萬個,稍好一些;300萬個,就會感到Wow(驚艷);到了1000萬個,就變得難以置信了。」
而這次推送的400萬Clips的版本,剛好跨過了Musk口中所說的令人驚艷的節點。
理想汽車從7月5日發布了第一個「端到端+VLM」的版本,7月30日開啟千人內測,8月底開啟萬人公測。李想曾經在演講中披露,「最快今年,最慢明年上半年」開啟全量推送。
實際上,這次全量推送的日期甚至提前了不少。
這某種程度上也說明,「端到端+VLM」這套方法的能力增長超過預期。
理想汽車智能駕駛研發副總裁郎咸朋曾經說,「表面上端到端是一個大模型替代幾個小的模型,實際上它是一個分水嶺。從端到端開始,真正標志著用人工智能的方法來做自動駕駛。」
一、行業首創架構,「端到端 + VLM」的迭代速度
伴隨著「端到端+VLM」的全量推送,理想也公布了一些數據闡述這個新系統進化的速度:比如,從7月5日發布最早的鳥蛋版本開始,理想智駕團隊做了30個研發版本的模型迭代。
將近3個半月時間,有30個研發版本迭代,意味著幾乎每3天就有一個新版本。
而理想的千人內測和萬人公測,采用了AB測試的方法,「模型架構優化」與「更多數據訓練」同步進行。
(譬如在100萬Clips規模的版本1.1.x版本上迭代1.2.x和2.1.x),同時探索模型架構和數據量增長帶來的效果提升。
從實際運行效果來看,理想智駕系統的MPI(平均接管里程)得到了大幅提升,期間用戶平均接管里程翻了2.5倍。
理想曾經公布過E2E-VLM 1.0的MPI大概在12公里左右,也就說現在的平均MPI提升到了接近30公里。
目前,理想可用于智駕訓練的用戶里程數已經超過25億公里,這個數字到年底將增長到30億公里;當前有5.39 EFlops的云端訓練算力儲備,到年底將達到8 EFlops。
這些數據都說明了,目前這套系統的迭代速度和能力增長非常快,并且后續提升的空間依然非常巨大。
高速迭代的智能駕駛也給理想賣車帶來了直接的收益:
自5月門店試駕車升級無圖NOA功能以來,NOA試駕率翻倍增長;
AD Max定單比例也顯著增長;
10月,30萬元以上車型AD Max定單占比達到70%。
二、理想最新智駕,實際體驗如何?
在過去幾個月里,HiEV大蒜粒車研所的編輯也分別體驗了理想「端到端 +VLM」的多個版本,包括8月初的E2E-VLM 1.0,以及10月的4.8.6和5.1。
從最初在北京順義理想總部附近的路線體驗,當時端到端還是初出茅廬,偶有驚喜。
到后續,在海南、上海以及江蘇駕駛,可以說現版本的E2E-VLM已經能夠應對日常城市駕駛中的絕大部分場景,單次行程的NOA覆蓋率基本上能達到90%以上,甚至95%以上。
總體來說,「端到端+VLM」最直觀的感受是:
它對于時機和速度的控制變得更加精準;
規劃路徑的靈活性非常高,不機械;
橫縱向的控制更加絲滑。
這尤其體現在一些復雜大路口和博弈場景:
大路口左拐的路徑更加合理,并且會根據車流選擇通過的時機和路線;
路邊右側有停車時,即使在后方有車流的情況下,繞行的提前量和時機非常靈活,窄路下甚至會稍稍借用對向車道繞行;
甚至高速場景下也有變化,比如下匝道時,不再按之前固定2公里提前向外變道,而是很靈活地選擇通行效率更高的點位。