特斯拉FSD的發展歷程——化繁為簡
FSD是特斯拉輔助駕駛方案中功能最完整的產品
特斯拉的自動駕駛方案包括基礎版自動輔助駕駛(AP)、增強版自動輔助駕駛(EAP)、以及完全自動駕駛(FSD);其中,FSD全稱 Full Self-Driving(完全自動駕駛),是特斯拉輔助駕駛Autopilot產品組合中功能最完整的產品。
功能上來看,特斯拉FSD除基礎的主動巡航及車道維持居中外,還可以實現:1)自動輔助導航駕駛,包括自動駛入和駛出高速公路匝道或立交橋岔路口,超過行駛緩慢的車輛;2)自動輔助變道,包括高速公路上自動輔助變換車道;3)自動泊車,包括平行泊車與垂直泊車;4)智能召喚則是在合適的場景下,停在車位的車輛會響應召喚、駛出車位并前往車主所在位置;5)交通燈、標志識別;6)市區自動輔助轉向,檢測車道、車輛和障礙物,并操作車輛進行轉向;7)自動速度偏移調整,可根據不同的環境和場景,自主調整車輛的行駛速度。
特斯拉作為純視覺方案引領者,攝像頭是FSD智駕的核心
不同于大部分國內廠商多傳感器融合方案,特斯拉FSD自動駕駛是以攝像頭為核心的純視覺解決方案。純視覺方案的最初設計靈感來自對人類視覺的研究;即人眼睛搜集的信息到達視網膜后,經過大腦皮層的多個區域、神經層,最終形成生物視覺,并在腦中生成圖像。特斯拉的目標就是通過算法、軟件及硬件來設計汽車的視覺皮層,建立像人腦一樣的、基于視覺的計算機神經網絡系統。 首先,在特斯拉汽車行駛過程中,車輛通過攝像頭收集環境圖像信息;特斯拉HW2.0/2.5/3.0版本硬件都配備了8顆監測不同方位的攝像頭,分別為三顆前置攝像頭(其中1顆主攝像頭、1顆廣角攝像頭、1顆窄視長焦攝像頭)、2顆前側攝像頭、2顆后側攝像頭、以及1顆后置攝像頭。
算法端迭代
自動駕駛的算法模塊通常分為 “感知” 、 “決策規劃” 、 “運動控制” 。其中,“感知”模塊是自動駕駛的核心,大部分的技術升級都集中在感知模塊,其目的是讓車輛對駕駛環境的 “感知”達到人類感知的級別;而“決策規劃”則是基于“感知”模塊輸出的結果,通過規劃汽車行為和行車路徑,使得汽車達到指定目的地,且盡可能確保行車安全性、效率性和舒適性。
感知層面,特斯拉經歷了由“特征提取網絡RegNet”向“BEV+Transfomer ” 、再向“BEV+Transfomer+Occupancy Network”轉變,決策規劃層面則自2021年由“Rule-based”向“Machine learning-based”逐步傾斜;直至2024年1月,特斯拉通過推出FSD V12 Beta,成為全球首個“端到端”神經網絡量產上車的企業,實現了感知、決策、規劃相融合。
算法4.0:Occupancy Network的應用降低計算復雜性,時序信息的引入則將圖像識別推向4D
決策層面:2021年,特斯拉開始在路徑規劃層面部分加入神經網絡的元素,推出“蒙特卡羅樹搜索算法”,通過路徑選擇概率和局面評估來輸出決策;但該階段僅少部分使用神經網絡,大部分依然是人工規則代碼。2022年,新推出的“交互搜索網絡”將蒙特卡羅算法結合應用到Occupancy網絡中,計算出的每個軌跡都會有一個成本函數來優化樹搜索給出候選目標較多等問題,該函數取決于碰撞概率、舒適度、干預可能性和人類操作相似性這四大因素;交互搜索網絡成功將計算耗時從1到5毫秒降低到100微秒;但函數部分仍然是基于規則的代碼。
軟件方面:2021年馬斯克宣布FSD Beta編號從V8.1開始。從大版本號升級來看,基本維持一年一更新的節奏;更新頻率來看,則呈現較為明顯的加速迭代,由期初的兩月一更,逐步演變為每月兩到三更、甚至每月四更。伴隨著測試范圍的擴大及駕駛數據的增加,V9/V10/V11版本主要聚焦在功能的優化上,不斷加深智能駕駛的擬人化程度。
HW3.0→HW4.0: 攝像頭數量新增50%,毫米波雷達以高精度4D版本回歸
此前棄用毫米波雷達的原因(1)一方面系傳統毫米波雷達低分辨率造成融合感知性能下降;特斯拉人工智能總監曾表示,對于低分辨率雷達來說,通過類似立交橋這樣的場景時,由于雷達的仰角分辨率很低,很難分辨出立交橋和下面停著的車輛,極易導致碰撞。(2)另一方面則系毫米波雷達信道數量限制了其感知能力的提升;相較而言,攝像頭能夠產生大量數據,軟件的改進可以使這些數據得到最大限度的利用。
而對于毫米波雷達的回歸,主要系(1)高精度4D毫米波雷達的分辨率大幅提升;2021年起,NXP、TI等雷達芯片方案商,以及大陸集團采埃孚、博世等雷達系統供應商都在加快推動4D成像毫米波雷達的量產落地;新的4D毫米波雷達分辨率性能大幅提升,具備點云輸出(與視覺或激光雷達更好的融合,以及可能的分類識別能力)以及全天候等性能,成為了高階方案的選擇項之一。(2)能夠彌補純視覺方案的風險;特斯拉被大眾詬病的“幽靈剎車”問題(毫無征兆地剎車),主要系傳感器的感知缺陷造成的,由于夜間或大霧或大雨等惡劣天氣條件下、攝像頭的性能較差;同時,攝像頭反應時間通常也較毫米波雷達長,往往需要幾幀來識別物體的速度變化。而相對的,毫米波雷達根據發射頻率和接收頻率的差值測量距離、相對速度和方向,在夜間、逆光、霧、雨、雪環境下也能使用。
解析特斯拉FSD
受益于數據量、算力、硬件適配度方面的領先,特斯拉FSD的技術競爭力較強
(1)數據量:AI模型的效果取決于輸入數據的數量及質量,輸入的優秀行駛數據越多,AI模型便能做出更適合、更優異的行駛決策。FSD自2020年10月開始北美地區內測,隨著FSD推送地區及推送用戶的增多,特斯拉擁有的行駛數據會呈指數級上漲;在數據量上,國內廠商的追趕難度較高。2024年4月,特斯拉宣布其全自動駕駛(FSD)技術助力下的汽車已經行駛了超過10億英里、相當于16.1億公里,而國內廠商方面,暫無達到該里程數的企業。
2)龐大的算力中心:AI模型接受數據訓練,是建立在算力平臺上的,其計算能力及算力投入都是關鍵指標。 1)算力方面,小鵬基于阿里云打造的“扶搖”智能計算平臺,算力可達600PFLOPS(每秒浮點運算60億億次),而2022年特斯拉算力中心的算力已經達到了 2 EFLOPS(每秒浮點運算200億億次)。未來,特斯拉自研超級算力平臺Dojo投入使用后,其算力還將上升一個臺階;根據特斯拉2023年6月發布的算力發展規劃,Dojo將在2024年10月達到100 EFlops算力。 2)算力投入方面,2022年特斯拉AI DAY上,馬斯克表示目前特斯拉擁有超過14000顆GPU的超級算力中心;2023年8月,特斯拉啟動了10000顆H100 GPU的新訓練集群,H100 GPU的運算效能是前一代A100的五倍快,價格昂貴、單顆將近40000美元。與此同時,算力平臺的后期維護成本還要遠高于硬件成本;馬斯克曾公開表示,2023年特斯拉花在擴大訓練運算算力的預算就超過20億美元,并表示2024年會采取同樣的行動;相較而言,國內廠商的算力投入與特斯拉仍存在較大差異。
(3)適配度高的自研硬件解決方案:特斯拉從2016年2月組建芯片團隊,到2019年4月成功推出FSD芯片,歷時三年之久推出HW硬件解決方案。自研的HW3.0是第一款完全出自車企的自動駕駛硬件解決方案,同時也是量產車型上目前深度學習理論性能最強的方案;而目前,HW已經進化到了4.0時代。 自研硬件的優勢,首先是性價比高、利用率高,大幅降低FSD的硬件成本;其次是開發自由度高,更能支持特斯拉的創新性算法及其他相關技術方案。相較來看,大部分國內廠商采用外購芯片方案,在適配度及利用率上,都與特斯拉自研硬件解決方案存在一定的差距