小鵬汽車已經(jīng)不再用“1024 Day”來稱呼自己的技術(shù)發(fā)布日,但依然在10月24日這天做了一場關(guān)于AI技術(shù)的發(fā)布會,主要是對小鵬P7+的智駕和智能座艙的AI技術(shù)做了分享。
活動內(nèi)容并不復(fù)雜,就是介紹了一下小鵬P7+上面即將推出的一些新技術(shù)、新功能,用了現(xiàn)在流行的AI、端到端這些詞匯,聽上去好像各家都差不多。但是里面有一些小鵬汽車對智駕路線的思考還是值得記錄一下,也能看到小鵬是如何看待自己的技術(shù)迭代。
首先我們知道,在5月份的時候,小鵬汽車就說自己發(fā)布國內(nèi)首個量產(chǎn)上車的端到端大模型,成為全球唯二量產(chǎn)端到端大模型的車企。但是真正落地,各家車企都是爭先恐后,比如華為ADS 3.0說自己感知模塊用了端到端,而理想汽車也說自己用了One Model的端到端,甚至趕在了小鵬這次發(fā)布會的前一天做了“全量推送”。
但是小鵬汽車副總裁、自動駕駛負(fù)責(zé)人李力耘博士分析了目前行業(yè)主流的三種端到端發(fā)展路線,認(rèn)為各個路線優(yōu)缺點(diǎn)明顯:一種是通過大量規(guī)則小模型堆疊的 “大模型”,其需要大量的優(yōu)秀規(guī)則工程師;一種是“車端大模型”,即直接將端到端模型部署于車輛上,雖然見效快,但受限于車端算力,且隨著后期訓(xùn)練數(shù)據(jù)量的增加,容易陷入瓶頸;最后一種便是云端大模型(foundation model),其參數(shù)量是車端模型的幾十倍甚至數(shù)百倍,這是單純的車端大模型所不可企及的。
按照我的理解,第一種大概就是說分段式端到端路線,技術(shù)實(shí)現(xiàn)上比較簡單,也可以說是端到端;第二種路線則是理想汽車的雙系統(tǒng)中的“系統(tǒng)2”,也就是視覺大模型,一個22億模型參數(shù)量的端側(cè)大模型。第三種則是使用了云端大模型的路線,也就是小鵬和華為的路線。
從李力耘的角度來看:“盡管選擇前兩種端到端的技術(shù)路線都能帶來一定成效,但從智駕競爭的終局來看,布局云端大模型才是制勝關(guān)鍵。而小鵬汽車早在預(yù)研端到端大模型的階段,就篤定要先構(gòu)建一個強(qiáng)大的‘云端大模型’,這也與全球頭部AI企業(yè)——OpenAI所選擇的路線不謀而合。”
怎么樣理解云端大模型的應(yīng)用呢?根據(jù)小鵬給出的示意圖,基本可以理解為云端大模型做出來以后會“知識蒸餾”成車端的端到端模型,再上車應(yīng)用。這樣的優(yōu)勢在于因?yàn)樵贫舜竽P妥銐虼螅畔⒘孔銐蜇S富——小鵬云端大模型的參數(shù)量將多達(dá)車端參數(shù)量80倍,如此大的參數(shù)量意味著云端大模型能夠全面吸納智駕數(shù)據(jù),不遺漏重點(diǎn)信息細(xì)節(jié)——這樣“蒸餾”出來的車端大模型上限也就更高。之后車輛的駕駛數(shù)據(jù)、離線強(qiáng)化學(xué)習(xí)也可以反饋給云端模型,不斷優(yōu)化。
因此,小鵬表示智駕還是需要更大的訓(xùn)練規(guī)模。目前,小鵬云端大模型的訓(xùn)練效率已提升了2.6倍,2025年小鵬云端的算力將會達(dá)到10EFlops以上。
當(dāng)然,從小鵬汽車選擇的純視覺路線來看,輕雷達(dá)、輕地圖的智駕方案本身也要求高算力大模型。比如相較于傳統(tǒng)的激光雷達(dá)方案,小鵬AI鷹眼視覺方案的攝像頭信息量是前者的80倍,而攝像頭能夠感知的語義和顏色信息是其100倍,攝像頭的反應(yīng)速度也是其3倍。這本身就要求更大算力、也要求大模型在處理方式上的不同。
按照小鵬汽車的說法,小鵬P7+的AI鷹眼視覺方案在體驗(yàn)上已經(jīng)可以和搭載激光雷達(dá)的現(xiàn)款車型的Max版本保持一致、同步更新。這或許也意味著,今后小鵬汽車是完全能夠以同一套純視覺方案來替代所有之前的智駕方案,只要都是2顆Orin X的芯片,理論上都能夠?qū)崿F(xiàn)接近的體驗(yàn)——之前有激光雷達(dá)的車型相當(dāng)于不用激光雷達(dá)的數(shù)據(jù)了。
