對(duì)于駕駛而言,感知交通環(huán)境信息越全面、越及時(shí),駕駛的安全性也就相對(duì)越高。因此,自動(dòng)駕駛系統(tǒng)對(duì)感知能力的需求是沒(méi)有上限的。
BEV網(wǎng)絡(luò)固然可以檢測(cè)白名單障礙物,但能檢測(cè)到1000多種物體基本上就是目前BEV網(wǎng)絡(luò)的感知上限。OCC占用網(wǎng)絡(luò)可以檢測(cè)通用障礙物,但OCC算法的運(yùn)算量跟隨網(wǎng)格的大小成倍變化,網(wǎng)格大小縮減一倍,OCC算法的運(yùn)算量將增加8倍,受限于算力和實(shí)時(shí)性,OCC網(wǎng)格的大小一般只能做到10厘米左右,這就意味著它很難檢測(cè)微小物體。在很多情況下,10公分大的物體足以造成交通事故了。
不僅如此,那些和駕駛安全、效率、舒適性密切相關(guān)的天氣、光照、雨霧等復(fù)雜語(yǔ)義,也是目前的BEV+OCC所解決不了的,而光照和天氣恰恰是可以影響自動(dòng)駕駛車(chē)輛行駛的關(guān)鍵要素。
數(shù)據(jù)正在成為端到端最大瓶頸
相較于分模塊的自動(dòng)駕駛方案,端到端方案主要解決了兩個(gè)問(wèn)題。首先,從人工邏輯代碼到數(shù)據(jù)驅(qū)動(dòng),人工智能真正擺脫了“人工”,從此可以使用海量的數(shù)據(jù)迭代模型的性能;其次,通過(guò)自動(dòng)抽取信息,減少信息損失,可以充分利用數(shù)據(jù)中的信息。
在過(guò)去幾年的時(shí)間里,隨著Transformer+BEV+OCC的問(wèn)世,分立級(jí)聯(lián)的感知模塊已經(jīng)慢慢完成了到端到端感知的切換,自2023年下半年以來(lái)這波端到端狂潮引發(fā)的“從人工邏輯代碼到數(shù)據(jù)驅(qū)動(dòng)”的轉(zhuǎn)變,其實(shí)主要體現(xiàn)在決策和規(guī)劃層面。
決策和規(guī)劃從一板一眼的手工編寫(xiě)規(guī)則進(jìn)化到基于神經(jīng)網(wǎng)絡(luò)的經(jīng)驗(yàn)直覺(jué),這種AI化和端到端化使得可以通過(guò)海量數(shù)據(jù)不間斷訓(xùn)練優(yōu)化駕駛策略,復(fù)現(xiàn)擬人且絲滑的老司機(jī)腳法。決策和規(guī)劃的進(jìn)步是巨大的,相比之下,感知能力的進(jìn)步并不大。