不過,VLA的實現(xiàn)也不是一個突變的過程。在李想的技術(shù)演進框架中,AI智能被劃分為昆蟲動物智能、哺乳動物智能和人類智能三個階段。第一階段,理想汽車自2021年起自研依賴規(guī)則算法和高精地圖的輔助駕駛,類似“昆蟲動物智能”。第二階段,接近“哺乳動物智能”。理想汽車自2023年起研究,并于2024年正式推送的端到端+VLM(視覺語言模型)輔助駕駛,此階段通過三維圖像判斷自身速度和軌跡以及在空間中所處的位置,足以應(yīng)對大部分泛化場景,但很難解決從未遇到過或特別復(fù)雜的問題,需要配合視覺語言VLM模型,但現(xiàn)有視覺語言模型在應(yīng)對復(fù)雜交通環(huán)境時只能起到輔助作用。
在端到端的基礎(chǔ)上,到第三階段,VLA將開啟“人類智能”的階段——能通過3D和2D視覺的組合,完整地看到物理世界,而不像VLM僅能解析2D圖像。同時,VLA擁有完整的腦系統(tǒng),不僅能看見物理世界,更能進一步理解物理世界,具有自己的語言和思維鏈系統(tǒng),有推理能力,可以像人類一樣執(zhí)行一些復(fù)雜動作?!爸挥凶屗兂梢粋€真正的司機,它才是一個生產(chǎn)力工具,不只是一個輔助工具?!崩钕雽I工具分為信息工具、輔助工具和生產(chǎn)工具,在他看來,現(xiàn)階段人們大多還是把AI當作一個信息工具來用,這是不完美的。L2,L2+也只是把AI當成輔助工具在用,只有當AI成為生產(chǎn)工具時,人工智能才會真正爆發(fā)。
隨著AI能力躍升,行業(yè)也迎來關(guān)于“安全性”的拷問。最近智能駕駛技術(shù)安全性被質(zhì)疑,整個行業(yè)被推至輿論風(fēng)口浪尖,行業(yè)普遍面臨“能力提升悖論”:隨著自動駕駛能力的提升,其上限高,下限低的弊端也隨之暴露。超級對齊的目標就是通過設(shè)計有效且高效的對齊算法,確保這些超人類智能系統(tǒng)仍然安全、可靠并與人類價值觀保持一致。例如在彎道限速60時,其他車輛保持60kph,而自車保持30kph,此時自車就成了最危險的車輛,因此為了保證安全性,需要與其他車輛進行速度對齊,以60kph的速度行駛,更符合法規(guī)常識。
3月27日,2025中關(guān)村論壇年會開幕,會上發(fā)布了重大科技成果,其中理想汽車自研的整車操作系統(tǒng)“理想星環(huán)OS”入選北京重大開源系列成果
2025-03-27 13:45:32理想開源汽車操作系統(tǒng)