小米創(chuàng)辦人、董事長兼CEO雷軍日前在社交平臺(tái)宣布,小米技術(shù)團(tuán)隊(duì)發(fā)布了全新的一步式潛空間語言視覺推理框架——Xiaomi OneVL,并將該模型的權(quán)重及訓(xùn)練、推理代碼全面開源。
Xiaomi OneVL是繼今年3月發(fā)布XLA認(rèn)知大模型架構(gòu)后,小米取得的又一重大技術(shù)成果。這一框架通過潛空間推理技術(shù),首次將視覺語言動(dòng)作(VLA)、世界模型以及潛空間推理三大主流技術(shù)路線整合到同一套框架中。
雷軍表示,模型與代碼全面開源,歡迎全球開發(fā)者和研究人員共同參與,探索自動(dòng)駕駛大模型的更多可能性。此外,在推理和規(guī)劃等多個(gè)主流基準(zhǔn)上,Xiaomi OneVL刷新了潛在推理方法的性能上限。