电竞下注-中国电竞赛事及体育赛事平台

當(dāng)前位置:資訊 > 中國(guó)資訊 > 正文

中國(guó)團(tuán)隊(duì)為機(jī)器人裝上“智能大腦”(2)

NeoVerse-ABot模型的核心,就是為機(jī)器人搭建了一座連接“感知”與“決策”的橋梁。它接收兩類信息:一是機(jī)器人當(dāng)前“看到”的場(chǎng)景,二是它“計(jì)劃”執(zhí)行的動(dòng)作序列。模型的任務(wù)就是精準(zhǔn)預(yù)測(cè)接下來(lái)環(huán)境、物體和機(jī)械臂之間將會(huì)發(fā)生怎樣的連鎖變化。

過(guò)去,大家比拼的是誰(shuí)能生成更好看的視頻,該團(tuán)隊(duì)成員表示,這次ICRA賽道的難點(diǎn)在于,要求模型必須服從動(dòng)作指令。換言之,模型不能“腦補(bǔ)”出一個(gè)畫面精美但動(dòng)作錯(cuò)誤的未來(lái)。NeoVerse-ABot在圖像質(zhì)量和動(dòng)作跟隨兩個(gè)核心指標(biāo)上均排名全球第一。這意味著,中國(guó)團(tuán)隊(duì)開發(fā)的模型不僅能生成高清畫面,更能嚴(yán)格遵循物理規(guī)律,將控制信號(hào)準(zhǔn)確轉(zhuǎn)化為物體的運(yùn)動(dòng)、接觸與狀態(tài)變化。團(tuán)隊(duì)成員表示,這說(shuō)明在具身智能的關(guān)鍵基礎(chǔ)問(wèn)題上,中國(guó)已具備了與國(guó)際頂尖隊(duì)伍同臺(tái)競(jìng)爭(zhēng)并取得領(lǐng)先的系統(tǒng)性能力。

“動(dòng)作幻覺”威脅很大

在世界模型研發(fā)領(lǐng)域,“動(dòng)作幻覺”是長(zhǎng)期困擾全球科研團(tuán)隊(duì)的核心難點(diǎn),也是制約機(jī)器人從實(shí)驗(yàn)室走向真實(shí)場(chǎng)景的關(guān)鍵阻礙?!皠?dòng)作幻覺”是指模型脫離機(jī)器人實(shí)際動(dòng)作指令與物理邏輯,憑借訓(xùn)練數(shù)據(jù)的常見模式“腦補(bǔ)”理想化結(jié)果,出現(xiàn)“空抓卻顯示抓取成功”等虛假畫面。這種視覺逼真但邏輯失真的問(wèn)題,會(huì)導(dǎo)致機(jī)器人低估操作風(fēng)險(xiǎn)、做出不安全動(dòng)作,威脅工業(yè)、民生服務(wù)等場(chǎng)景的設(shè)備、物品與人身安全。

在備賽過(guò)程中,該團(tuán)隊(duì)將破解“動(dòng)作幻覺”作為核心攻堅(jiān)方向。團(tuán)隊(duì)摒棄“失敗樣本是訓(xùn)練噪聲”的傳統(tǒng)認(rèn)知,明確真實(shí)場(chǎng)景的失敗軌跡、偏移動(dòng)作、交互誤差都是極具價(jià)值的監(jiān)督信號(hào)。該團(tuán)隊(duì)系統(tǒng)梳理海量遙操作數(shù)據(jù),重點(diǎn)挖掘夾空、滑落、補(bǔ)夾等失敗片段,提升這類長(zhǎng)尾樣本在訓(xùn)練體系中的權(quán)重,讓模型充分學(xué)習(xí)真實(shí)物理交互的完整結(jié)果分布。

推薦閱讀

24小時(shí)熱點(diǎn)