电竞下注-中国电竞赛事及体育赛事平台

當(dāng)前位置:資訊 > 中國資訊 > 正文

中國團(tuán)隊(duì)為機(jī)器人裝上“智能大腦”

想象一下,機(jī)器人不再只是機(jī)械地執(zhí)行“向前、向左、抓取”的指令,而是在行動前能像人類那樣先“想一想”:我的手這樣伸過去,能碰到杯子嗎?如果夾得太松,杯子會不會在半路滑落?擁有這樣更智能的“大腦”將成為現(xiàn)實(shí)。近日,全球機(jī)器人領(lǐng)域頂級學(xué)術(shù)盛會2026年國際機(jī)器人與自動化會議(ICRA)在奧地利維也納落下帷幕,中國科學(xué)院自動化研究所模式識別實(shí)驗(yàn)室牽頭的聯(lián)合團(tuán)隊(duì)研發(fā)的模型一舉拿下圖像質(zhì)量、動作跟隨兩大核心指標(biāo)全球第一,打破了傳統(tǒng)機(jī)器人智能的技術(shù)桎梏,為世界模型落地真實(shí)機(jī)器人操作場景提供了關(guān)鍵驗(yàn)證。這個模型的突破之處何在?未來將應(yīng)用于哪些場景?《環(huán)球時報》記者采訪了該團(tuán)隊(duì)負(fù)責(zé)人。

中國團(tuán)隊(duì)為機(jī)器人裝上“智能大腦”

中方團(tuán)隊(duì)的世界模型生成效果。(受訪者供圖)

讓機(jī)器人學(xué)會“三思而后行”

在ICRA備受關(guān)注的全球性具身智能挑戰(zhàn)賽的世界模型賽道中,中方團(tuán)隊(duì)研發(fā)的NeoVerse-ABot模型從全球27個國家和地區(qū)的526支頂尖隊(duì)伍中強(qiáng)勢登頂,以0.829的高分?jǐn)孬@冠軍。所謂世界模型,是指人工智能的“內(nèi)部模擬器”,讓它能像人一樣在“腦?!敝型蒲菸磥怼⒁?guī)劃行動。

長期以來,大眾認(rèn)知中的機(jī)器人大多是“所見即所行”的執(zhí)行工具,只能依托實(shí)時視覺感知完成預(yù)設(shè)動作,缺乏對物理世界的理解與預(yù)判能力。一旦遇到空抓、物體滑落、軌跡偏移等非理想場景,傳統(tǒng)機(jī)器人極易出現(xiàn)操作失誤,難以適配復(fù)雜多變的真實(shí)環(huán)境。

在NeoVerse-ABot團(tuán)隊(duì)看來,這是區(qū)分“高級機(jī)器”與“智能體”的關(guān)鍵分水嶺。該團(tuán)隊(duì)成員說,“可以把它理解為機(jī)器人的‘物理想象力’”,傳統(tǒng)機(jī)器人更像是“條件反射”的執(zhí)行者——看到紅色就停止,感受到阻力就后退。它們擅長即時反饋和軌跡跟蹤,卻無法預(yù)判自己行為的長遠(yuǎn)后果。

NeoVerse-ABot模型的核心,就是為機(jī)器人搭建了一座連接“感知”與“決策”的橋梁。它接收兩類信息:一是機(jī)器人當(dāng)前“看到”的場景,二是它“計(jì)劃”執(zhí)行的動作序列。模型的任務(wù)就是精準(zhǔn)預(yù)測接下來環(huán)境、物體和機(jī)械臂之間將會發(fā)生怎樣的連鎖變化。

過去,大家比拼的是誰能生成更好看的視頻,該團(tuán)隊(duì)成員表示,這次ICRA賽道的難點(diǎn)在于,要求模型必須服從動作指令。換言之,模型不能“腦補(bǔ)”出一個畫面精美但動作錯誤的未來。NeoVerse-ABot在圖像質(zhì)量和動作跟隨兩個核心指標(biāo)上均排名全球第一。這意味著,中國團(tuán)隊(duì)開發(fā)的模型不僅能生成高清畫面,更能嚴(yán)格遵循物理規(guī)律,將控制信號準(zhǔn)確轉(zhuǎn)化為物體的運(yùn)動、接觸與狀態(tài)變化。團(tuán)隊(duì)成員表示,這說明在具身智能的關(guān)鍵基礎(chǔ)問題上,中國已具備了與國際頂尖隊(duì)伍同臺競爭并取得領(lǐng)先的系統(tǒng)性能力。

“動作幻覺”威脅很大

在世界模型研發(fā)領(lǐng)域,“動作幻覺”是長期困擾全球科研團(tuán)隊(duì)的核心難點(diǎn),也是制約機(jī)器人從實(shí)驗(yàn)室走向真實(shí)場景的關(guān)鍵阻礙?!皠幼骰糜X”是指模型脫離機(jī)器人實(shí)際動作指令與物理邏輯,憑借訓(xùn)練數(shù)據(jù)的常見模式“腦補(bǔ)”理想化結(jié)果,出現(xiàn)“空抓卻顯示抓取成功”等虛假畫面。這種視覺逼真但邏輯失真的問題,會導(dǎo)致機(jī)器人低估操作風(fēng)險、做出不安全動作,威脅工業(yè)、民生服務(wù)等場景的設(shè)備、物品與人身安全。

在備賽過程中,該團(tuán)隊(duì)將破解“動作幻覺”作為核心攻堅(jiān)方向。團(tuán)隊(duì)摒棄“失敗樣本是訓(xùn)練噪聲”的傳統(tǒng)認(rèn)知,明確真實(shí)場景的失敗軌跡、偏移動作、交互誤差都是極具價值的監(jiān)督信號。該團(tuán)隊(duì)系統(tǒng)梳理海量遙操作數(shù)據(jù),重點(diǎn)挖掘夾空、滑落、補(bǔ)夾等失敗片段,提升這類長尾樣本在訓(xùn)練體系中的權(quán)重,讓模型充分學(xué)習(xí)真實(shí)物理交互的完整結(jié)果分布。

與此同時,該團(tuán)隊(duì)創(chuàng)新引入強(qiáng)化學(xué)習(xí)反饋機(jī)制,重構(gòu)模型評價體系。區(qū)別于傳統(tǒng)模型僅獎勵畫面清晰度、流暢度的單一標(biāo)準(zhǔn),該機(jī)制重點(diǎn)獎勵動作匹配、因果合理、物理合規(guī)的生成結(jié)果,大幅強(qiáng)化模型對機(jī)器人控制信號的敏感度,從根源抑制虛假生成問題。經(jīng)過多輪迭代優(yōu)化,NeoVerse-ABot能夠精準(zhǔn)區(qū)分成功操作與失敗交互,在非理想場景中真實(shí)預(yù)判物體原位留存、中途滑落等實(shí)際結(jié)果,擺脫“默認(rèn)成功”的固有缺陷。

賽場突圍賦能產(chǎn)業(yè)

當(dāng)前,具身智能已列入我國“十五五”規(guī)劃重點(diǎn)發(fā)展的未來產(chǎn)業(yè)。NeoVerse-ABot的奪冠不僅是學(xué)術(shù)勝利,更被視為中國機(jī)器人產(chǎn)業(yè)安裝“智能大腦”的關(guān)鍵一步。

放眼全球,國際頂尖模型均將可交互、可預(yù)判、可模擬的世界模型作為下一代AI核心發(fā)力方向,全球技術(shù)競爭日趨激烈。該團(tuán)隊(duì)負(fù)責(zé)人表示,客觀來看,世界模型仍處于快速迭代階段,我國尚未實(shí)現(xiàn)全面領(lǐng)跑,但在具身智能世界模型這一細(xì)分關(guān)鍵領(lǐng)域,中國團(tuán)隊(duì)已徹底擺脫單純跟隨局面,在動作精準(zhǔn)跟隨、失敗場景建模、工程化落地等核心維度,實(shí)現(xiàn)了與國際頂尖隊(duì)伍并跑、局部領(lǐng)先。

從國內(nèi)產(chǎn)業(yè)發(fā)展維度來看,此次技術(shù)突破精準(zhǔn)補(bǔ)齊了中國機(jī)器人產(chǎn)業(yè)的核心短板。目前,我國機(jī)器人核心零部件國產(chǎn)化進(jìn)程持續(xù)提速,硬件產(chǎn)業(yè)生態(tài)日趨完善,但缺乏高精度、高可靠的“智能大腦”,這長期制約產(chǎn)業(yè)從樣機(jī)展示走向規(guī)?;涞?。傳統(tǒng)機(jī)器人研發(fā)依賴真機(jī)試錯,數(shù)據(jù)采集成本高、長尾場景覆蓋難、迭代周期長,而NeoVerse-ABot可作為高可信“神經(jīng)仿真器”,通過虛擬環(huán)境預(yù)演生成海量物理真實(shí)的訓(xùn)練數(shù)據(jù),大幅降低真機(jī)試錯成本,加速機(jī)器人策略迭代與場景落地。

長遠(yuǎn)來看,這項(xiàng)技術(shù)擁有極為廣闊的應(yīng)用前景,將全面賦能多領(lǐng)域智能升級。在工業(yè)制造場景,可助力柔性生產(chǎn)機(jī)器人適配多樣零件與復(fù)雜工序,預(yù)判操作風(fēng)險、提升生產(chǎn)柔性;在倉儲物流、商業(yè)服務(wù)場景,能讓高頻次、多場景作業(yè)機(jī)器人自主調(diào)整策略、規(guī)避失誤;在家庭服務(wù)、養(yǎng)老醫(yī)療、特種作業(yè)等開放場景,可保障人機(jī)交互安全,提升機(jī)器人環(huán)境適配能力。此外,該技術(shù)還可延伸應(yīng)用至自動駕駛、低空智能、科學(xué)實(shí)驗(yàn)自動化等領(lǐng)域,成為通用智能體理解、適配真實(shí)世界的核心基礎(chǔ)能力。

該團(tuán)隊(duì)表示,對于中國具身智能產(chǎn)業(yè)發(fā)展,此次奪冠是一個全新起點(diǎn)。未來團(tuán)隊(duì)將持續(xù)深化技術(shù)研發(fā),推進(jìn)世界模型與大規(guī)模強(qiáng)化學(xué)習(xí)、在線規(guī)劃算法的深度融合。一方面優(yōu)化模型推理速度,適配機(jī)器人閉環(huán)實(shí)時控制需求;另一方面完善虛擬仿真訓(xùn)練體系,降低產(chǎn)業(yè)落地門檻。隨著核心技術(shù)的持續(xù)突破,中國具身智能產(chǎn)業(yè)將告別“重硬件、輕智能”的發(fā)展困境,依托數(shù)據(jù)、工程、場景的系統(tǒng)性優(yōu)勢,在全球AI新一輪競賽中持續(xù)搶占先機(jī),開啟智能機(jī)器人規(guī)?;?、實(shí)用化發(fā)展的全新篇章。

(責(zé)任編輯:zx0204)

推薦閱讀

24小時熱點(diǎn)