在國地中心,劉強是教機器人“做人”的訓(xùn)練師之一。他每天的工作內(nèi)容非常固定——穿戴好設(shè)備,指導(dǎo)機器人進(jìn)行上肢訓(xùn)練。最近,劉強正在訓(xùn)練的項目是齒輪收納,通過一遍遍演示,教會機器人將不同規(guī)格的齒輪放進(jìn)收納盒內(nèi)。如何識別、怎么抓起、用多少力,“笨拙”的機器人并不知道,需要手把手教。為了讓機器人變得更聰明,他還會在桌面上放一些干擾物,再進(jìn)行訓(xùn)練。訓(xùn)練的難度因任務(wù)而異,比如疊衣服這項人類最普通的家務(wù)之一,對機器人而言,難度系數(shù)相當(dāng)高。從前端采集的數(shù)據(jù)還需經(jīng)過進(jìn)一步校準(zhǔn)、識別,再由研發(fā)團(tuán)隊運用于機器人的自主訓(xùn)練。之后,在沒有訓(xùn)練師介入的情況下,機器人通過現(xiàn)有的數(shù)據(jù)在虛擬環(huán)境中獨立完成訓(xùn)練。
所有機器人的動作學(xué)習(xí),本質(zhì)上都是“人教”的。通過人類反復(fù)演示,然后轉(zhuǎn)化為數(shù)據(jù),再用這些數(shù)據(jù)去反復(fù)訓(xùn)練模型,直至其熟練掌握。余工團(tuán)隊正在努力嘗試一種信息量更飽滿的數(shù)據(jù)采集方式。傳統(tǒng)的數(shù)據(jù)采集只記錄了“軌跡”,而通過動捕服和遠(yuǎn)程遙控,可以同時記錄下機器人底層電機的控制數(shù)據(jù)。這意味著機器人可以更高效地學(xué)會新技能。以前要學(xué)一百遍的,以后可能十遍就會了。
新的問題也隨之而來。如果讓一個大模型直接去控制每一個電機、每一個關(guān)節(jié),頻率太高。于是,他和團(tuán)隊選擇了“分層”的方案:底層相對較小的模型以非常高的頻率去控制機器人的每一個關(guān)節(jié),保持平衡、執(zhí)行動作。上層的大模型只需以較低的頻率發(fā)出指令,至于怎么放、用多大力、如何保持身體不倒,底層的“小腦”自己解決。這未必是行業(yè)里訓(xùn)練機器人的終極方案,但在當(dāng)下,這是一種有可能跑通的路徑。
3月27日,北京。網(wǎng)友讓機器人跑馬拉松,工程師們在后面死活追不到,工程師們:回來!頭還沒安上。...
2026-03-27 23:39:41機器人沒安頭就跑了工程師追不上