來和機(jī)器狗一起運(yùn)動吧,你的羽毛球搭子來了。通過強(qiáng)化學(xué)習(xí),機(jī)器狗學(xué)會了獨(dú)立打羽毛球,無論是在室外還是室內(nèi)都能應(yīng)對自如。
研究人員開發(fā)了全身視覺運(yùn)動控制策略,同步控制機(jī)器狗的腿部移動和手臂揮拍動作。最終,機(jī)器狗的最高揮拍速度達(dá)到了12米/秒。在與人類選手的比賽中,某一回合連續(xù)擊球10次,甚至出現(xiàn)了擊球后回位中心的類人行為。該研究在各種環(huán)境中進(jìn)行了大量實(shí)驗(yàn),驗(yàn)證了四足機(jī)器人預(yù)測羽毛球軌跡、有效導(dǎo)航服務(wù)區(qū)域以及對人類球員進(jìn)行精準(zhǔn)打擊的能力,證明了足式移動機(jī)器人在復(fù)雜和動態(tài)體育場景中的應(yīng)用可行性。研究團(tuán)隊(duì)來自蘇黎世聯(lián)邦理工學(xué)院,相關(guān)論文發(fā)表在《科學(xué)·機(jī)器人》雜志上。
學(xué)會打羽毛球的機(jī)器狗配置如下:主體由一個(gè)四足ANYmal-D底座和一個(gè)動態(tài)手臂DynaArm組成。它配備了一個(gè)帶有全局快門的ZED X立體相機(jī)用于羽毛球感知。相機(jī)計(jì)算出的羽毛球位置和機(jī)器人本體感知觀測值一起被輸入到強(qiáng)化學(xué)習(xí)策略中。然后生成關(guān)鍵指令來控制四足底座。羽毛球拍相對于腕關(guān)節(jié)呈45°角定向,這是根據(jù)早期仿真測試得出的最佳配置。在部署過程中,機(jī)器狗以400 Hz的頻率運(yùn)行,同時(shí)機(jī)器人控制策略以100 Hz的速率更新觀測值并發(fā)送關(guān)節(jié)位置指令。系統(tǒng)的感知模塊包括羽毛球位置測量、狀態(tài)估計(jì)和軌跡預(yù)測,以60 Hz的頻率異步運(yùn)行。
基于這個(gè)配置,機(jī)器狗和人類業(yè)余羽毛球選手進(jìn)行了比賽。盡管存在一些失誤,但機(jī)器狗能夠根據(jù)不同速度和落點(diǎn)的來球做出適當(dāng)反應(yīng)。平均來說,感知模塊在對手機(jī)球后需要花費(fèi)0.357秒來判斷攔截軌跡。通常,羽毛球會在0.654秒后達(dá)到四足底座上方1.25米然后被攔截。記錄中,機(jī)器狗從預(yù)測到擊球最快耗時(shí)0.367秒。在官方放出的視頻中,有一次對打進(jìn)行了10次連續(xù)擊球。每次擊球后,機(jī)器狗會自動向球場中心移步,類似于人類玩家調(diào)整站位和站姿為下一次擊球做準(zhǔn)備。
在給定真實(shí)感知的情況下,研究人員評估了在指令揮拍時(shí)間到達(dá)攔截位置0.1米范圍內(nèi)的擊球百分比。仿真結(jié)果表明,在發(fā)球區(qū),機(jī)器狗攔截來球幾乎一攔一個(gè)準(zhǔn),失敗率可忽略不計(jì)。但在發(fā)球區(qū)邊界或羽毛球直接落在機(jī)器狗身后時(shí),預(yù)測羽毛球軌跡并成功攔截就變得非常困難。當(dāng)羽毛球從正上方或正后方接近機(jī)器狗時(shí),它必須直接向上俯仰,這對機(jī)器狗來說很有難度。執(zhí)行10m/s的揮拍速度時(shí),機(jī)器狗基本都能跟蹤指令速度;速度超過10m/s時(shí),精度就會下降。當(dāng)命令其以19m/s揮拍時(shí),機(jī)器狗出現(xiàn)了最高執(zhí)行速度,即12.06m/s。相比之下,業(yè)余羽毛球運(yùn)動員可以達(dá)到20m/s至30m/s的揮拍速度。系統(tǒng)在接近其電流和關(guān)節(jié)速度極限的情況下運(yùn)行以實(shí)現(xiàn)這些指令。更高的指令速度導(dǎo)致基座角速度增加,表明基座姿態(tài)控制與操作器揮動之間存在耦合。球拍在指令的擊球時(shí)刻精確到達(dá)其最近點(diǎn)。在指令12m/s揮拍時(shí),機(jī)器狗執(zhí)行的平均揮拍速度為10.8m/s,平均位置誤差為0.117米。換句話說,當(dāng)球拍以目標(biāo)速度移動時(shí),僅有0.0108秒的偏移。
在整個(gè)羽毛球大戰(zhàn)中,機(jī)器狗會自主學(xué)習(xí)動態(tài)調(diào)整相機(jī)姿態(tài),根據(jù)任務(wù)緊迫性動態(tài)調(diào)整步態(tài),包括短距離微調(diào)姿態(tài)、中距離不規(guī)則步態(tài)、長距離類疾馳步態(tài)等。例如,它以快跑進(jìn)行遠(yuǎn)距離快速攔截,并在近距離回?fù)魰r(shí)穩(wěn)定,動態(tài)協(xié)調(diào)手臂和腿部。
打羽毛球的難點(diǎn)在于需要復(fù)雜的步法和上肢運(yùn)動之間的相互協(xié)調(diào)。對機(jī)器狗來說,這也是一項(xiàng)需要精確協(xié)調(diào)感知、移動和手臂揮動的任務(wù)。更進(jìn)一步來說,需要在動態(tài)環(huán)境中協(xié)調(diào)下肢與上肢之間的運(yùn)動,并使肢體控制與感知對齊。這不僅依賴于硬件,還取決于控制算法。當(dāng)前控制器和硬件存在不足,而羽毛球?qū)Ω兄?、移動和操作之間復(fù)雜的相互作用提出了極高的要求,需要平衡“快速響應(yīng)的移動”與“精確的手臂運(yùn)動”。
研究團(tuán)隊(duì)提出了一種基于強(qiáng)化學(xué)習(xí)的統(tǒng)一控制策略,用于涉及所有自由度的全身視覺運(yùn)動技能,以實(shí)現(xiàn)有效的羽毛球跟蹤和擊打。該策略利用真實(shí)世界相機(jī)數(shù)據(jù)的感知噪聲模型提供信息,確保仿真與部署之間感知誤差水平的一致性,并促進(jìn)學(xué)習(xí)主動感知行為。此外,該方法還包括一個(gè)羽毛球預(yù)測模型和用于魯棒運(yùn)動控制的約束強(qiáng)化學(xué)習(xí),以增強(qiáng)部署準(zhǔn)備度。與基準(zhǔn)相比,在沒有明確的視野范圍獎勵的情況下,機(jī)器狗即可實(shí)現(xiàn)更低的感知誤差和更高效的機(jī)械功率使用。當(dāng)前系統(tǒng)主要依賴一個(gè)商用立體相機(jī)上的擴(kuò)展卡爾曼濾波器(EKF)進(jìn)行羽毛球狀態(tài)估計(jì)。未來可以通過整合額外的傳感模態(tài)來改進(jìn),例如通過扭矩和聲音進(jìn)行沖擊檢測,或加入額外的RGB、深度或事件相機(jī),以增強(qiáng)機(jī)器人在更激烈的游戲場景中的物理交互響應(yīng)。鑒于人類球員通常通過觀察對手動作來預(yù)測羽毛球軌跡,人體姿態(tài)估計(jì)也可能是一種提高策略性能的有價(jià)值模態(tài)。
1月22日,云深科技發(fā)布旗下“山貓”機(jī)器狗靈活雪中秀的視頻,還放煙花祝大家蛇年吉祥。視頻中,機(jī)器狗在野外跋山涉水還可以完成空翻、沖跳、極低跑酷等動作。...
2025-01-24 01:48:52國產(chǎn)機(jī)器狗變身舞蹈達(dá)人在一條筆直的公路上,四足機(jī)器人“黑豹”正加速追趕前方奔跑的運(yùn)動員。鏡頭從俯瞰到平視,記錄下機(jī)器人反超的過程,定格的一瞬,“黑豹”只留下一道黑色殘影
2025-02-23 14:24:14王興興極限測試機(jī)器狗機(jī)器狗遇柴犬兩狗互相拜年近日,福建一柴犬上街遇到機(jī)器狗,“兩狗”互相拜年引路人圍觀。有網(wǎng)友調(diào)侃:柴犬在拜見金剛大哥。...
2025-01-13 10:55:36機(jī)器狗遇柴犬兩狗互相拜年