在剛剛落幕的世界人形機(jī)器人運(yùn)動(dòng)會(huì)上,一場全程無遙控的踢足球機(jī)器人比賽在網(wǎng)絡(luò)上引起了廣泛關(guān)注。這支機(jī)器人隊(duì)伍來自加速進(jìn)化(北京)機(jī)器人科技有限公司,該公司成立于2023年,并在今年7月舉行的2025 RoboCup巴西機(jī)器人足球世界杯上,幫助中國隊(duì)(清華火神隊(duì))首次在AdultSize組別奪冠,打破了歐美國家長達(dá)28年的壟斷。
加速進(jìn)化的機(jī)器人在足球場上的表現(xiàn)令人矚目。選擇足球賽事作為目標(biāo),是因?yàn)樽闱蛸愂且粋€(gè)高動(dòng)態(tài)、強(qiáng)對抗的場景,對運(yùn)動(dòng)控制和決策智能要求極高。趙維晨解釋說,人形機(jī)器人必須先做到“四肢健全”,再追求“心智健全”。足球場景是鍛煉機(jī)器人的運(yùn)動(dòng)能力、感知算法等關(guān)鍵技術(shù)的試金石,這些能力提升后可以遷移到未來的家庭陪伴、教育等更多場景。
談及技術(shù)路徑,趙維晨表示,當(dāng)前引發(fā)熱議的VLA技術(shù)路徑仍依賴大語言模型的邏輯,過于依賴海量標(biāo)注數(shù)據(jù)和固定模式,并不是最優(yōu)解,三到四年內(nèi)一定會(huì)被顛覆。
足球賽對人形機(jī)器人提出了許多技術(shù)挑戰(zhàn)。趙維晨認(rèn)為,有了強(qiáng)大的運(yùn)動(dòng)能力支撐,大腦算法可以先用相對簡單的分層模型落地應(yīng)用,通過真實(shí)場景的數(shù)據(jù)采集和合成數(shù)據(jù),逐步訓(xùn)練出認(rèn)知健全的大腦。足球場景能鍛煉機(jī)器人的運(yùn)動(dòng)能力、感知算法,比如識(shí)別球、隊(duì)友和對手位置、定位導(dǎo)航和決策邏輯,將來這些能力可以遷移到家庭場景,例如機(jī)器人能主動(dòng)迎接、跟隨,情感陪伴,充當(dāng)互動(dòng)教練,以及實(shí)現(xiàn)工業(yè)場景里精細(xì)的手部操作。
實(shí)現(xiàn)無遙控人形機(jī)器人參與踢足球的難度很大。趙維晨提到,足球賽事對抗激烈,機(jī)器人需要強(qiáng)大的運(yùn)控算法來抵御沖撞并保持平衡,摔倒后可在一秒內(nèi)自主起身。他們率先應(yīng)用端到端運(yùn)動(dòng)大模型,直接將視覺信號(hào)輸入神經(jīng)網(wǎng)絡(luò),輸出關(guān)節(jié)控制指令,大幅提升運(yùn)動(dòng)泛化性和穩(wěn)定性。他們的第一個(gè)應(yīng)用是大力射門,去年世界冠軍最高踢到35厘米,而他們能踢到2米,直接越過人墻。
從量子計(jì)算到深空探測,從人工智能到可控核聚變,從腦機(jī)接口到新能源,一場創(chuàng)新生態(tài)的系統(tǒng)性變革正在中國科技領(lǐng)域全面上演
2025-09-03 16:51:35中國芯片上演寒武紀(jì)大爆發(fā)背后