在剛剛落幕的世界人形機器人運動會上,一場全程無遙控的踢足球機器人比賽在網(wǎng)絡上引起了廣泛關注。這支機器人隊伍來自加速進化(北京)機器人科技有限公司,該公司成立于2023年,并在今年7月舉行的2025 RoboCup巴西機器人足球世界杯上,幫助中國隊(清華火神隊)首次在AdultSize組別奪冠,打破了歐美國家長達28年的壟斷。
加速進化的機器人在足球場上的表現(xiàn)令人矚目。選擇足球賽事作為目標,是因為足球賽是一個高動態(tài)、強對抗的場景,對運動控制和決策智能要求極高。趙維晨解釋說,人形機器人必須先做到“四肢健全”,再追求“心智健全”。足球場景是鍛煉機器人的運動能力、感知算法等關鍵技術的試金石,這些能力提升后可以遷移到未來的家庭陪伴、教育等更多場景。
談及技術路徑,趙維晨表示,當前引發(fā)熱議的VLA技術路徑仍依賴大語言模型的邏輯,過于依賴海量標注數(shù)據(jù)和固定模式,并不是最優(yōu)解,三到四年內(nèi)一定會被顛覆。
足球賽對人形機器人提出了許多技術挑戰(zhàn)。趙維晨認為,有了強大的運動能力支撐,大腦算法可以先用相對簡單的分層模型落地應用,通過真實場景的數(shù)據(jù)采集和合成數(shù)據(jù),逐步訓練出認知健全的大腦。足球場景能鍛煉機器人的運動能力、感知算法,比如識別球、隊友和對手位置、定位導航和決策邏輯,將來這些能力可以遷移到家庭場景,例如機器人能主動迎接、跟隨,情感陪伴,充當互動教練,以及實現(xiàn)工業(yè)場景里精細的手部操作。
實現(xiàn)無遙控人形機器人參與踢足球的難度很大。趙維晨提到,足球賽事對抗激烈,機器人需要強大的運控算法來抵御沖撞并保持平衡,摔倒后可在一秒內(nèi)自主起身。他們率先應用端到端運動大模型,直接將視覺信號輸入神經(jīng)網(wǎng)絡,輸出關節(jié)控制指令,大幅提升運動泛化性和穩(wěn)定性。他們的第一個應用是大力射門,去年世界冠軍最高踢到35厘米,而他們能踢到2米,直接越過人墻。
訓練數(shù)據(jù)主要來自足球場景采集的真實物理數(shù)據(jù),并結合視頻合成數(shù)據(jù),通過最新的模仿學習加強化學習實現(xiàn)視覺信號直接輸入神經(jīng)網(wǎng)絡。趙維晨認為,遙操的數(shù)據(jù)體量無法支撐具身大腦的訓練,目前視覺語言動作模型(VLA)算法還是基于大語言模型那套,未來三年內(nèi)會被全新的底層算法體系顛覆。
關于今年北京的世界機器人大會上關于視覺語言動作模型(VLA)的爭議,趙維晨表示,自動駕駛單日數(shù)據(jù)量可達上億條,而全國具身最大的開源數(shù)據(jù)集規(guī)模才百萬級別(不到10TB)。他認為,大語言模型迭代經(jīng)歷十多年海量語料,才形成如今的尺度定律(Scaling Law),而VLA模型總體依賴訓練數(shù)據(jù)中的固定模式,需要海量標注數(shù)據(jù)才能“記住”固定場景,很難幫具身泛化。
BoosterT1發(fā)售情況并未超出預期。2025年上半年出貨交付了數(shù)百臺,其中50%是全球化訂單,主要集中在賽事和科研。頂尖球隊采購他們的機器人軟硬件平臺,用于開發(fā)和測試決策算法。趙維晨表示,最核心的不是訂單量,而是交付量。他們現(xiàn)在T1成本價在10萬元人民幣左右,很多公司簽署了大量“意向訂單”,但如果沒有量產(chǎn)的工程化能力和交付能力,就不是真的商業(yè)化。他們的訂單交付周期在15到20天左右。
未來他們的商業(yè)化路徑也很清晰:短期做賽事、科研、教育(比如高校和K12的機器人課程),中期從明年開始切入家庭搬運、陪伴這些場景,長期結合開發(fā)者生態(tài)往家庭管家、智能助理這些通用機器人方向走。
對于人形機器人走進家庭場景,趙維晨表示,他們重點會放在家用機器人,使其成為除手機、電腦外新的交互形態(tài)和生產(chǎn)力工具。他們要做的三件事是硬件(端)、操作系統(tǒng)、開發(fā)者工具。大腦層面他們不著急,等三年后技術路線收斂些,有了一定收入體量再投入。
趙維晨認為,人形機器人進入家庭一定會經(jīng)歷從早期使用者到早期大眾最后到后期大眾的鏈路。核心是通過殺手級應用和教育進入早期使用者,再通過生態(tài)成熟、應用多樣化、成本下降進入大眾市場。這可能需要3到10年時間。
從量子計算到深空探測,從人工智能到可控核聚變,從腦機接口到新能源,一場創(chuàng)新生態(tài)的系統(tǒng)性變革正在中國科技領域全面上演
2025-09-03 16:51:35中國芯片上演寒武紀大爆發(fā)背后