媒體專訪機器人公司加速進化副總裁 VLA算法將被顛覆

小大

用微信掃描二維碼
分享至好友和朋友圈

關鍵詞：

2025-08-26 11:28:05 澎湃新聞

在剛剛落幕的世界人形機器人運動會上，一場全程無遙控的踢足球機器人比賽在網(wǎng)絡上引起了廣泛關注。這支機器人隊伍來自加速進化（北京）機器人科技有限公司，該公司成立于2023年，并在今年7月舉行的2025 RoboCup巴西機器人足球世界杯上，幫助中國隊（清華火神隊）首次在AdultSize組別奪冠，打破了歐美國家長達28年的壟斷。

加速進化的機器人在足球場上的表現(xiàn)令人矚目。選擇足球賽事作為目標，是因為足球賽是一個高動態(tài)、強對抗的場景，對運動控制和決策智能要求極高。趙維晨解釋說，人形機器人必須先做到“四肢健全”，再追求“心智健全”。足球場景是鍛煉機器人的運動能力、感知算法等關鍵技術的試金石，這些能力提升后可以遷移到未來的家庭陪伴、教育等更多場景。

談及技術路徑，趙維晨表示，當前引發(fā)熱議的VLA技術路徑仍依賴大語言模型的邏輯，過于依賴海量標注數(shù)據(jù)和固定模式，并不是最優(yōu)解，三到四年內(nèi)一定會被顛覆。

足球賽對人形機器人提出了許多技術挑戰(zhàn)。趙維晨認為，有了強大的運動能力支撐，大腦算法可以先用相對簡單的分層模型落地應用，通過真實場景的數(shù)據(jù)采集和合成數(shù)據(jù)，逐步訓練出認知健全的大腦。足球場景能鍛煉機器人的運動能力、感知算法，比如識別球、隊友和對手位置、定位導航和決策邏輯，將來這些能力可以遷移到家庭場景，例如機器人能主動迎接、跟隨，情感陪伴，充當互動教練，以及實現(xiàn)工業(yè)場景里精細的手部操作。

實現(xiàn)無遙控人形機器人參與踢足球的難度很大。趙維晨提到，足球賽事對抗激烈，機器人需要強大的運控算法來抵御沖撞并保持平衡，摔倒后可在一秒內(nèi)自主起身。他們率先應用端到端運動大模型，直接將視覺信號輸入神經(jīng)網(wǎng)絡，輸出關節(jié)控制指令，大幅提升運動泛化性和穩(wěn)定性。他們的第一個應用是大力射門，去年世界冠軍最高踢到35厘米，而他們能踢到2米，直接越過人墻。

訓練數(shù)據(jù)主要來自足球場景采集的真實物理數(shù)據(jù)，并結合視頻合成數(shù)據(jù)，通過最新的模仿學習加強化學習實現(xiàn)視覺信號直接輸入神經(jīng)網(wǎng)絡。趙維晨認為，遙操的數(shù)據(jù)體量無法支撐具身大腦的訓練，目前視覺語言動作模型（VLA）算法還是基于大語言模型那套，未來三年內(nèi)會被全新的底層算法體系顛覆。

關于今年北京的世界機器人大會上關于視覺語言動作模型（VLA）的爭議，趙維晨表示，自動駕駛單日數(shù)據(jù)量可達上億條，而全國具身最大的開源數(shù)據(jù)集規(guī)模才百萬級別（不到10TB）。他認為，大語言模型迭代經(jīng)歷十多年海量語料，才形成如今的尺度定律（Scaling Law），而VLA模型總體依賴訓練數(shù)據(jù)中的固定模式，需要海量標注數(shù)據(jù)才能“記住”固定場景，很難幫具身泛化。

BoosterT1發(fā)售情況并未超出預期。2025年上半年出貨交付了數(shù)百臺，其中50%是全球化訂單，主要集中在賽事和科研。頂尖球隊采購他們的機器人軟硬件平臺，用于開發(fā)和測試決策算法。趙維晨表示，最核心的不是訂單量，而是交付量。他們現(xiàn)在T1成本價在10萬元人民幣左右，很多公司簽署了大量“意向訂單”，但如果沒有量產(chǎn)的工程化能力和交付能力，就不是真的商業(yè)化。他們的訂單交付周期在15到20天左右。

未來他們的商業(yè)化路徑也很清晰：短期做賽事、科研、教育（比如高校和K12的機器人課程），中期從明年開始切入家庭搬運、陪伴這些場景，長期結合開發(fā)者生態(tài)往家庭管家、智能助理這些通用機器人方向走。

對于人形機器人走進家庭場景，趙維晨表示，他們重點會放在家用機器人，使其成為除手機、電腦外新的交互形態(tài)和生產(chǎn)力工具。他們要做的三件事是硬件（端）、操作系統(tǒng)、開發(fā)者工具。大腦層面他們不著急，等三年后技術路線收斂些，有了一定收入體量再投入。

趙維晨認為，人形機器人進入家庭一定會經(jīng)歷從早期使用者到早期大眾最后到后期大眾的鏈路。核心是通過殺手級應用和教育進入早期使用者，再通過生態(tài)成熟、應用多樣化、成本下降進入大眾市場。這可能需要3到10年時間。

(責任編輯：zhangxiaohua)

關閉

媒體專訪機器人公司加速進化副總裁 VLA算法將被顛覆

相關新聞

今日熱點

頻道熱點