清華教授談人形機器人發(fā)展 自主與遙控并存的現(xiàn)狀。當(dāng)我們把鏡頭對準(zhǔn)人形機器人時,可以看到它們在跑道上摔倒后再爬起來,在復(fù)雜的有障礙的路面上“盲走”并保持平衡,或在5v5的機器人足球比賽場上完成一次次傳球、接球與射門,這些瞬間足夠驚艷。然而,若走出受控賽場或部分預(yù)設(shè)場景,面對一個未“標(biāo)注”的障礙物或一件未疊好的衣服時,它們往往需要由人來介入遙控。“人工遙控”因此成為人形機器人不可或缺的“第三只手”。這正是人形機器人發(fā)展所呈現(xiàn)出的一體兩面:人形機器人已經(jīng)具備了較強的運動能力,而對環(huán)境的理解與跨場景泛化仍是未解的短板。
清華大學(xué)教授、機器人控制實驗室主任趙明國表示,現(xiàn)在的人形機器人憑借其本體感知能力,可以完成走、跑、跳、翻跟頭,或在有障礙物的路面上行走,這種復(fù)雜動作的完成都需要其具備很強的智能水平。不過,目前許多人形機器人還不太具備理解環(huán)境的能力。比如說,當(dāng)前面有個障礙物時,它是否能夠自主繞行、是否能自主開門,這些方面還存在一些短板,需要人來指示。現(xiàn)階段相關(guān)任務(wù)的執(zhí)行可能80%是由人來遙控,20%是人形機器人自主完成,未來可能進(jìn)化到60%由人遙控、40%由機器人自主完成。當(dāng)前人形機器人在某些特殊場合已經(jīng)能夠?qū)崿F(xiàn)完全自主,但這些自主能力僅限于特定場地、特定任務(wù),場外遷移泛化能力還比較弱。
趙明國認(rèn)為,完全由人來遙控人形機器人的每一個關(guān)節(jié)是不現(xiàn)實的,最終一定會過渡到100%由人形機器人自主決策。當(dāng)然,人形機器人要實現(xiàn)所有環(huán)境下的完全自主還需要一個漫長的過程。從眼下來看,即便是要將人形機器人的自主能力提高到50%也仍然比較困難。理想中的人形機器人應(yīng)具備完全自主的能力,但現(xiàn)實是當(dāng)前的技術(shù)還遠(yuǎn)未達(dá)到這一目標(biāo)。一種主流思路是嘗試先構(gòu)建一個通用的人工智能基座,再針對如疊衣服、踢足球等不同垂直領(lǐng)域,分別注入專用數(shù)據(jù)進(jìn)行精細(xì)調(diào)整和訓(xùn)練,從而使人形機器人掌握特定技能。這一路徑在邏輯上看似合理,但也存在明顯的問題:如果機器人在單一具體任務(wù)上都未能做得足夠好,又何談建立一個能勝任所有任務(wù)的通用智能基座?這種構(gòu)想目前既難以被證實,也難以被證偽,本質(zhì)上存在一定的邏輯漏洞。
當(dāng)前,許多人從大語言模型的成功經(jīng)驗出發(fā),認(rèn)為可以將其模式遷移至人形機器人領(lǐng)域,但虛擬信息空間與真實物理空間之間存在本質(zhì)差異,前者的路徑對于后者而言未必能行得通。物理世界中的智能能力,必然需要大語言模型之外的另一套智能系統(tǒng)來支撐。目前,在真實物理世界的智能方面,我們主要依賴強化學(xué)習(xí)這一方法,但這還遠(yuǎn)遠(yuǎn)不夠。如何有效獲取物理數(shù)據(jù)或高質(zhì)量仿真數(shù)據(jù),仍是整個領(lǐng)域共同探索的課題。因此,未來更可能的發(fā)展方向是兩個世界的智能能力深度融合、協(xié)同工作。即便為了解決物理世界的問題而借助虛擬世界的手段,那也僅是工具層面的輔助,終極目標(biāo)仍是解決物理世界存在的一系列現(xiàn)實問題。當(dāng)前階段,我們更應(yīng)把這些問題進(jìn)行明確的定義,開展與大語言模型形成互補的研究工作。
趙明國認(rèn)為,不應(yīng)一刀切地用單一百分比去描述和定位人形機器人智能程度的占比。人應(yīng)該管人該做的部分,機器人應(yīng)該管機器人該做的部分;隨著時間的推移,人形機器人的感知和理解能力會逐步增強,人形機器人的智能化是一個漸進(jìn)突破的過程。從眼下來看,要讓人形機器人真正走進(jìn)普通人的日常生活,還需要一定的時間。車百會研究院近期發(fā)布的研究報告顯示,目前智能機器人仍屬于“玩具”“教具”“展具”“科研工具”,能夠通過預(yù)編程或高度優(yōu)化的演示環(huán)境,展現(xiàn)出較強的動作控制能力和流暢的語言交互能力,通過“演示”吸引公眾關(guān)注,但距離產(chǎn)業(yè)成熟規(guī)模化應(yīng)用階段仍有距離,需解決數(shù)據(jù)、標(biāo)準(zhǔn)、安全、場景融合等問題。
趙明國指出,要提升人形機器人的智能化水平,意味著必然對人形機器人的硬件能力提出更高要求。若傳感器數(shù)量不足、數(shù)據(jù)資源匱乏,人形機器人的智能化便無從談起。隨著任務(wù)復(fù)雜度的提升,軟件算法的復(fù)雜度也必須相應(yīng)增加。硬件是承載智能的物理基礎(chǔ),軟件是驅(qū)動智能的決策核心,二者缺一不可。他認(rèn)為,如果這兩方面的能力無法實現(xiàn)同步突破,那么實現(xiàn)人形機器人完全自主的終極目標(biāo)就將難以達(dá)成。目前,還沒有任何一個人形機器人的運動能力能夠達(dá)到人類的水平。因此,有不少人反對讓人形機器人去進(jìn)行跑步、踢足球這類活動,認(rèn)為這些工作沒有實際意義,他們認(rèn)為機器人應(yīng)該直接進(jìn)入工廠應(yīng)用才有意義。趙明國則認(rèn)為,人形機器人無論是進(jìn)入工廠還是家庭,都需要一個漸進(jìn)的過程。上述實際場景中的運用,本質(zhì)上來說都是一項要求極高的“瓷器活”,而我們是否擁有完成這些任務(wù)的“金剛鉆”,首先需要一個合適的場景來進(jìn)行驗證。在現(xiàn)階段,運動場恰恰可以充當(dāng)這樣一個驗證場景。
趙明國還建議,為推動人形機器人的發(fā)展,應(yīng)在人形機器人領(lǐng)域設(shè)立相關(guān)標(biāo)準(zhǔn)以便于進(jìn)行分級。他以自動駕駛的L1—L5分級為例,闡明了在有明確分級和標(biāo)準(zhǔn)任務(wù)后行業(yè)內(nèi)能把技術(shù)路線、相關(guān)測試與法規(guī)標(biāo)準(zhǔn)進(jìn)行對齊。具身智能領(lǐng)域目前缺少類似的行業(yè)共識和標(biāo)準(zhǔn),這導(dǎo)致該行業(yè)研究和應(yīng)用目標(biāo)分散,難以進(jìn)行比較。趙明國及其團隊深耕雙足機器人領(lǐng)域研究長達(dá)二十余年,其帶領(lǐng)的清華火神隊?wèi){借自主研發(fā)的端到端強化學(xué)習(xí)技術(shù),奪得2025世界人形機器人運動會5v5足球賽冠軍。機器人踢足球看似是趣味場景,實則是驗證具身智能的“標(biāo)準(zhǔn)平臺”,涵蓋感知、決策、運動控制等全鏈路技術(shù),而這些技術(shù)與智能汽車的智駕系統(tǒng)底層邏輯相通。通過標(biāo)準(zhǔn)任務(wù)驗證技術(shù)能力,能夠逐步解決人形機器人手部與腿部的具身智能問題,最終面向老齡化、服務(wù)業(yè)短缺等社會需求,推動通用具身機器人實現(xiàn)商業(yè)化落地。清華教授談人形機器人發(fā)展 自主與遙控并存的現(xiàn)狀。
繼去年“十八金剛?cè)诵螜C器人”陣列震撼行業(yè)后,一年內(nèi)人形機器人以多種技能推動具身智能技術(shù)邁向新高度。然而,這些機器人仍缺乏理解物理世界的核心能力——世界模型
2025-08-13 11:38:43智元機器人高管談人形機器人商業(yè)化今年以來,人形機器人的加速迭代不斷刷新我們對具身智能領(lǐng)域的認(rèn)知,每一個新技能的解鎖,都是技術(shù)水平的又一次跨越。
2025-05-26 08:57:50人形機器人“擂臺賽”開打今天,中央廣播電視總臺北京總站參與聯(lián)合主辦了一場全球首個人形機器人半程馬拉松比賽。天工機器人成功沖線完賽,并奪得了冠軍。這一成就令人贊嘆
2025-04-19 10:44:41首個人形機器人半馬冠軍