智元機器人高管談人形機器人商業(yè)化。繼去年“十八金剛?cè)诵螜C器人”陣列震撼行業(yè)后,一年內(nèi)人形機器人以多種技能推動具身智能技術(shù)邁向新高度。然而,這些機器人仍缺乏理解物理世界的核心能力——世界模型。在2025年世界人工智能大會上,智元機器人發(fā)布了首個面向真實世界的雙臂機器人世界模型開源平臺“Genie Envisioner”,再度成為焦點。
世界模型的靈感來自人類心智運作機制。智元機器人通用業(yè)務部總裁王闖指出,將人類認知轉(zhuǎn)化為機器人執(zhí)行閉環(huán)是當前最大挑戰(zhàn)。智元將機器人的“大腦”定義為“一體三智能”架構(gòu):機械本體協(xié)同運動智能、交互智能和作業(yè)智能。在作業(yè)智能領域,泛化率、成功率與效率之間存在矛盾——提高泛化率往往導致成功率下降,追求高成功率則犧牲效率。全面泛化尚不現(xiàn)實,聚焦特定領域才是商業(yè)化務實選擇。智元首席運營官邱恒認為,人形機器人需經(jīng)歷“擬人-類人-超人”三階段,而世界模型是實現(xiàn)“超人”的必備要素。這需要打通多個“小世界”,例如在4S店場景中整合產(chǎn)品理解、話術(shù)技巧與情緒傳遞能力。交互智能同樣面臨瓶頸,當前語音轉(zhuǎn)文字等初級處理方式難以實現(xiàn)端到端輸入,對人類語義情感的深度理解仍是突破重點。
為攻克世界模型,智元在本屆大會發(fā)布首個雙臂機器人開源平臺“Genie Envisioner”。該平臺融合預測、控制、評測三大功能,提供從視覺感知到動作執(zhí)行的端到端方案。其核心組件GE-Base通過超百萬條數(shù)據(jù)訓練,精準解析環(huán)境空間布局與動作意圖;GE-Act動作解碼器則實現(xiàn)“看懂”到“會做”的轉(zhuǎn)化。與傳統(tǒng)指令執(zhí)行模式不同,GE平臺賦予機器人自主規(guī)劃能力——先構(gòu)思方案、驗證可行性再執(zhí)行。演示中搭載GE的機器人成功完成做三明治、倒茶、用微波爐等復雜任務,成功率超過行業(yè)均值。
清華大學蘇航研究員強調(diào),推動AI從數(shù)字世界走向物理世界的關(guān)鍵在于解決泛化能力。物理世界受自然規(guī)律約束,AI應用難度更高。針對真實數(shù)據(jù)的安全性與真實性局限,仿真數(shù)據(jù)成為重要補充。商湯科技同期發(fā)布的“悟能”平臺印證了這一趨勢,其“開悟”世界模型基于10萬3D資產(chǎn)構(gòu)建多視角視頻生成能力,可同時處理11個攝像頭畫面,創(chuàng)新融合第一與第三視角,使機器人在自主訓練時同步學習人類示范動作,大幅提升跨場景泛化效率。
從技能展示到認知突破,智元機器人正引領具身智能進入新階段。世界模型作為物理世界與機器智能的橋梁,其突破將真正賦予機器人“想象的翅膀”。隨著智元GE平臺與產(chǎn)學研力量的協(xié)同推進,具身智能的“iPhone時刻”加速臨近。智元機器人通過持續(xù)創(chuàng)新定義行業(yè)高度,在通向“超人”的征途中,每一次認知閉環(huán)的完成都在為機器注入靈魂,加速繪制人類與機器共生的未來圖景。
人民財訊3月11日電,3月11日,智元機器人發(fā)布最新搭載情感計算引擎的雙足智能交互人形機器人靈犀X2
2025-03-11 11:02:07智元機器人發(fā)布最新雙足人形機器人7月8日晚間,上緯新材發(fā)布公告稱,智元機器人通過公司及核心團隊共同出資設立的持股平臺,以協(xié)議轉(zhuǎn)讓和要約收購的方式取得公司控制權(quán),至少收購其63.62%股份
2025-07-10 20:32:59人形機器人第一股會是誰今天,由北京市政府、中央廣播電視總臺等聯(lián)合主辦的全球首個人形機器人運動會在國家速滑館“冰絲帶”正式開幕。這是一場以人形機器人為參賽主體的綜合性運動會,主題為“智競向未來”
2025-08-14 20:50:29世界人形機器人運動會開幕