智元機(jī)器人高管談人形機(jī)器人商業(yè)化。繼去年“十八金剛?cè)诵螜C(jī)器人”陣列震撼行業(yè)后,一年內(nèi)人形機(jī)器人以多種技能推動(dòng)具身智能技術(shù)邁向新高度。然而,這些機(jī)器人仍缺乏理解物理世界的核心能力——世界模型。在2025年世界人工智能大會(huì)上,智元機(jī)器人發(fā)布了首個(gè)面向真實(shí)世界的雙臂機(jī)器人世界模型開源平臺(tái)“Genie Envisioner”,再度成為焦點(diǎn)。
世界模型的靈感來自人類心智運(yùn)作機(jī)制。智元機(jī)器人通用業(yè)務(wù)部總裁王闖指出,將人類認(rèn)知轉(zhuǎn)化為機(jī)器人執(zhí)行閉環(huán)是當(dāng)前最大挑戰(zhàn)。智元將機(jī)器人的“大腦”定義為“一體三智能”架構(gòu):機(jī)械本體協(xié)同運(yùn)動(dòng)智能、交互智能和作業(yè)智能。在作業(yè)智能領(lǐng)域,泛化率、成功率與效率之間存在矛盾——提高泛化率往往導(dǎo)致成功率下降,追求高成功率則犧牲效率。全面泛化尚不現(xiàn)實(shí),聚焦特定領(lǐng)域才是商業(yè)化務(wù)實(shí)選擇。智元首席運(yùn)營官邱恒認(rèn)為,人形機(jī)器人需經(jīng)歷“擬人-類人-超人”三階段,而世界模型是實(shí)現(xiàn)“超人”的必備要素。這需要打通多個(gè)“小世界”,例如在4S店場景中整合產(chǎn)品理解、話術(shù)技巧與情緒傳遞能力。交互智能同樣面臨瓶頸,當(dāng)前語音轉(zhuǎn)文字等初級(jí)處理方式難以實(shí)現(xiàn)端到端輸入,對(duì)人類語義情感的深度理解仍是突破重點(diǎn)。
為攻克世界模型,智元在本屆大會(huì)發(fā)布首個(gè)雙臂機(jī)器人開源平臺(tái)“Genie Envisioner”。該平臺(tái)融合預(yù)測、控制、評(píng)測三大功能,提供從視覺感知到動(dòng)作執(zhí)行的端到端方案。其核心組件GE-Base通過超百萬條數(shù)據(jù)訓(xùn)練,精準(zhǔn)解析環(huán)境空間布局與動(dòng)作意圖;GE-Act動(dòng)作解碼器則實(shí)現(xiàn)“看懂”到“會(huì)做”的轉(zhuǎn)化。與傳統(tǒng)指令執(zhí)行模式不同,GE平臺(tái)賦予機(jī)器人自主規(guī)劃能力——先構(gòu)思方案、驗(yàn)證可行性再執(zhí)行。演示中搭載GE的機(jī)器人成功完成做三明治、倒茶、用微波爐等復(fù)雜任務(wù),成功率超過行業(yè)均值。
人民財(cái)訊3月11日電,3月11日,智元機(jī)器人發(fā)布最新搭載情感計(jì)算引擎的雙足智能交互人形機(jī)器人靈犀X2
2025-03-11 11:02:07智元機(jī)器人發(fā)布最新雙足人形機(jī)器人