繼3月10日發(fā)布首個具身基座模型GO-1后,上海AI企業(yè)智元機(jī)器人于3月11日上午宣布其新款人形機(jī)器人靈犀X2上線。該企業(yè)首席技術(shù)官彭志輝表示,創(chuàng)業(yè)這兩年間,他見證了人形機(jī)器人行業(yè)的迅速發(fā)展,并一直夢想著能夠制造出與人類一樣靈活和智能的機(jī)器人。
根據(jù)彭志輝更新的視頻,除了常規(guī)的行走、跑動、跳舞外,靈犀X2還展示了舉重、踩滑板車、玩平衡車以及騎自行車等技能。彭志輝稱,靈犀X2是一臺具備復(fù)雜交互能力的“靈動機(jī)器人”,可以裝配靈巧手等末端,進(jìn)行精細(xì)操作。隨著機(jī)器人具身大腦的不斷迭代,未來智元計劃賦予機(jī)器人更多復(fù)雜作業(yè)的能力。
靈犀X2身高約1.3米,通過與機(jī)器人的互動交流,彭志輝展示了其基于VLM的硅光動語多模態(tài)模型所賦予的視覺理解和認(rèn)知世界的能力。在視頻中,當(dāng)彭志輝詢問時間時,X2準(zhǔn)確回答;面對選擇飲料的問題,X2建議喝牛奶以助睡眠;對于保健品使用說明的詢問,X2也能一字不差地念出來。
靈犀X2的設(shè)計融合了多項(xiàng)創(chuàng)新,包括小腦控制器Xyber-Edge、域控制器Xyber-DCU、智能電源管理系統(tǒng)Xyber-BMS以及核心關(guān)節(jié)模組Powerflow等組件。這些組件使得快速搭建可靠的人形機(jī)器人系統(tǒng)成為可能。此外,靈犀X2使用了抗摔的柔性材料,全身擁有28個自由度,未采用任何并聯(lián)結(jié)構(gòu)。通過當(dāng)前最火熱的大語言模型技術(shù),X2訓(xùn)練了可定制的多模態(tài)交互大模型,使其具備復(fù)雜交互能力,同時還能做出可愛的小動作,并支持遠(yuǎn)程裸眼3D交流。
靈犀X2采用輕量化設(shè)計,支持模塊化擴(kuò)展,擁有完備的二次開發(fā)接口,預(yù)訓(xùn)練模型及一站式方案,適用于康養(yǎng)、服務(wù)、家庭陪伴等多種場景。此前,智元機(jī)器人發(fā)布了首個通用具身基座大模型——智元啟元大模型GO-1。這款大模型基于Vision-Language-Latent-Action(ViLLA)架構(gòu),由VLM(多模態(tài)大模型) + MoE(混合專家)組成,使機(jī)器人能夠?qū)W習(xí)并泛化應(yīng)用到各類環(huán)境和物品中,快速適應(yīng)新任務(wù)。它支持部署到不同機(jī)器人本體,并能在實(shí)際使用中持續(xù)進(jìn)化。
舉例來說,用戶可以通過簡單指令讓機(jī)器人完成掛衣服的任務(wù)。GO-1大模型具備通用場景感知和理解能力,能夠理解任務(wù)要求,設(shè)想操作步驟,并執(zhí)行任務(wù)。具體而言,該大模型的特點(diǎn)包括:結(jié)合互聯(lián)網(wǎng)視頻和真實(shí)人類示范學(xué)習(xí),增強(qiáng)對人類行為的理解;具有小樣本快速泛化能力,降低使用門檻;作為通用機(jī)器人策略模型,可在不同機(jī)器人形態(tài)之間遷移;并通過數(shù)據(jù)回流系統(tǒng)持續(xù)進(jìn)化學(xué)習(xí)。測試顯示,在五種不同復(fù)雜度任務(wù)上,相比已有最優(yōu)模型,GO-1的任務(wù)成功率提高了32%。
在科技迅速發(fā)展的今天,機(jī)器人技術(shù)正悄然改變著我們的生活。這一領(lǐng)域的進(jìn)步不僅僅是低水平的自動化,而是全面推動了多個行業(yè)的變革
2024-12-13 16:56:02機(jī)器人help機(jī)器人