麻省理工借鑒GPT等訓(xùn)練機(jī)器人創(chuàng)新架構(gòu)提升學(xué)習(xí)效率

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2024-11-04 14:10:00 環(huán)球網(wǎng)科技

11月4日，麻省理工學(xué)院展示了一種全新的機(jī)器人訓(xùn)練模型。該模型不再依賴于標(biāo)準(zhǔn)數(shù)據(jù)集，而是模仿大型語言模型的大規(guī)模信息處理方式，為機(jī)器人學(xué)習(xí)新技能提供了新的途徑。

在傳統(tǒng)模仿學(xué)習(xí)中，機(jī)器人通過跟隨執(zhí)行任務(wù)的人類或其他代理進(jìn)行學(xué)習(xí)。然而，這種方法在面對照明變化、不同環(huán)境或新障礙等小挑戰(zhàn)時(shí)，常常因數(shù)據(jù)不足而難以適應(yīng)。為了解決這個(gè)問題，麻省理工學(xué)院的研究團(tuán)隊(duì)借鑒了GPT-4等大型語言模型的數(shù)據(jù)處理方法，探索了一種新的解決方案。

新論文的主要作者王立睿指出，在語言領(lǐng)域，數(shù)據(jù)以句子的形式存在，但在機(jī)器人領(lǐng)域，數(shù)據(jù)具有高度的異質(zhì)性。如果想以類似語言模型的方式進(jìn)行預(yù)訓(xùn)練，就需要構(gòu)建一種全新的架構(gòu)。

為此，研究團(tuán)隊(duì)引入了異構(gòu)預(yù)訓(xùn)練變壓器（HPT）這一創(chuàng)新架構(gòu)。HPT能夠整合來自不同傳感器和環(huán)境的多樣信息，并利用變壓器技術(shù)將這些數(shù)據(jù)匯總到訓(xùn)練模型中。值得注意的是，變壓器的規(guī)模越大，其輸出效果也越好。

使用該模型時(shí)，用戶只需輸入機(jī)器人的設(shè)計(jì)、配置以及期望完成的任務(wù)，系統(tǒng)便能根據(jù)這些信息為機(jī)器人提供所需的技能。這一創(chuàng)新不僅提高了機(jī)器人學(xué)習(xí)的效率和靈活性，也為實(shí)現(xiàn)更廣泛、更復(fù)雜的機(jī)器人應(yīng)用奠定了堅(jiān)實(shí)基礎(chǔ)。

卡內(nèi)基梅隆大學(xué)副教授戴維·赫爾德評價(jià)這項(xiàng)研究時(shí)表示，他們的夢想是擁有一個(gè)通用的機(jī)器人大腦，用戶可以直接下載并使用它，而無需進(jìn)行任何額外訓(xùn)練。雖然目前還處于這一愿景的早期階段，但研究人員將持續(xù)努力，希望借助規(guī)?；膬?yōu)勢，在機(jī)器人策略方面取得像大型語言模型那樣的突破性進(jìn)展。

(責(zé)任編輯：張小花 TT1000)

關(guān)閉

麻省理工借鑒GPT等訓(xùn)練機(jī)器人 創(chuàng)新架構(gòu)提升學(xué)習(xí)效率

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

麻省理工借鑒GPT等訓(xùn)練機(jī)器人創(chuàng)新架構(gòu)提升學(xué)習(xí)效率