9月24日,擎朗智能發(fā)布了針對服務(wù)行業(yè)的自研VLA模型KOM2.0。該模型將應(yīng)用于公司的人形具身服務(wù)機(jī)器人上,顯著提升機(jī)器人的泛化能力,使崗位化服務(wù)達(dá)到新水平,并加快產(chǎn)品迭代速度。
大模型在架構(gòu)上有突破性創(chuàng)新,引入了時(shí)空自適應(yīng)注意力機(jī)制與分層決策推理模塊,確保模型能夠從海量實(shí)時(shí)數(shù)據(jù)中精準(zhǔn)提取關(guān)鍵信息,理解復(fù)雜場景中的長短程關(guān)聯(lián)。借助內(nèi)嵌的強(qiáng)化學(xué)習(xí)框架與增量遷移學(xué)習(xí)技術(shù),模型可在部署后持續(xù)自我進(jìn)化,實(shí)時(shí)適應(yīng)環(huán)境變化與任務(wù)迭代。
CTO唐旋來舉例說明,原先機(jī)器人做爆米花和飲料需要單獨(dú)訓(xùn)練,而這兩項(xiàng)任務(wù)中都有拿杯子、遞杯子的動作。利用大模型可以實(shí)現(xiàn)分層拆分,將這些動作訓(xùn)練成通用技能,應(yīng)用在所有類似需要拿杯子的場景,提升了效率和泛化能力。
擎朗VLA模型利用了公司多年來積累的海量場景數(shù)據(jù)資產(chǎn)及每日十萬臺在線機(jī)器人的運(yùn)行數(shù)據(jù),這些真實(shí)環(huán)境的數(shù)據(jù)為模型的魯棒性和泛化能力提供了基礎(chǔ)。部署了全新大模型后,機(jī)器人將擁有更深度的環(huán)境認(rèn)知,更好地適應(yīng)多機(jī)協(xié)同調(diào)度等高難度場景,大幅減少場景定制與人工調(diào)試需求,支持快速復(fù)制、靈活擴(kuò)展,為規(guī)?;虡I(yè)落地提供基礎(chǔ)。
一個(gè)多月前,擎朗智能推出了首款雙足人形具身服務(wù)機(jī)器人XMAN-F1,深入拓展具身服務(wù)機(jī)器人領(lǐng)域。這款機(jī)器人搭載的崗位化垂域模型正是以擎朗VLA模型為基礎(chǔ)開發(fā)的專業(yè)模型。
成立于2010年的擎朗智能一直深耕服務(wù)機(jī)器人領(lǐng)域。IDC報(bào)告顯示,擎朗智能服務(wù)機(jī)器人出貨量超過10萬臺,居全球商用服務(wù)機(jī)器人行業(yè)首位,在全球配送服務(wù)機(jī)器人和餐飲配送機(jī)器人細(xì)分領(lǐng)域出貨量也均位列第一。
在AI時(shí)代,孫正義沒有缺席。他曾因錯(cuò)失英偉達(dá)而后悔,但這次他牢牢抓住了ARM??萍嫉拇蟊l(fā)讓ARM市值突破1800億美元
2025-10-17 19:40:55如何看待孫正義重金投資機(jī)器人