上海交通大學(xué)計(jì)算機(jī)學(xué)院(網(wǎng)絡(luò)空間安全學(xué)院)副教授王爍帶領(lǐng)的LoCCS實(shí)驗(yàn)室團(tuán)隊(duì)推出了一套面向企業(yè)場(chǎng)景的OpenClaw可信化改造方案。該方案通過(guò)能力按需激活、權(quán)限前置治理、風(fēng)險(xiǎn)分級(jí)執(zhí)行、結(jié)構(gòu)化記憶和證據(jù)鏈審計(jì)等機(jī)制,將安全與可信從模型層的軟約束升級(jí)為系統(tǒng)層的硬能力。
王爍認(rèn)為,過(guò)去幾年,大模型驅(qū)動(dòng)的內(nèi)容智能已經(jīng)深刻改變了內(nèi)容創(chuàng)作、搜索推薦、文檔分析等工作方式,但整體上仍停留在“反應(yīng)式AI”階段。現(xiàn)在,AI代理正在向“主動(dòng)式AI”演進(jìn),能夠接管絕大多數(shù)數(shù)字化操作。然而,OpenClaw目前還被不少企業(yè)視為“高能力與高風(fēng)險(xiǎn)并存”的工具。王爍表示,當(dāng)前企業(yè)使用OpenClaw的最大顧慮就是安全問(wèn)題,因?yàn)樗_放了較多接口和調(diào)用通道,具備較高權(quán)限,能夠刪除、轉(zhuǎn)發(fā)文件,甚至觸達(dá)更敏感的數(shù)字資產(chǎn)。
在王爍看來(lái),OpenClaw面臨的核心風(fēng)險(xiǎn)主要包括間接提示詞注入、模型幻覺(jué)以及默認(rèn)端口暴露與安全配置缺失。針對(duì)這些風(fēng)險(xiǎn),王爍團(tuán)隊(duì)提出了多層加固方案。首先,建立更清晰的“自我認(rèn)知”機(jī)制,使系統(tǒng)能夠區(qū)分用戶真實(shí)指令與外部環(huán)境中的潛在惡意指令;其次,對(duì)可調(diào)用的API與功能模塊進(jìn)行認(rèn)證和分級(jí),明確哪些指令屬于可信調(diào)用,哪些操作屬于高風(fēng)險(xiǎn)范圍;最后,引入全流程復(fù)盤與審計(jì)機(jī)制,安排“審計(jì)員”持續(xù)跟蹤每一個(gè)敏感操作。
這套方案的核心是把復(fù)雜度留在系統(tǒng)內(nèi)部,把最小必要信息留給模型,在提升安全覆蓋面的同時(shí)提高執(zhí)行確定性和結(jié)果可信度。除了安全加固,團(tuán)隊(duì)還推進(jìn)“大小模型協(xié)同”的調(diào)度機(jī)制,根據(jù)任務(wù)復(fù)雜度動(dòng)態(tài)分配模型資源。王爍表示,希望通過(guò)按需調(diào)用、模型裁剪和任務(wù)定制,將其做成一個(gè)更適合落地的“省油版OpenClaw”。
最近,科技圈被一款名為OpenClaw(中文昵稱“開爪”)的開源AI Agent框架刷屏,在開發(fā)者社區(qū)迅速走紅
2026-03-09 21:16:59江蘇一地發(fā)布12條OpenClaw政策