越過第一層的現(xiàn)金流賬本,巨頭們力推本地Agent的第二層目標觸及到了大模型發(fā)展的天花板:高質(zhì)量訓練數(shù)據(jù)的枯竭。過去幾年,大模型競爭的核心資源一直是算力和訓練數(shù)據(jù)。但隨著模型能力不斷提高,另一個資源變得越來越重要:任務軌跡數(shù)據(jù)。目前的共識是,互聯(lián)網(wǎng)上高質(zhì)量的公開文本數(shù)據(jù)已經(jīng)被各家的大模型“吃”得差不多了。如果僅僅繼續(xù)喂養(yǎng)這些靜態(tài)的文本,大模型只會變成一個更博學的“書呆子”,而無法向真正的AGI邁進。下一代大模型需要知道人類是如何在這個數(shù)字世界中“采取行動”的。這就是業(yè)內(nèi)極為渴求的“任務軌跡數(shù)據(jù)”。當用戶讓AI完成一件事情時,AI會經(jīng)歷一系列步驟。從理解需求到搜索信息,再到調(diào)用工具、填寫表單、完成支付,每一個動作都會留下記錄。這些記錄組成了一條完整的任務鏈路。對于Agent模型來說,這種數(shù)據(jù)比普通文本更有價值,因為它反映的是現(xiàn)實世界中的行動邏輯。這恰恰是巨頭們原先最難以獲取的數(shù)據(jù)。這些數(shù)據(jù)隱藏在無數(shù)個割裂的軟件、封閉的App和企業(yè)內(nèi)網(wǎng)深處,即便是擁有龐大爬蟲生態(tài)的搜索引擎也無能為力。而部署在用戶終端的OpenClaw和系統(tǒng)級的miclaw,就是深入敵后的“數(shù)據(jù)探測器”。用戶安裝OpenClaw后,常期望魔法般自動化,但真正價值在于定義清晰任務。軌跡數(shù)據(jù)反饋讓模型不斷優(yōu)化,廠商借此添料,提升代理能力。當用戶在本地運行Agent,讓它代替自己去執(zhí)行操作時,Agent記錄下用戶的每一個操作意圖和軟件交互軌跡。國內(nèi)大廠密集推廣Agent應用,本質(zhì)上是一場分布式的、規(guī)模空前的數(shù)據(jù)眾包。用戶以為自己白嫖了一個免費的AI勞動力,實際上,用戶在指導Agent、糾正Agent錯誤的過程中,正在免費為巨頭們提供最高質(zhì)量的強化學習微調(diào)數(shù)據(jù)。這些“軌跡數(shù)據(jù)”一旦回流到云端,將成為大廠訓練下一代具備強邏輯推理、強執(zhí)行能力的Agent大模型的核心壁壘。這就像特斯拉當年通過數(shù)百萬輛在路上行駛的電動車收集真實路況數(shù)據(jù),最終反哺其FSD自動駕駛算法一樣。現(xiàn)在,巨頭們正在把用戶的電腦和手機變成AI時代的“數(shù)據(jù)采集車”。誰能掌握最多的軌跡數(shù)據(jù),誰就能率先訓練出真正“長出手腳”的超級模型。從這個角度看,大廠推廣本地Agent,并不是為了一個新工具。他們依舊是在爭奪AI時代的操作入口。
瀏覽器自動化腳本可能成為黑客的“提款機”。2025年11月,某跨境電商團隊在使用自動化工具批量采集競品數(shù)據(jù)時,87萬條客戶訂單信息在72小時內(nèi)被完整打包上傳至境外服務器
2026-03-10 14:43:39OpenClaw用戶隱私