最近,我的X首頁上關(guān)于Agent的帖子明顯增多。大家似乎不再關(guān)注某個模型答題有多好,而是更關(guān)心哪個Agent能幫助完成手頭的任務(wù)。

5月20日,騰訊推出了名為“馬維斯”(Marvis)的操作系統(tǒng)層級AI助手,支持Windows、macOS和安卓三端同步上線。內(nèi)置6個7×24小時在線的專項Agent,分別負(fù)責(zé)文件、瀏覽器、應(yīng)用、搜索、計算機操控等任務(wù)。第二天,OpenAI宣布ChatGPT以add-in形式接入Microsoft PowerPoint,免費用戶和Business訂閱者都能使用,可以在PowerPoint中生成或修改PPT。

同一周,Google在I/O 2026上推出了Gemini Spark,一個可以24小時持續(xù)運行的個人Agent,能在Google Cloud專屬虛擬機上讀郵件、改文檔、操作網(wǎng)頁,無需用戶監(jiān)督即可完成任務(wù)。

這種轉(zhuǎn)變不難理解,在眾多AI工具的推動下,大多數(shù)人更關(guān)心Agent能做什么實際工作,而不是回答多少數(shù)學(xué)題。

例如,ChatGPT for PowerPoint插件可以在右側(cè)顯示一個側(cè)邊欄,用戶只需告訴它需求,如“做一份面向投資人的產(chǎn)品演示”,它會自動拉數(shù)據(jù)、生成內(nèi)容并排版。這個插件能夠連接Gmail、Outlook、SharePoint,整合信息并生成PPT初稿。盡管目前還不支持復(fù)雜的模板處理和字體排版,但基本能滿足臨時需求。

相比之下,騰訊的馬維斯是一個網(wǎng)狀式Agent智能體合集,主Agent統(tǒng)籌任務(wù),調(diào)度多個專項Agent并行執(zhí)行。用戶可以要求它查找特定文件,它會通過語義理解而非關(guān)鍵詞搜索來定位文件。實際測試中,馬維斯能夠處理多種任務(wù),如會議準(zhǔn)備、文件分析等。雖然等待時間較長,但總體表現(xiàn)令人滿意。

馬維斯的設(shè)計也頗具特色,通過3D辦公場景展示各個Agent的工作狀態(tài),使得整個過程更加直觀有趣。這不僅提高了用戶體驗,還讓AI成為了一個“牛馬”形象,深入人心。

無論是PowerPoint中的插件還是操作系統(tǒng)層面的Agent,這些工具都指向同一個方向:AI正在從回答問題的工具轉(zhuǎn)變?yōu)樘幚砣粘9ぷ鞯耐?。區(qū)別在于,這些AI同事是處理雜活還是專精任務(wù)。
這一輪熱潮很大程度上是由OpenClaw引發(fā)的。OpenClaw最初由奧地利獨立開發(fā)者Peter Steinberger開發(fā),開源且可本地運行。其獨特的功能使其迅速走紅,創(chuàng)始人隨后加入OpenAI繼續(xù)開發(fā)Agent方向。OpenClaw讓用戶首次真實感受到AI在幫助他們干活,而不僅僅是回答問題。
OpenAI的Codex也經(jīng)歷了類似的轉(zhuǎn)變,從單純的代碼工具發(fā)展到能夠操作電腦、處理圖片、跨工具執(zhí)行任務(wù)。這種變化并非預(yù)先規(guī)劃好的,而是隨著技術(shù)的發(fā)展自然形成的。
騰訊、Google和微軟都在爭奪“AI工位”。這個工位的核心不是一臺裝有AI軟件的電腦,而是一種新的工作關(guān)系。當(dāng)人將目標(biāo)、材料、權(quán)限和驗收標(biāo)準(zhǔn)交給AI時,AI會在文件、應(yīng)用、瀏覽器、系統(tǒng)和云服務(wù)之間調(diào)度動作,人則成為管理者和決策者。
AI工位對普通人的意義在于簡化了工作流程,將“親自操作軟件”變?yōu)椤胺峙涔ぷ鳌薄S脩舨恍枰涀∥募恢没驊?yīng)用功能,只需明確目標(biāo),讓AI去完成任務(wù)。然而,這也帶來了新的挑戰(zhàn),用戶需要更清楚地定義目標(biāo)、限制邊界并檢查結(jié)果。
AI工位有望將人們從繁瑣的工作中解放出來,這是其受歡迎的主要原因。