AI智能體正在加速嘗試代替人類完成一些任務。1月23日,OpenAI發(fā)布了首個AI智能Operator。這款智能體能像人類一樣使用網頁瀏覽器,點擊按鈕、打字輸入內容,自動完成預訂旅行住宿、餐廳預約、在線購物等復雜任務。
系統(tǒng)支持多任務并行處理,例如在某購物網站上訂購搪瓷馬克杯的同時,也能在另一平臺預定露營地。用戶可以為特定網頁或全站添加自定義指令,并在主頁保存,實現跨聊天窗口的多任務處理,如設置訂機票時的首選航司。
技術原理主要由Computer-Using Agent模型驅動,結合了GPT-4o的視覺識別能力和基于強化學習的高級推理功能,使Operator能夠“看見”網頁并與之互動。目前,研究預覽版率先向訂閱200美元Pro計劃的美國用戶開放,后續(xù)將逐步擴展至Plus、Team和Enterprise級別用戶。OpenAI希望很快將Operator集成到其所有ChatGPT應用中。
從現有體驗來看,Operator在基礎網頁操作和重復性任務方面表現出色,如搜索篩選、創(chuàng)建購物清單和音樂播放列表等任務成功率較高。但在處理復雜的房產搜索等任務時,成功率相對較低;在處理不熟悉的UI界面和文本編輯時表現欠佳。發(fā)布演示和用戶測試中,Operator出現了網頁無法成功加載等情況,表明其在運行穩(wěn)定性上存在不足。部分網站可能會屏蔽AI訪問,導致智能體無法在這些網站上執(zhí)行任務,限制了其應用范圍。
據OpenAI介紹,這款智能體在WebArena測試中得分58.1%,在WebVoyager測試中實際網站導航成功率達87%,而在OSWorld測試中的得分為38.1%。WebArena測試用于評估智能代理在網絡環(huán)境中執(zhí)行任務的能力,WebVoyager測試則在真實網站上測試模型性能,OSWorld測試評估模型控制完整操作系統(tǒng)的能力。
盡管還談不上完美,但這款產品標志著OpenAI進軍智能體領域的開始??梢哉f,Operator是OpenAI向通用人工智能目標邁進的重要一步,也將進一步增強該公司在AI領域的競爭力。考慮到Operator在代替用戶執(zhí)行任務時可能需要輸入敏感信息,如何避免潛在安全風險成為一個重要問題。
智譜AI在對標OpenAI的道路上取得了新進展。今年年初,OpenAI宣布將自研AI Agent軟件,該軟件可以替代人類自動導航至任何網站并執(zhí)行指定任務
2024-10-28 15:45:42智譜AI上線AI助理工具美東時間2月4日,機器人公司Figure的創(chuàng)始人兼CEO Brett Adcock在社交媒體X上宣布,Figure決定終止與OpenAI的合作
2025-02-05 10:42:04Figure終止與OpenAI合作深圳寶安國際機場于1月13日正式啟動自主泊車代駕測試。在現場,車輛行駛到指定上下客點后,司機下車并通過手機App選擇目標車位,車輛便能自行駛向車位并完成泊車
2025-01-14 15:29:39深圳機場啟用自主泊車試點