OpenAI發(fā)布最強專業(yè)模型GPT-5.4 原生電腦操控功能突破邊界

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2026-03-06 09:15:26 新浪財經(jīng)

OpenAI發(fā)布最強專業(yè)模型GPT-5.4 原生電腦操控功能突破邊界！OpenAI發(fā)布了全新的旗艦基礎(chǔ)模型GPT-5.4，該模型在ChatGPT、API以及開發(fā)工具Codex中同步上線。OpenAI稱GPT-5.4是“迄今能力最強、最高效的專業(yè)工作前沿模型”，重點面向企業(yè)辦公與復(fù)雜知識工作場景。相比此前版本，GPT-5.4的最大變化在于強化了AI智能體的能力。在API和Codex中，GPT-5.4首次實現(xiàn)了原生級“電腦操作”功能，支持智能體跨軟件執(zhí)行復(fù)雜工作流。

GPT-5.4不僅能生成文本或代碼，還首次將原生電腦操控能力引入通用模型，能直接操作電腦軟件、瀏覽網(wǎng)頁、控制鼠標和鍵盤完成任務(wù)，并可與電子表格、金融分析工具等企業(yè)應(yīng)用深度整合，深度嵌入微軟Excel和谷歌表格。在ChatGPT中，GPT-5.4支持“提前展示思維過程”，允許用戶在模型響應(yīng)過程中調(diào)整任務(wù)方向，并提升了深度網(wǎng)頁搜索與長邏輯語境下的上下文保持能力。

業(yè)內(nèi)認為，GPT-5.4的一系列升級標志著AI模型正從“對話工具”走向自動化執(zhí)行任務(wù)的數(shù)字代理系統(tǒng)，進一步滲透企業(yè)生產(chǎn)力軟件與專業(yè)知識工作。OpenAI本周四同時推出兩個版本，包括更擅長復(fù)雜推理的GPT-5.4 Thinking以及高性能的GPT-5.4 Pro，分別面向付費用戶和高端企業(yè)用戶。

在計算機操控基準測試OSWorld-Verified中，GPT-5.4以75.0%的成功率超越人類平均水平72.4%，較前代GPT-5.2的47.3%大幅躍升。同期發(fā)布的財務(wù)服務(wù)套件顯示，GPT-5.4在OpenAI內(nèi)部投行基準測試中的得分從GPT-5的43.7%躍升至88.0%。早期測試機構(gòu)給出積極反饋。投資公司W(wǎng)alleye Capital的AI解決方案主管Daniel Swiecki表示，GPT-5.4在內(nèi)部財務(wù)和Excel評估中準確率提升了30個百分點。AI人才平臺Mercor的CEO Brendan Foody稱其為該公司“迄今嘗試過的最佳模型”，并表示GPT-5.4已在Mercor面向?qū)I(yè)服務(wù)工作的APEX-Agents基準測試中排名第一。

12 3 全文共 3 頁下一頁

關(guān)閉

OpenAI發(fā)布最強專業(yè)模型GPT-5.4 原生電腦操控功能突破邊界

相關(guān)新聞

今日熱點

頻道熱點