OpenAI發(fā)布最強專業(yè)模型GPT-5.4 原生電腦操控功能突破邊界!OpenAI發(fā)布了全新的旗艦基礎(chǔ)模型GPT-5.4,該模型在ChatGPT、API以及開發(fā)工具Codex中同步上線。OpenAI稱GPT-5.4是“迄今能力最強、最高效的專業(yè)工作前沿模型”,重點面向企業(yè)辦公與復(fù)雜知識工作場景。相比此前版本,GPT-5.4的最大變化在于強化了AI智能體的能力。在API和Codex中,GPT-5.4首次實現(xiàn)了原生級“電腦操作”功能,支持智能體跨軟件執(zhí)行復(fù)雜工作流。
GPT-5.4不僅能生成文本或代碼,還首次將原生電腦操控能力引入通用模型,能直接操作電腦軟件、瀏覽網(wǎng)頁、控制鼠標和鍵盤完成任務(wù),并可與電子表格、金融分析工具等企業(yè)應(yīng)用深度整合,深度嵌入微軟Excel和谷歌表格。在ChatGPT中,GPT-5.4支持“提前展示思維過程”,允許用戶在模型響應(yīng)過程中調(diào)整任務(wù)方向,并提升了深度網(wǎng)頁搜索與長邏輯語境下的上下文保持能力。
業(yè)內(nèi)認為,GPT-5.4的一系列升級標志著AI模型正從“對話工具”走向自動化執(zhí)行任務(wù)的數(shù)字代理系統(tǒng),進一步滲透企業(yè)生產(chǎn)力軟件與專業(yè)知識工作。OpenAI本周四同時推出兩個版本,包括更擅長復(fù)雜推理的GPT-5.4 Thinking以及高性能的GPT-5.4 Pro,分別面向付費用戶和高端企業(yè)用戶。
在計算機操控基準測試OSWorld-Verified中,GPT-5.4以75.0%的成功率超越人類平均水平72.4%,較前代GPT-5.2的47.3%大幅躍升。同期發(fā)布的財務(wù)服務(wù)套件顯示,GPT-5.4在OpenAI內(nèi)部投行基準測試中的得分從GPT-5的43.7%躍升至88.0%。早期測試機構(gòu)給出積極反饋。投資公司W(wǎng)alleye Capital的AI解決方案主管Daniel Swiecki表示,GPT-5.4在內(nèi)部財務(wù)和Excel評估中準確率提升了30個百分點。AI人才平臺Mercor的CEO Brendan Foody稱其為該公司“迄今嘗試過的最佳模型”,并表示GPT-5.4已在Mercor面向?qū)I(yè)服務(wù)工作的APEX-Agents基準測試中排名第一。
OpenAI正式發(fā)布了全新大模型GPT-5.4,宣稱這是目前能力最強、效率最高的專業(yè)工作前沿模型
2026-03-06 09:22:22號稱最強模型OpenAIOpenAI 公司于 3 月 17 日發(fā)布公告,推出迄今最強大的小型模型 GPT-5.4 mini 與 GPT-5.4 nano,專為高頻且對延遲敏感的任務(wù)設(shè)計
2026-03-18 11:06:41OpenAI推迄今最強大小型模型美東時間3月3日,OpenAI發(fā)布了GPT-5.3 Instant模型,對ChatGPT系列中最常用的“即時響應(yīng)”模型進行了全面優(yōu)化升級
2026-03-04 15:09:293Instant模型