GPT-5.5贏了Opus 4.7和Mythos嗎智能體式工作模型領(lǐng)先

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2026-04-24 19:28:21 搜狐網(wǎng)

OpenAI 發(fā)布了 GPT-5.5，稱其為公司迄今最聰明、最直覺化的模型，旨在推動(dòng)“用 AI 在電腦上完成工作”。相比前代，GPT-5.5 更專注于復(fù)雜任務(wù)中的規(guī)劃、工具調(diào)用、結(jié)果檢查和跨工具執(zhí)行。

GPT-5.5 的提升主要體現(xiàn)在智能體式編碼、電腦使用、知識(shí)工作和早期科學(xué)研究四個(gè)方向。這些領(lǐng)域通常需要長上下文推理、持續(xù)行動(dòng)和跨工具執(zhí)行。OpenAI 表示，GPT-5.5 能更快理解用戶意圖，并能自行承擔(dān)更多任務(wù)流程，如編寫和調(diào)試代碼、在線研究、數(shù)據(jù)分析、創(chuàng)建文檔和電子表格、操作軟件等。

Andon Labs 提前測(cè)試了 GPT-5.5，在 Vending-Bench 2 上排名第三，表現(xiàn)優(yōu)于 GPT-5.4，但不如 Opus 4.7。不過，它的成績與 Opus 4.6 基本持平，且沒有表現(xiàn)出欺騙或權(quán)力尋求行為。在 Vending-Bench Arena 中，GPT-5.5 實(shí)際上擊敗了 Opus 4.7。

Artificial Analysis 認(rèn)為 GPT-5.5 使 OpenAI 重回 AI 領(lǐng)域的首位。Matthew Berman 測(cè)試后表示，GPT-5.5 不僅提升了智能水平，還改進(jìn)了“活人感”，使其更適合個(gè)人代理市場(chǎng)。Berman 還指出，GPT-5.5 的 token 效率更高，盡管比 GPT-5.4 更貴，但整體運(yùn)行成本更低。

GPT-5.5 有兩種使用形態(tài)：Codex 和 Pro。Codex 代表了當(dāng)前智能體式編碼能力的前沿，能夠發(fā)現(xiàn)并解決復(fù)雜 bug，構(gòu)建完整應(yīng)用，并輕松理解大型代碼庫。在 ChatGPT 中使用 5.5 Pro 則讓人感覺它可以解決任何問題，連續(xù)工作時(shí)間更長。

OpenAI 強(qiáng)調(diào) GPT-5.5 在能力提升的同時(shí)沒有犧牲速度，單 token 延遲與 GPT-5.4 持平，但智能水平顯著提升。該模型與 NVIDIA GB200 和 GB300 NVL72 系統(tǒng)共同設(shè)計(jì)、訓(xùn)練并部署，幫助改進(jìn)了服務(wù)模型自身的基礎(chǔ)設(shè)施。

GPT-5.5 目前面向付費(fèi)用戶開放，價(jià)格高于 GPT-5.4，但更智能且更節(jié)省 token。Aakash Gupta 分析認(rèn)為，OpenAI 找到了類似微軟的商業(yè)模式，通過快速發(fā)布和不斷漲價(jià)鎖定客戶。

在編程能力方面，GPT-5.5 在多個(gè)評(píng)測(cè)中取得明顯提升，尤其在 Codex 中適合實(shí)現(xiàn)、重構(gòu)、調(diào)試、測(cè)試和驗(yàn)證等真實(shí)工程任務(wù)。此外，GPT-5.5 在知識(shí)工作和科研工作流中也表現(xiàn)出色，能夠處理復(fù)雜數(shù)據(jù)并生成詳細(xì)報(bào)告。

在安全方面，GPT-5.5 配套了公司迄今最強(qiáng)的一組安全防護(hù)措施，生物/化學(xué)能力和網(wǎng)絡(luò)安全能力被評(píng)為 High。OpenAI 將對(duì) GPT-5.5 部署更嚴(yán)格的潛在網(wǎng)絡(luò)風(fēng)險(xiǎn)分類器，并通過 Trusted Access for Cyber 為經(jīng)過驗(yàn)證的防御者提供更少限制的訪問權(quán)限。

(責(zé)任編輯：zx0002)

關(guān)閉

GPT-5.5贏了Opus 4.7和Mythos嗎 智能體式工作模型領(lǐng)先

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

GPT-5.5贏了Opus 4.7和Mythos嗎智能體式工作模型領(lǐng)先