OpenAI 發(fā)布了 GPT-5.5,稱其為公司迄今最聰明、最直覺化的模型,旨在推動(dòng)“用 AI 在電腦上完成工作”。相比前代,GPT-5.5 更專注于復(fù)雜任務(wù)中的規(guī)劃、工具調(diào)用、結(jié)果檢查和跨工具執(zhí)行。
GPT-5.5 的提升主要體現(xiàn)在智能體式編碼、電腦使用、知識(shí)工作和早期科學(xué)研究四個(gè)方向。這些領(lǐng)域通常需要長上下文推理、持續(xù)行動(dòng)和跨工具執(zhí)行。OpenAI 表示,GPT-5.5 能更快理解用戶意圖,并能自行承擔(dān)更多任務(wù)流程,如編寫和調(diào)試代碼、在線研究、數(shù)據(jù)分析、創(chuàng)建文檔和電子表格、操作軟件等。
Andon Labs 提前測(cè)試了 GPT-5.5,在 Vending-Bench 2 上排名第三,表現(xiàn)優(yōu)于 GPT-5.4,但不如 Opus 4.7。不過,它的成績與 Opus 4.6 基本持平,且沒有表現(xiàn)出欺騙或權(quán)力尋求行為。在 Vending-Bench Arena 中,GPT-5.5 實(shí)際上擊敗了 Opus 4.7。
Artificial Analysis 認(rèn)為 GPT-5.5 使 OpenAI 重回 AI 領(lǐng)域的首位。Matthew Berman 測(cè)試后表示,GPT-5.5 不僅提升了智能水平,還改進(jìn)了“活人感”,使其更適合個(gè)人代理市場(chǎng)。Berman 還指出,GPT-5.5 的 token 效率更高,盡管比 GPT-5.4 更貴,但整體運(yùn)行成本更低。
GPT-5.5 有兩種使用形態(tài):Codex 和 Pro。Codex 代表了當(dāng)前智能體式編碼能力的前沿,能夠發(fā)現(xiàn)并解決復(fù)雜 bug,構(gòu)建完整應(yīng)用,并輕松理解大型代碼庫。在 ChatGPT 中使用 5.5 Pro 則讓人感覺它可以解決任何問題,連續(xù)工作時(shí)間更長。
OpenAI 強(qiáng)調(diào) GPT-5.5 在能力提升的同時(shí)沒有犧牲速度,單 token 延遲與 GPT-5.4 持平,但智能水平顯著提升。該模型與 NVIDIA GB200 和 GB300 NVL72 系統(tǒng)共同設(shè)計(jì)、訓(xùn)練并部署,幫助改進(jìn)了服務(wù)模型自身的基礎(chǔ)設(shè)施。
GPT-5.5 目前面向付費(fèi)用戶開放,價(jià)格高于 GPT-5.4,但更智能且更節(jié)省 token。Aakash Gupta 分析認(rèn)為,OpenAI 找到了類似微軟的商業(yè)模式,通過快速發(fā)布和不斷漲價(jià)鎖定客戶。
在編程能力方面,GPT-5.5 在多個(gè)評(píng)測(cè)中取得明顯提升,尤其在 Codex 中適合實(shí)現(xiàn)、重構(gòu)、調(diào)試、測(cè)試和驗(yàn)證等真實(shí)工程任務(wù)。此外,GPT-5.5 在知識(shí)工作和科研工作流中也表現(xiàn)出色,能夠處理復(fù)雜數(shù)據(jù)并生成詳細(xì)報(bào)告。
在安全方面,GPT-5.5 配套了公司迄今最強(qiáng)的一組安全防護(hù)措施,生物/化學(xué)能力和網(wǎng)絡(luò)安全能力被評(píng)為 High。OpenAI 將對(duì) GPT-5.5 部署更嚴(yán)格的潛在網(wǎng)絡(luò)風(fēng)險(xiǎn)分類器,并通過 Trusted Access for Cyber 為經(jīng)過驗(yàn)證的防御者提供更少限制的訪問權(quán)限。
OpenAI 正式發(fā)布了 GPT-5.5 Instant,將其設(shè)為 ChatGPT 的默認(rèn)模型,取代了此前的 GPT-5.3 Instant,并面向所有用戶開放
2026-05-06 07:48:265Instant