OpenAI推出GPT-5.5 Instant 更準(zhǔn)確、更簡潔、更懂你。OpenAI 正式發(fā)布了 GPT-5.5 Instant,將其設(shè)為 ChatGPT 的默認(rèn)模型,取代了此前的 GPT-5.3 Instant,并面向所有用戶開放。Instant 系列是 ChatGPT 的日常主力模型,每天有數(shù)以億計的用戶使用。官方表示,在這個量級上,哪怕只是小幅改進(jìn),積累起來的效果也相當(dāng)可觀。新版本主打更準(zhǔn)確、更簡潔和更懂你。
與上一版本相比,新模型在保持低延遲的同時,在準(zhǔn)確性、回復(fù)風(fēng)格和個性化能力上都有明顯提升。尤其是在高風(fēng)險領(lǐng)域如醫(yī)療、法律和金融類問題上的幻覺率下降了 52.5%,對用戶標(biāo)記過的錯誤對話,錯誤率減少了 37.3%。此外,圖片和照片的分析能力、理科問題的解答質(zhì)量以及判斷何時應(yīng)當(dāng)主動調(diào)用搜索工具等方面也有改善。
數(shù)學(xué)和科學(xué)能力方面,GPT-5.5 Instant 在 AIME 2025 競賽數(shù)學(xué)測試中得分 81.2,而 GPT-5.3 Instant 僅為 65.4。博士級科學(xué)測試 GPQA 的得分從 78.5 升至 85.6,多模態(tài)推理基準(zhǔn) MMMU-Pro 的得分從 69.2 升至 76,科學(xué)圖表理解 CharXiv 從 75 升至 81.6,文檔解析錯誤率則從 14.6% 降至 12.5%。OpenAI 通過一道代數(shù)題演示了兩個版本的差距,GPT-5.5 Instant 能夠更準(zhǔn)確地定位到用戶的解題錯誤并給出正確答案。
回復(fù)風(fēng)格也是這次更新的重點。新模型更簡短,不再堆砌格式和表情符號,減少了不必要的追問。例如,當(dāng)被問及如何委婉地讓話多的同事少說點話時,GPT-5.5 Instant 的回復(fù)少了 30.2% 的字?jǐn)?shù)和 29.2% 的行數(shù),語氣更像朋友給的建議,把重點放在如何把問題引到自己的專注需求上,而不是對方的說話習(xí)慣上。
個性化能力是此次更新的另一條主線。Plus 和 Pro 用戶可以讓模型調(diào)取歷史對話、上傳文件以及關(guān)聯(lián)的 Gmail 內(nèi)容,從而獲得更貼合個人情況的回答,不需要每次重新解釋背景。例如,GPT-5.5 Instant 可以根據(jù)用戶的歷史對話記錄推薦更符合個人喜好的茶館,而不僅僅是通用熱門店。
所有消費者版本將上線「記憶來源」功能,當(dāng)回答用到了個人背景信息時,用戶可以看到具體調(diào)用了哪些歷史對話或已保存的記憶條目,并可隨時刪除或修正過時內(nèi)容。比如用戶詢問本周晚餐建議后,ChatGPT 根據(jù)用戶的飲食偏好和健康狀況,推薦了味噌三文魚碗,并列出本次回答調(diào)用的記憶來源。
GPT-5.3 Instant 將保留三個月供付費用戶使用,之后正式下線。個性化功能目前向 Plus 和 Pro 用戶的網(wǎng)頁端開放,移動端及免費、Go、企業(yè)等版本的推送計劃在未來幾周內(nèi)陸續(xù)跟進(jìn)。對開發(fā)者而言,GPT-5.5 Instant 已通過 API 以「chat-latest」名稱提供。
今天 OpenAI 還將舉行一場由 AI 發(fā)起的派對。奧特曼在籌備 GPT-5.5 的上線派對時,順手問了模型一句:你想要什么樣的派對?模型認(rèn)真給了一份清單,希望派對定在美國當(dāng)?shù)貢r間 5 月 5 日,演講環(huán)節(jié)越短越好,要有人類創(chuàng)造者上臺致祝酒詞,但它自己不想上臺祝酒。時間最終定在下午 5 點 55 分,地點定在 OpenAI 舊金山總部,非本地嘉賓的機(jī)票和酒店由 OpenAI 負(fù)責(zé)。受邀名單由 Codex 從推文回復(fù)中篩選,報名鏈接于 4 月 30 日下午 5 點 55 分關(guān)閉。24 小時內(nèi)有超過 8000 人報名,已有用戶曬出了收到的邀請郵件。沒被選上的人也收到了一封郵件,OpenAI 給他們的 Codex 調(diào)用額度提升了 10 倍。
OpenAI推出GPT-5.5 Instant 更準(zhǔn)確、更簡潔、更懂你。
OpenAI公司首席執(zhí)行官山姆·阿爾特曼周五晚些時候宣布,公司已與美國國防部就使用其人工智能模型達(dá)成協(xié)議
2026-03-02 10:49:24Anthropic遭封殺后