OpenAI推出GPT-5.5 Instant 更準(zhǔn)確、更簡(jiǎn)潔、更懂你。OpenAI 正式發(fā)布了 GPT-5.5 Instant,將其設(shè)為 ChatGPT 的默認(rèn)模型,取代了此前的 GPT-5.3 Instant,并面向所有用戶開放。Instant 系列是 ChatGPT 的日常主力模型,每天有數(shù)以億計(jì)的用戶使用。官方表示,在這個(gè)量級(jí)上,哪怕只是小幅改進(jìn),積累起來的效果也相當(dāng)可觀。新版本主打更準(zhǔn)確、更簡(jiǎn)潔和更懂你。
與上一版本相比,新模型在保持低延遲的同時(shí),在準(zhǔn)確性、回復(fù)風(fēng)格和個(gè)性化能力上都有明顯提升。尤其是在高風(fēng)險(xiǎn)領(lǐng)域如醫(yī)療、法律和金融類問題上的幻覺率下降了 52.5%,對(duì)用戶標(biāo)記過的錯(cuò)誤對(duì)話,錯(cuò)誤率減少了 37.3%。此外,圖片和照片的分析能力、理科問題的解答質(zhì)量以及判斷何時(shí)應(yīng)當(dāng)主動(dòng)調(diào)用搜索工具等方面也有改善。
數(shù)學(xué)和科學(xué)能力方面,GPT-5.5 Instant 在 AIME 2025 競(jìng)賽數(shù)學(xué)測(cè)試中得分 81.2,而 GPT-5.3 Instant 僅為 65.4。博士級(jí)科學(xué)測(cè)試 GPQA 的得分從 78.5 升至 85.6,多模態(tài)推理基準(zhǔn) MMMU-Pro 的得分從 69.2 升至 76,科學(xué)圖表理解 CharXiv 從 75 升至 81.6,文檔解析錯(cuò)誤率則從 14.6% 降至 12.5%。OpenAI 通過一道代數(shù)題演示了兩個(gè)版本的差距,GPT-5.5 Instant 能夠更準(zhǔn)確地定位到用戶的解題錯(cuò)誤并給出正確答案。
回復(fù)風(fēng)格也是這次更新的重點(diǎn)。新模型更簡(jiǎn)短,不再堆砌格式和表情符號(hào),減少了不必要的追問。例如,當(dāng)被問及如何委婉地讓話多的同事少說點(diǎn)話時(shí),GPT-5.5 Instant 的回復(fù)少了 30.2% 的字?jǐn)?shù)和 29.2% 的行數(shù),語(yǔ)氣更像朋友給的建議,把重點(diǎn)放在如何把問題引到自己的專注需求上,而不是對(duì)方的說話習(xí)慣上。
個(gè)性化能力是此次更新的另一條主線。Plus 和 Pro 用戶可以讓模型調(diào)取歷史對(duì)話、上傳文件以及關(guān)聯(lián)的 Gmail 內(nèi)容,從而獲得更貼合個(gè)人情況的回答,不需要每次重新解釋背景。例如,GPT-5.5 Instant 可以根據(jù)用戶的歷史對(duì)話記錄推薦更符合個(gè)人喜好的茶館,而不僅僅是通用熱門店。
OpenAI公司首席執(zhí)行官山姆·阿爾特曼周五晚些時(shí)候宣布,公司已與美國(guó)國(guó)防部就使用其人工智能模型達(dá)成協(xié)議
2026-03-02 10:49:24Anthropic遭封殺后