GPT4.1系列登場(chǎng) 性能全面提升

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-04-15 07:59:25 IT之家

OpenAI 公司于4月15日發(fā)布博文，宣布以API形式推出GPT-4.1系列模型，包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。這些新模型在編程、指令遵循和長(zhǎng)文本理解方面全面超越前代GPT-4o及GPT-4o mini，上下文窗口最高支持100萬(wàn)tokens，知識(shí)更新至2024年6月。

目前，該系列模型專為開(kāi)發(fā)者設(shè)計(jì)，僅通過(guò)開(kāi)發(fā)者API提供，普通用戶暫時(shí)無(wú)法通過(guò)ChatGPT頁(yè)面體驗(yàn)。在編程方面，GPT-4.1的代碼生成速度比GPT-4o快40%，用戶輸入查詢的成本降低了80%。

GPT-4.1系列模型在編程、指令遵循和長(zhǎng)文本處理上表現(xiàn)出色。GPT-4.1在SWE-bench Verified測(cè)試中得分54.6%，比GPT-4o提升21.4個(gè)百分點(diǎn)，在MultiChallenge測(cè)試中提升10.5個(gè)百分點(diǎn)，并在Video-MME測(cè)試中創(chuàng)下72.0%的新紀(jì)錄。GPT-4.1 mini在多項(xiàng)基準(zhǔn)測(cè)試中媲美甚至超越GPT-4o，延遲降低近一半，成本減少83%。GPT-4.1 nano則擁有100萬(wàn)個(gè)token的上下文窗口，在MMLU測(cè)試中得分80.1%，適合分類和自動(dòng)補(bǔ)全任務(wù)。

這些模型通過(guò)優(yōu)化推理?xiàng)：吞崾揪彺婕夹g(shù)，顯著降低了首次響應(yīng)時(shí)間，為開(kāi)發(fā)者提供了高效低成本的解決方案。實(shí)際應(yīng)用中，GPT-4.1特別適合構(gòu)建智能代理，處理復(fù)雜任務(wù)。例如，在Windsurf測(cè)試中，GPT-4.1提升了30%的編程效率，減少了50%不必要的編輯；Thomson Reuters的法律AI助手CoCounsel使用GPT-4.1后，多文檔審查準(zhǔn)確率提升了17%。

GPT-4.1的發(fā)布加劇了OpenAI產(chǎn)品命名的復(fù)雜性。ChatGPT目前已包含GPT-4o、GPT-4o mini、o1-pro等多種模型選項(xiàng)。OpenAI首席執(zhí)行官Sam Altman承認(rèn)命名問(wèn)題，并計(jì)劃通過(guò)未來(lái)的GPT-5整合品牌。OpenAI計(jì)劃在2025年7月前逐步淘汰API中的GPT-4.5 Preview模型，緩解命名混亂。這一臨時(shí)模型曾被批評(píng)為“失敗品”，開(kāi)發(fā)者需在2025年7月前遷移到其他模型，不過(guò)GPT-4.5在ChatGPT中暫時(shí)保留，未受影響。

API價(jià)格方面，GPT-4.1模型每100萬(wàn)tokens輸入費(fèi)用為2美元，每100萬(wàn)tokens輸出費(fèi)用為8美元。在中等查詢中，相比GPT-4o，GPT-4.1不僅性能更強(qiáng)悍，而且便宜26%。GPT-4.1 nano是OpenAI最便宜、最快的模型。

(責(zé)任編輯：于浩淙 zx0176)

關(guān)閉

GPT4.1系列登場(chǎng) 性能全面提升

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)