OpenAI 公司于4月15日發(fā)布博文,宣布以API形式推出GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。這些新模型在編程、指令遵循和長(zhǎng)文本理解方面全面超越前代GPT-4o及GPT-4o mini,上下文窗口最高支持100萬(wàn)tokens,知識(shí)更新至2024年6月。
目前,該系列模型專為開(kāi)發(fā)者設(shè)計(jì),僅通過(guò)開(kāi)發(fā)者API提供,普通用戶暫時(shí)無(wú)法通過(guò)ChatGPT頁(yè)面體驗(yàn)。在編程方面,GPT-4.1的代碼生成速度比GPT-4o快40%,用戶輸入查詢的成本降低了80%。
GPT-4.1系列模型在編程、指令遵循和長(zhǎng)文本處理上表現(xiàn)出色。GPT-4.1在SWE-bench Verified測(cè)試中得分54.6%,比GPT-4o提升21.4個(gè)百分點(diǎn),在MultiChallenge測(cè)試中提升10.5個(gè)百分點(diǎn),并在Video-MME測(cè)試中創(chuàng)下72.0%的新紀(jì)錄。GPT-4.1 mini在多項(xiàng)基準(zhǔn)測(cè)試中媲美甚至超越GPT-4o,延遲降低近一半,成本減少83%。GPT-4.1 nano則擁有100萬(wàn)個(gè)token的上下文窗口,在MMLU測(cè)試中得分80.1%,適合分類和自動(dòng)補(bǔ)全任務(wù)。
這些模型通過(guò)優(yōu)化推理?xiàng):吞崾揪彺婕夹g(shù),顯著降低了首次響應(yīng)時(shí)間,為開(kāi)發(fā)者提供了高效低成本的解決方案。實(shí)際應(yīng)用中,GPT-4.1特別適合構(gòu)建智能代理,處理復(fù)雜任務(wù)。例如,在Windsurf測(cè)試中,GPT-4.1提升了30%的編程效率,減少了50%不必要的編輯;Thomson Reuters的法律AI助手CoCounsel使用GPT-4.1后,多文檔審查準(zhǔn)確率提升了17%。
GPT-4.1的發(fā)布加劇了OpenAI產(chǎn)品命名的復(fù)雜性。ChatGPT目前已包含GPT-4o、GPT-4o mini、o1-pro等多種模型選項(xiàng)。OpenAI首席執(zhí)行官Sam Altman承認(rèn)命名問(wèn)題,并計(jì)劃通過(guò)未來(lái)的GPT-5整合品牌。OpenAI計(jì)劃在2025年7月前逐步淘汰API中的GPT-4.5 Preview模型,緩解命名混亂。這一臨時(shí)模型曾被批評(píng)為“失敗品”,開(kāi)發(fā)者需在2025年7月前遷移到其他模型,不過(guò)GPT-4.5在ChatGPT中暫時(shí)保留,未受影響。
API價(jià)格方面,GPT-4.1模型每100萬(wàn)tokens輸入費(fèi)用為2美元,每100萬(wàn)tokens輸出費(fèi)用為8美元。在中等查詢中,相比GPT-4o,GPT-4.1不僅性能更強(qiáng)悍,而且便宜26%。GPT-4.1 nano是OpenAI最便宜、最快的模型。