自2022年11月ChatGPT發(fā)布以來,OpenAI的新品發(fā)布會(huì)備受關(guān)注。然而,最新發(fā)布的GPT-5并未達(dá)到用戶的高期望。盡管這款大模型確實(shí)有所提升,但遠(yuǎn)未如科技圈預(yù)期的那樣驚艷。
距離GPT-4發(fā)布已有兩年半時(shí)間,GPT-5終于在2023年8月8日凌晨正式亮相。OpenAI推出了四個(gè)版本:主流模型GPT-5、面向開發(fā)者和企業(yè)的輕量版GPT-5 Mini、超輕量版GPT-5 Nano,以及高級(jí)版GPT-5 Pro。這些版本覆蓋了企業(yè)、開發(fā)者和普通用戶的需求。
發(fā)布會(huì)上,山姆·奧特曼將GPT-4到GPT-5的跨越比作iPhone從像素屏進(jìn)化到視網(wǎng)膜屏,并聲稱GPT-5能提供博士級(jí)別的解答。然而,實(shí)際表現(xiàn)并未完全符合這一描述。
GPT-5在使用上更加簡潔統(tǒng)一,終結(jié)了用戶的選擇困難癥。價(jià)格方面,GPT-5推出了限量免費(fèi)策略,每5小時(shí)可免費(fèi)發(fā)送10條信息。API價(jià)格也降至每百萬Token輸入1.25美元,輸出10美元。與競爭對手相比,GPT-5的價(jià)格更具競爭力。
盡管如此,許多熬夜觀看發(fā)布會(huì)的應(yīng)用者仍感到失望。一位大模型從業(yè)者表示,GPT-5除了“刷榜”外沒有明顯優(yōu)勢。另一位從業(yè)者則認(rèn)為,技術(shù)發(fā)展不是線性的,人們對GPT-5的期待過高。
事實(shí)上,GPT-5在各項(xiàng)基準(zhǔn)測試中表現(xiàn)優(yōu)于前一代模型,特別是在編程方面刷新了紀(jì)錄。然而,在SWE-bench編程測試中,GPT-5的成績僅略高于Anthropic公司的Claude Opus 4.1。馬斯克甚至公開表示GPT-5在ARC-AGI-2測試中未能擊敗xAI公司的Grok 4。
GPT-5褒貶不一的背后,反映出大模型訓(xùn)練已逐漸觸及天花板。據(jù)報(bào)道,GPT-5的研發(fā)遇到了高質(zhì)量訓(xùn)練數(shù)據(jù)不足和大規(guī)模預(yù)訓(xùn)練收益下降的問題。為此,OpenAI發(fā)布了兩款開源模型GPT-oss-120b和GPT-oss-20b,但這些模型的幻覺率較高,引起了詬病。
新一輪科技革命和產(chǎn)業(yè)變革正在重塑全球創(chuàng)新格局,AI人才培養(yǎng)成為焦點(diǎn)。北京作為全國“AI第一城”,正醞釀一場從基礎(chǔ)教育階段開始的變革
2025-03-19 13:13:11AI密度最高的城市