GPT-5在寫作和編程方面也得到顯著提升。例如,研發(fā)人員讓GPT-5為GPT-4o寫了一篇悼文,內(nèi)容讓人感覺像是與一位高智商、高情商的朋友交流。此外,GPT-5還能夠建立學(xué)習(xí)法語的網(wǎng)絡(luò)應(yīng)用,并嵌入一款教育游戲。Cursor聯(lián)合創(chuàng)始人兼首席執(zhí)行官M(fèi)ichael Truell在現(xiàn)場(chǎng)演示中表示,GPT-5在解決復(fù)雜問題時(shí)比他本人更快。
GPT-5改進(jìn)了語音功能,聽起來自然如人對(duì)話。免費(fèi)用戶每天可以聊上幾個(gè)小時(shí)。結(jié)合ChatGPT學(xué)習(xí)模式,用戶可以以引導(dǎo)的方式教用戶學(xué)習(xí)韓語。OpenAI還宣布推出更加定制化的ChatGPT,支持自定義聊天功能,可調(diào)整模型的性格,并改變聊天界面的顏色。
為了使GPT-5更符合個(gè)人用戶的溝通方式,研發(fā)團(tuán)隊(duì)增強(qiáng)了其記憶功能,使其在指定日程時(shí)能考慮到之前的安排。下周起,Pro用戶可接入Gmail和谷歌日歷,自動(dòng)規(guī)劃日程和回復(fù)郵件。
GPT-5在多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)出色,特別是在編碼和智能體任務(wù)方面。它在SWE-bench驗(yàn)證測(cè)試中得分74.9%,較o3版本的69.1%有所提升。GPT-5在Aider polyglot測(cè)試中得分88%,在深度分析代碼庫方面表現(xiàn)出色。此外,GPT-5在長(zhǎng)背景信息性能方面也有所提升。
在安全問題上,GPT-5引入了新的安全訓(xùn)練形式——安全完成(safe completions),教會(huì)模型盡可能給出有用的答案,同時(shí)保持在安全范圍內(nèi)。GPT-5還減少了阿諛奉承的問題,減少了過度討好和無意義的表情符號(hào)的使用。
GPT-5 Pro是OpenAI o3-pro的替代品,能提供更全面、高質(zhì)量的答案。在多個(gè)具有挑戰(zhàn)性的基準(zhǔn)測(cè)試中,GPT-5 Pro實(shí)現(xiàn)了同家族模型中的最佳性能。外部專家更偏好GPT-5 pro的回答,其犯下重大錯(cuò)誤的比例降低了22%。
GPT-5的發(fā)布引起了廣泛關(guān)注,但也帶來了一些爭(zhēng)議。有人質(zhì)疑OpenAI在發(fā)布會(huì)上使用了“視覺騙局”夸大性能提升。GPT-5在真實(shí)使用場(chǎng)景中的性能與體驗(yàn)尚待市場(chǎng)反饋。
OpenAI推出了一款名為GPT-5的新型人工智能模型,該模型在編碼、創(chuàng)意寫作以及復(fù)雜查詢推理方面具備更強(qiáng)的能力
2025-08-08 01:12:43OpenAI發(fā)布GPT-5OpenAI首席執(zhí)行官山姆·奧特曼在社交平臺(tái)X上發(fā)文稱,將在數(shù)周內(nèi)發(fā)布o(jì)3、o4-mini,未來幾月內(nèi)發(fā)布GPT-5
2025-04-05 10:32:50OpenAI將在數(shù)周內(nèi)發(fā)布o(jì)3o4-mini