當(dāng)?shù)貢r間8月7日,OpenAI正式推出了新一代人工智能模型GPT-5。這款模型在編碼、數(shù)學(xué)、寫作、健康、視覺感知等領(lǐng)域展現(xiàn)出卓越性能。GPT-5是一個統(tǒng)一的系統(tǒng),能夠自動識別何時需要快速響應(yīng),何時需要更長時間的思考以提供專家級的回答,用戶無需手動選擇使用常規(guī)語言模型還是推理系統(tǒng)。
OpenAI表示,GPT-5將面向所有用戶開放,Plus會員可獲得更多使用量,Pro會員則可訪問具有擴展推理能力的GPT-5 Pro版本,該版本能提供更全面、更準(zhǔn)確的答案。此前,OpenAI首席執(zhí)行官薩姆·奧爾特曼稱GPT-5是一次“重大升級”,并表示這是第一次感覺像是在與某個領(lǐng)域的專家對話。ChatGPT團隊負(fù)責(zé)人Nick Turley也指出,新模型在響應(yīng)速度、回答準(zhǔn)確性以及減少“幻覺”方面都優(yōu)于前代產(chǎn)品,對話時感覺更加自然。
在簡報會上,奧爾特曼對GPT-5給予了極高評價,將其定位為通往AGI的重要里程碑,并表示擁有像GPT-5這樣的工具在過去是不可想象的。他還提到,嘗試用回GPT-4的效果相當(dāng)糟糕。
GPT-5在編程、創(chuàng)意寫作和健康咨詢?nèi)齻€關(guān)鍵領(lǐng)域?qū)崿F(xiàn)了顯著提升。編程方面,GPT-5是OpenAI迄今為止最強大的編碼模型,在復(fù)雜的前端生成和大型代碼庫調(diào)試方面表現(xiàn)突出。在SWE-bench Verified基準(zhǔn)測試中,GPT-5首次嘗試的準(zhǔn)確率達74.9%,高于其他競品。此外,GPT-5特別擅長按需啟動整個軟件App,加快開發(fā)速度。例如,研究人員演示了要求GPT-5創(chuàng)建一款網(wǎng)頁App,幫助用戶學(xué)習(xí)法語,幾分鐘后生成了兩個不同的App,用戶可以根據(jù)個人喜好進行調(diào)整。
在創(chuàng)意寫作方面,GPT-5能夠處理結(jié)構(gòu)復(fù)雜的寫作任務(wù),如無韻律的抑揚格五音步詩或自由詩,表現(xiàn)出更好的品味和自然流暢度。健康咨詢方面,GPT-5能更積極地標(biāo)記潛在健康問題,幫助用戶解析醫(yī)療結(jié)果,盡管不能替代醫(yī)療專業(yè)人員。在HealthBench Hard Hallucinations測試中,GPT-5出現(xiàn)幻覺的錯誤信息率僅為1.6%。
GPT-5相比之前的模型更可靠和實用,事實錯誤的可能性顯著降低。OpenAI還引入了一種新的安全訓(xùn)練形式,名為安全補全,教模型在安全范圍內(nèi)盡可能給出最有幫助的答案。如果需要拒絕,GPT-5會以透明的方式告知用戶拒絕的原因,并提供安全的替代方案。
OpenAI還宣布推出四種預(yù)設(shè)性格的全新研究預(yù)覽版,分別是憤世嫉俗者、機器人、傾聽者和書呆子,用戶可在設(shè)置中隨時調(diào)整,以匹配ChatGPT和用戶的溝通風(fēng)格。微軟也在GPT-5發(fā)布當(dāng)日宣布將其整合到廣泛的產(chǎn)品線中,包括Microsoft 365 Copilot和GitHub Copilot等。
OpenAI推出了一款名為GPT-5的新型人工智能模型,該模型在編碼、創(chuàng)意寫作以及復(fù)雜查詢推理方面具備更強的能力
2025-08-08 01:12:43OpenAI發(fā)布GPT-5OpenAI推出了一款名為GPT-5的新型人工智能模型,該模型在編碼、創(chuàng)意寫作以及復(fù)雜查詢推理方面具備更強的能力
2025-08-08 01:41:24GPT-5模型適用于編碼和寫作