當?shù)貢r間8月7日,OpenAI正式推出了新一代人工智能模型GPT-5。這款模型在編碼、數(shù)學、寫作、健康、視覺感知等領域展現(xiàn)出卓越性能。GPT-5是一個統(tǒng)一的系統(tǒng),能夠自動識別何時需要快速響應,何時需要更長時間的思考以提供專家級的回答,用戶無需手動選擇使用常規(guī)語言模型還是推理系統(tǒng)。
OpenAI表示,GPT-5將面向所有用戶開放,Plus會員可獲得更多使用量,Pro會員則可訪問具有擴展推理能力的GPT-5 Pro版本,該版本能提供更全面、更準確的答案。此前,OpenAI首席執(zhí)行官薩姆·奧爾特曼稱GPT-5是一次“重大升級”,并表示這是第一次感覺像是在與某個領域的專家對話。ChatGPT團隊負責人Nick Turley也指出,新模型在響應速度、回答準確性以及減少“幻覺”方面都優(yōu)于前代產品,對話時感覺更加自然。
在簡報會上,奧爾特曼對GPT-5給予了極高評價,將其定位為通往AGI的重要里程碑,并表示擁有像GPT-5這樣的工具在過去是不可想象的。他還提到,嘗試用回GPT-4的效果相當糟糕。
GPT-5在編程、創(chuàng)意寫作和健康咨詢三個關鍵領域實現(xiàn)了顯著提升。編程方面,GPT-5是OpenAI迄今為止最強大的編碼模型,在復雜的前端生成和大型代碼庫調試方面表現(xiàn)突出。在SWE-bench Verified基準測試中,GPT-5首次嘗試的準確率達74.9%,高于其他競品。此外,GPT-5特別擅長按需啟動整個軟件App,加快開發(fā)速度。例如,研究人員演示了要求GPT-5創(chuàng)建一款網頁App,幫助用戶學習法語,幾分鐘后生成了兩個不同的App,用戶可以根據個人喜好進行調整。
在創(chuàng)意寫作方面,GPT-5能夠處理結構復雜的寫作任務,如無韻律的抑揚格五音步詩或自由詩,表現(xiàn)出更好的品味和自然流暢度。健康咨詢方面,GPT-5能更積極地標記潛在健康問題,幫助用戶解析醫(yī)療結果,盡管不能替代醫(yī)療專業(yè)人員。在HealthBench Hard Hallucinations測試中,GPT-5出現(xiàn)幻覺的錯誤信息率僅為1.6%。
GPT-5相比之前的模型更可靠和實用,事實錯誤的可能性顯著降低。OpenAI還引入了一種新的安全訓練形式,名為安全補全,教模型在安全范圍內盡可能給出最有幫助的答案。如果需要拒絕,GPT-5會以透明的方式告知用戶拒絕的原因,并提供安全的替代方案。
OpenAI還宣布推出四種預設性格的全新研究預覽版,分別是憤世嫉俗者、機器人、傾聽者和書呆子,用戶可在設置中隨時調整,以匹配ChatGPT和用戶的溝通風格。微軟也在GPT-5發(fā)布當日宣布將其整合到廣泛的產品線中,包括Microsoft 365 Copilot和GitHub Copilot等。
OpenAI推出了一款名為GPT-5的新型人工智能模型,該模型在編碼、創(chuàng)意寫作以及復雜查詢推理方面具備更強的能力
2025-08-08 01:12:43OpenAI發(fā)布GPT-5OpenAI推出了一款名為GPT-5的新型人工智能模型,該模型在編碼、創(chuàng)意寫作以及復雜查詢推理方面具備更強的能力
2025-08-08 01:41:24GPT-5模型適用于編碼和寫作8月8日,ChatGPT-5上線后,OpenAI停用了GPT-4o版本,引發(fā)用戶爭議。社交媒體上出現(xiàn)了不少關于GPT-5使用感不佳的吐槽,甚至有用戶呼吁恢復GPT-4o
2025-08-10 11:28:35GPT-5上線遭滑鐵盧