GPT-5寫作像詩人創(chuàng)意任務(wù)更出色

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-08-08 07:29:48 每日經(jīng)濟新聞

當(dāng)?shù)貢r間8月7日，OpenAI正式推出了新一代人工智能模型GPT-5。這款模型在編碼、數(shù)學(xué)、寫作、健康、視覺感知等領(lǐng)域展現(xiàn)出卓越性能。GPT-5是一個統(tǒng)一的系統(tǒng)，能夠自動識別何時需要快速響應(yīng)，何時需要更長時間的思考以提供專家級的回答，用戶無需手動選擇使用常規(guī)語言模型還是推理系統(tǒng)。

OpenAI表示，GPT-5將面向所有用戶開放，Plus會員可獲得更多使用量，Pro會員則可訪問具有擴展推理能力的GPT-5 Pro版本，該版本能提供更全面、更準(zhǔn)確的答案。此前，OpenAI首席執(zhí)行官薩姆·奧爾特曼稱GPT-5是一次“重大升級”，并表示這是第一次感覺像是在與某個領(lǐng)域的專家對話。ChatGPT團隊負(fù)責(zé)人Nick Turley也指出，新模型在響應(yīng)速度、回答準(zhǔn)確性以及減少“幻覺”方面都優(yōu)于前代產(chǎn)品，對話時感覺更加自然。

在簡報會上，奧爾特曼對GPT-5給予了極高評價，將其定位為通往AGI的重要里程碑，并表示擁有像GPT-5這樣的工具在過去是不可想象的。他還提到，嘗試用回GPT-4的效果相當(dāng)糟糕。

GPT-5在編程、創(chuàng)意寫作和健康咨詢?nèi)齻€關(guān)鍵領(lǐng)域?qū)崿F(xiàn)了顯著提升。編程方面，GPT-5是OpenAI迄今為止最強大的編碼模型，在復(fù)雜的前端生成和大型代碼庫調(diào)試方面表現(xiàn)突出。在SWE-bench Verified基準(zhǔn)測試中，GPT-5首次嘗試的準(zhǔn)確率達74.9%，高于其他競品。此外，GPT-5特別擅長按需啟動整個軟件App，加快開發(fā)速度。例如，研究人員演示了要求GPT-5創(chuàng)建一款網(wǎng)頁App，幫助用戶學(xué)習(xí)法語，幾分鐘后生成了兩個不同的App，用戶可以根據(jù)個人喜好進行調(diào)整。

在創(chuàng)意寫作方面，GPT-5能夠處理結(jié)構(gòu)復(fù)雜的寫作任務(wù)，如無韻律的抑揚格五音步詩或自由詩，表現(xiàn)出更好的品味和自然流暢度。健康咨詢方面，GPT-5能更積極地標(biāo)記潛在健康問題，幫助用戶解析醫(yī)療結(jié)果，盡管不能替代醫(yī)療專業(yè)人員。在HealthBench Hard Hallucinations測試中，GPT-5出現(xiàn)幻覺的錯誤信息率僅為1.6%。

GPT-5相比之前的模型更可靠和實用，事實錯誤的可能性顯著降低。OpenAI還引入了一種新的安全訓(xùn)練形式，名為安全補全，教模型在安全范圍內(nèi)盡可能給出最有幫助的答案。如果需要拒絕，GPT-5會以透明的方式告知用戶拒絕的原因，并提供安全的替代方案。

OpenAI還宣布推出四種預(yù)設(shè)性格的全新研究預(yù)覽版，分別是憤世嫉俗者、機器人、傾聽者和書呆子，用戶可在設(shè)置中隨時調(diào)整，以匹配ChatGPT和用戶的溝通風(fēng)格。微軟也在GPT-5發(fā)布當(dāng)日宣布將其整合到廣泛的產(chǎn)品線中，包括Microsoft 365 Copilot和GitHub Copilot等。

(責(zé)任編輯：zx0176)

關(guān)閉

GPT-5寫作像詩人 創(chuàng)意任務(wù)更出色

相關(guān)新聞

今日熱點

頻道熱點

GPT-5寫作像詩人創(chuàng)意任務(wù)更出色