GPT-5發(fā)布馬斯克不服開懟新模型引發(fā)爭(zhēng)議(2)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-08-08 09:19:09 新浪

GPT-5在寫作和編程方面也得到顯著提升。例如，研發(fā)人員讓GPT-5為GPT-4o寫了一篇悼文，內(nèi)容讓人感覺像是與一位高智商、高情商的朋友交流。此外，GPT-5還能夠建立學(xué)習(xí)法語的網(wǎng)絡(luò)應(yīng)用，并嵌入一款教育游戲。Cursor聯(lián)合創(chuàng)始人兼首席執(zhí)行官M(fèi)ichael Truell在現(xiàn)場(chǎng)演示中表示，GPT-5在解決復(fù)雜問題時(shí)比他本人更快。

GPT-5改進(jìn)了語音功能，聽起來自然如人對(duì)話。免費(fèi)用戶每天可以聊上幾個(gè)小時(shí)。結(jié)合ChatGPT學(xué)習(xí)模式，用戶可以以引導(dǎo)的方式教用戶學(xué)習(xí)韓語。OpenAI還宣布推出更加定制化的ChatGPT，支持自定義聊天功能，可調(diào)整模型的性格，并改變聊天界面的顏色。

為了使GPT-5更符合個(gè)人用戶的溝通方式，研發(fā)團(tuán)隊(duì)增強(qiáng)了其記憶功能，使其在指定日程時(shí)能考慮到之前的安排。下周起，Pro用戶可接入Gmail和谷歌日歷，自動(dòng)規(guī)劃日程和回復(fù)郵件。

GPT-5在多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)出色，特別是在編碼和智能體任務(wù)方面。它在SWE-bench驗(yàn)證測(cè)試中得分74.9%，較o3版本的69.1%有所提升。GPT-5在Aider polyglot測(cè)試中得分88%，在深度分析代碼庫方面表現(xiàn)出色。此外，GPT-5在長(zhǎng)背景信息性能方面也有所提升。

在安全問題上，GPT-5引入了新的安全訓(xùn)練形式——安全完成（safe completions），教會(huì)模型盡可能給出有用的答案，同時(shí)保持在安全范圍內(nèi)。GPT-5還減少了阿諛奉承的問題，減少了過度討好和無意義的表情符號(hào)的使用。

GPT-5 Pro是OpenAI o3-pro的替代品，能提供更全面、高質(zhì)量的答案。在多個(gè)具有挑戰(zhàn)性的基準(zhǔn)測(cè)試中，GPT-5 Pro實(shí)現(xiàn)了同家族模型中的最佳性能。外部專家更偏好GPT-5 pro的回答，其犯下重大錯(cuò)誤的比例降低了22%。

GPT-5的發(fā)布引起了廣泛關(guān)注，但也帶來了一些爭(zhēng)議。有人質(zhì)疑OpenAI在發(fā)布會(huì)上使用了“視覺騙局”夸大性能提升。GPT-5在真實(shí)使用場(chǎng)景中的性能與體驗(yàn)尚待市場(chǎng)反饋。

首頁上一頁 12共 2 頁

(責(zé)任編輯：0882)

關(guān)閉

GPT-5發(fā)布 馬斯克不服開懟 新模型引發(fā)爭(zhēng)議(2)

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

GPT-5發(fā)布馬斯克不服開懟新模型引發(fā)爭(zhēng)議(2)