电竞下注-中国电竞赛事及体育赛事平台

首頁
資訊
軍事
財經(jīng)
娛樂
汽車
游戲
文化
援藏
插畫
健康
公益
優(yōu)選
法制
守藝中華
應急中國
更多
佛學文史古詩詞人物解夢生活商業(yè)成長
地方頻道
湖北山東山西絲路

注冊登錄

中華網(wǎng) china.com

國內(nèi) 國際社會體育專題軍事財經(jīng) 滾動

剛剛，OpenAI放出最后大驚喜o3，高計算模式每任務花費數(shù)千美元突破ARC-AGI基準

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2024-12-22 10:22:16 機器之心Pro

OpenAI 在為期12天的發(fā)布周期中，最終推出了新的推理系列模型o3和o3-mini。這些模型是o1系列的繼任者，旨在通過增加思考時間來提高回答準確率。由于版權(quán)問題，OpenAI跳過了o2這一命名。

從昨天開始，OpenAI已經(jīng)開始預熱新模型，并且有開發(fā)者在網(wǎng)上發(fā)現(xiàn)了對o3_min_safety_test的引用。然而，o3系列模型不會直接公開發(fā)布，而是先進行安全測試。Sam Altman提到，他們計劃在一月底左右推出o3-mini，并在不久后推出完整的o3模型。

o3模型在ARC-AGI基準上取得了突破，成為首個達到該基準優(yōu)良水平的AI模型。在高效率模式下，o3的最低性能為75.7%，而在低效率模式下則能達到87.5%。ARC-AGI基準要求AI根據(jù)輸入輸出示例尋找規(guī)律并預測輸出，類似于圖形推理問題。盡管每項任務的成本較高，但o3展示了人工智能適應新任務能力的重大飛躍。

不過，報告也指出，ARC-AGI并不是對AGI的嚴峻考驗，通過ARC-AGI并不等于實現(xiàn)AGI。o3在一些簡單任務上仍然失敗，表明其與人類智能存在根本差異。明年，ARC Prize Fundation將與OpenAI合作開發(fā)下一代基準，預計會對o3構(gòu)成重大挑戰(zhàn)。

o3在編碼能力和數(shù)學問題上的表現(xiàn)也顯著提升。在SWE-bench Verified基準上，o3的準確率約為71.7%，比o1高出20%以上。在競賽數(shù)學上，o3的準確率達到96.7%，在GPQA Diamond基準上達到87.7%。此外，在EpochAI Frontier Math基準上，o3的準確率超過25%，而其他產(chǎn)品低于2%。

o3-mini是一個更經(jīng)濟高效的版本，專注于提升推理速度和降低成本。它支持三種不同的推理時間選項——低、中、高。與o1相比，o3-mini在Codeforces上的性能具有顯著的成本效益，使其非常適合編程。在數(shù)學問題上，o3-mini (low) 實現(xiàn)了與gpt-4o相當?shù)牡脱舆t。

12 全文共 2 頁下一頁

關(guān)閉

報告稱純電車每年保費是燃油車1.8倍保費逐年上漲引發(fā)關(guān)注

報告稱純電車每年保費是燃油車1.8倍2025-01-07 10:45:11

“吃貨莎”在一次上線了，孫穎莎在海南訓練的時候，邊走邊吃

孫穎莎海南冬訓2025-01-07 10:44:49

大V：庫爾斯克烏軍反擊為爭談判籌碼豪賭失敗滿盤皆輸

庫爾斯克烏軍反擊為爭談判籌碼2025-01-07 10:43:56

美欲將核威懾引入亞太

美欲將核威懾引入亞太2025-01-07 10:00:35

大反轉(zhuǎn)！離岸人民幣連續(xù)升穿7.34和7.33關(guān)口，發(fā)生了什么？特朗普關(guān)稅政策不及預期

離岸人民幣連續(xù)升穿7.34和7.33關(guān)口2025-01-07 09:57:06

“吃貨莎”在一次上線了，孫穎莎在海南訓練的時候，邊走邊吃

孫穎莎海南冬訓2025-01-07 10:44:49

特朗普辟謠關(guān)稅政策美股巨震市場情緒波動顯著

特朗普辟謠關(guān)稅政策美股巨震2025-01-07 09:56:42

布林肯剛到韓國，公調(diào)處多名官員被檢舉美訪問時機引猜測

布林肯剛到韓國,公調(diào)處多名官員被檢舉2025-01-07 10:08:14

美國參議院邀請?zhí)乩势臻_會內(nèi)閣提名待確認

美國參議院邀請?zhí)乩势臻_會2025-01-07 09:59:03

一戰(zhàn)封神！米蘭新帥賽后熱淚盈眶，執(zhí)教兩場即奪冠創(chuàng)隊史紀錄逆轉(zhuǎn)奇跡載入史冊

米蘭新帥賽后熱淚盈眶2025-01-07 10:36:44

戲里淮安哥哥喂牛，戲外成毅在純享牧場喂毅淇牛

成毅喂牛2025-01-07 10:34:15

報告稱純電車每年保費是燃油車1.8倍保費逐年上漲引發(fā)關(guān)注

報告稱純電車每年保費是燃油車1.8倍2025-01-07 10:45:11

印度推遲太空對接實驗需更多地面驗證

印度推遲太空對接實驗2025-01-07 09:44:37

布林肯沙利文齊訪亞太是告別之旅嗎聚焦雅魯藏布江議題

布林肯沙利文齊訪亞太是告別之旅嗎2025-01-07 10:42:11

特魯多宣布辭職后，特朗普快速回應提及“美加合并說”

特魯多宣布辭職后,特朗普快速回應2025-01-07 10:00:03

騰訊、寧德時代：是一個錯誤企業(yè)否認軍事關(guān)聯(lián)

騰訊,寧德時代,是一個錯誤2025-01-07 10:04:13

復盤意大利超級杯：米蘭讓二追三打出斗志

復盤意大利超級杯2025-01-07 10:38:06

烏官員稱烏軍控制區(qū)域擴大庫爾斯克方向進展顯著

烏官員稱烏軍控制區(qū)域擴大2025-01-07 09:47:13

朝鮮試射新型高超音速中遠程彈道導彈

朝鮮試射新型高超音速中遠程彈道導彈2025-01-07 09:58:45

烏軍突襲多所核電站

烏軍突襲多所核電站2025-01-07 10:02:19

西藏日喀則市定日縣發(fā)生6.8級地震震感明顯房屋倒塌

西藏日喀則市定日縣發(fā)生6.8級地震2025-01-07 10:38:27

WTT世界乒聯(lián)公布2025第2周世界排名，莊智淵王歆茹退出

莊智淵王歆茹退出WTT世排2025-01-07 10:37:50

曼聯(lián)或?qū)矕|尼出租希臘領(lǐng)頭羊，恐需承擔15萬周薪！與馬夏爾爭冠多隊有意租借巴西邊鋒

曼聯(lián)或?qū)矕|尼出租希臘領(lǐng)頭羊2025-01-07 10:39:45

林俊杰黑粉登報公開致歉誹謗言論引反思

林俊杰黑粉登報公開致歉2025-01-07 10:40:11

加碼鼓勵“印度制造”，印政府擬為電子元件制造商提供 2300億盧比支持推動本地制造業(yè)增長

加碼鼓勵印度制造,印政府擬為電子元件制造商提供2300億盧比支持2025-01-07 10:31:38

西藏定日縣震中有房屋倒塌傷亡情況待確認

西藏定日縣震中有房屋倒塌2025-01-07 10:43:19

特朗普稱華盛頓郵報報道不實假新聞再引爭議

特朗普稱華盛頓郵報報道不實2025-01-07 09:48:06

烏國防情報總局稱已接收美援助的“哈澤德”無人機，意味著什么？

烏國防情報總局稱已接收美援助的“哈澤德”無人機，意味著什么？2025-01-07 10:04:39

騰訊寧德時代回應被列入美國防部清單：是一個錯誤

騰訊寧德時代回應被列入美國防部清單2025-01-07 10:02:45

中醫(yī)推薦！一個穴位預防流感

一個穴位預防流感2025-01-07 10:43:36

全面取消在就業(yè)地參保戶籍限制放開參保戶籍限制設置連續(xù)參保激勵

全面取消在就業(yè)地參保戶籍限制2025-01-07 10:34:44

太陽變陣效果不大？半場僅得42分落后76人全隊無人得分上雙變陣有奇效待驗證

太陽變陣效果不大2025-01-07 10:36:09

民眾黨號召八千新黨員上街游行抗議司法不公

民眾黨號召八千新黨員上街游行2025-01-07 10:06:36

大V：庫爾斯克烏軍反擊為爭談判籌碼豪賭失敗滿盤皆輸

庫爾斯克烏軍反擊為爭談判籌碼2025-01-07 10:43:56

網(wǎng)友前往珠峰大本營遇地震：車狂搖，定日縣發(fā)生6.9級地震

網(wǎng)友前往珠峰大本營遇地震2025-01-07 10:41:32

相關(guān)新聞

今日熱點

四川村民近距離記錄野生金錢豹幼崽珍貴畫面曝光

電影《給阿嬤的情書》引共鳴跨越山海的家國情懷

運動員長期飲食不規(guī)律突然“失明” 糖尿病視網(wǎng)膜病變警示

珠峰向?qū)孥E生還家人已著手辦葬禮從絕望到重逢的奇跡

頻道熱點

主編郵箱
網(wǎng)上不良信息舉報電話：010-56177181

關(guān)于中華網(wǎng) | 廣告服務 | 聯(lián)系我們 | 招聘信息 | 版權(quán)聲明 | 豁免條款 | 友情鏈接 | 中華網(wǎng)動態(tài)
版權(quán)所有中華網(wǎng)