在今日凌晨的直播中,OpenAI 正式發(fā)布了 o3 和 o4-mini 模型。這些模型代表了 ChatGPT 能力的一次重大飛躍,適用于從普通用戶到高級研究人員的各種需求。
新的推理模型可以智能地使用和結合 ChatGPT 中的工具,如搜索網絡、分析上傳的文件、處理視覺輸入等。這些模型被訓練來判斷何時以及如何使用工具來生成詳細且深思熟慮的答案,通常在不到一分鐘內完成,從而更有效地解決復雜問題。
o3 是 OpenAI 最強大的推理模型,在編碼、數學、科學、視覺感知等領域表現出色。它適合需要多方面分析的高級查詢,在圖像、圖表和圖形等視覺任務上表現尤為突出。與前代相比,o3 在編程、商業(yè)咨詢和創(chuàng)意構思等領域少犯 20% 的重大錯誤。
o4-mini 則是一個針對快速、成本效益推理優(yōu)化的小模型,在數學、編碼和視覺任務上展現出優(yōu)異性能。當提供 Python 解釋器時,o4-mini 在 AIME 2025 上得分 99.5%,并在非 STEM 任務及數據科學領域超越了前輩 o3-mini。由于其高效性,o4-mini 支持更高的使用限制,成為高容量、高吞吐量的選擇。
這兩個新模型支持更加自然的對話,通過參考記憶和過去的對話使響應更加個性化和相關。開發(fā)過程中,大規(guī)模強化學習顯示出了“更多計算能力 = 更好性能”的趨勢。o3 相比 o1 在相同延遲和成本下提供了更高性能,并且隨著思考時間增加,性能持續(xù)提升。
這些模型能夠直接將圖像整合到思維鏈中,不僅查看圖像,還能利用圖像進行思考。用戶可以上傳白板照片、教科書圖表或手繪草圖,即使圖像質量不佳,模型也能解讀并實時操作圖像,如旋轉、縮放或變換。此外,它們還可以訪問 ChatGPT 中的所有工具,并通過 API 使用自定義工具,以快速解決問題。
4月30日,小米通過其公眾號宣布開源首個專為推理設計的大模型「XiaomiMiMo」。該模型從預訓練到后訓練全面提升了推理能力,在數學推理和代碼競賽的公開測評中表現優(yōu)異
2025-04-30 12:54:33小米首個推理大模型開源OpenAI首席執(zhí)行官山姆·奧特曼當地時間1月17日在社交媒體平臺X發(fā)文稱,OpenAI已完成新推理AI模型o3 mini版本,將在幾周內推出
2025-01-18 11:24:13OpenAI將推出推理AI模型