北京時間12月6日凌晨,OpenAI舉辦了“12天12場直播”活動的首秀,推出了推理大模型o1的滿血版本和進階模式,以及每月收費200美元(約合人民幣1450元)的ChatGPT Pro訂閱服務(wù)。該套餐用戶可以大規(guī)模訪問OpenAI的最佳模型和工具,包括無限制使用最智能的模型o1、較小的模型o1-mini、GPT-4o及類人的ChatGPT高級語音模式Advanced Voice。
ChatGPT Pro還提供名為o1 pro mode的新o1版本,這是ChatGPT Pro獨有的。新版本使用更多的計算資源,能夠更深入地思考并為復(fù)雜問題提供更佳答案。未來計劃為ChatGPT Pro添加更多強大的計算密集型生產(chǎn)力功能。
與預(yù)覽版相比,當(dāng)前的o1模型在回答困難現(xiàn)實問題時,出現(xiàn)重大錯誤的概率減少了34%,并且處理速度提高了約50%。例如,在回答“列出2世紀(jì)羅馬皇帝的名字、任期和主要成就”的問題時,o1模型用時14秒,而預(yù)覽版則需要34秒。此外,能力較弱的GPT-4o在回答這個問題時會出錯。
o1模型現(xiàn)在支持圖片輸入,用戶可以在詢問太空數(shù)據(jù)中心散熱問題時附上手繪示意圖。OpenAI計劃在未來幾個月內(nèi)增加網(wǎng)頁瀏覽和文件上傳等功能的支持。
在數(shù)學(xué)、科學(xué)和編碼等具有挑戰(zhàn)性的機器學(xué)習(xí)基準(zhǔn)測試中,o1 pro mode表現(xiàn)優(yōu)于o1和o1-preview。具體來說,在數(shù)學(xué)方面,o1 pro mode得分為86,而o1和o1-preview分別為78和50;在編碼方面,o1 pro mode得分為90,o1和o1-preview分別為89和62;在問答博士級別的科學(xué)問題方面,o1 pro mode得分為79,后兩者分別為76和74。
為了強調(diào)o1 pro mode的可靠性,OpenAI提高了評估標(biāo)準(zhǔn),要求模型必須在四次嘗試中全部正確才能算作解決了問題。即使在這種高標(biāo)準(zhǔn)下,o1 pro mode的表現(xiàn)依然明顯優(yōu)于o1和o1-preview。在四次答問都必須正確的標(biāo)準(zhǔn)下,o1 pro mode在數(shù)學(xué)方面得分為80,o1和o1-preview分別為67和37;在編碼方面,o1 pro mode得分為75,o1和o1-preview分別為64和26;在問答博士級別的科學(xué)問題方面,o1 pro mode得分為74,o1和o1-preview分別為67和58。
近日,有網(wǎng)友發(fā)現(xiàn)12306上線了車內(nèi)換座功能,即乘坐同一車次時,分段購票,中途乘客無需下車,直接在車內(nèi)更換座位
2024-09-24 15:40:1912306增加新服務(wù)華爾街策略師的觀點是,即便共和黨總統(tǒng)候選人唐納德·特朗普表達(dá)了他對美元貶值的偏好,他的連任實際上可能促使美元走強
2024-07-23 10:26:13特朗普抱怨美元太強作為上個月宣布的里程碑式協(xié)議的一部分,蘋果公司將獲得OpenAI董事會觀察員職位,進一步加強了這對曾經(jīng)不太可能合作的伙伴之間的關(guān)系。
2024-07-03 10:24:34蘋果將獲OpenAI董事會觀察員職位