與GPT-4等模型相比,Deep Research對于需要深度和細(xì)節(jié)的多方面、特定領(lǐng)域的問題,能夠進(jìn)行廣泛探索并引用每個(gè)觀點(diǎn)。不過,它也存在局限性,如有時(shí)會(huì)在回復(fù)中產(chǎn)生事實(shí)幻覺或做出錯(cuò)誤推斷,盡管根據(jù)內(nèi)部評估,其錯(cuò)誤率明顯低于現(xiàn)有的ChatGPT模型。它可能在區(qū)分權(quán)威信息和謠言方面遇到困難,并且在自信度校準(zhǔn)方面表現(xiàn)出弱點(diǎn),常常無法準(zhǔn)確傳達(dá)不確定性。報(bào)告和引用中可能會(huì)有輕微的格式錯(cuò)誤,并且啟動(dòng)任務(wù)可能需要更長的時(shí)間。下一步,OpenAI計(jì)劃在本月內(nèi)將Deep Research推向移動(dòng)和桌面應(yīng)用程序。目前,Deep Research可以訪問公開網(wǎng)絡(luò)和上傳的文件,未來將連接更多專業(yè)化的數(shù)據(jù)源,使其輸出更加穩(wěn)健和個(gè)性化。
OpenAI研究員Jason Wei認(rèn)為,Deep Research不僅是出色的代理,也可以看作是互聯(lián)網(wǎng)的新界面。人類使用互聯(lián)網(wǎng)需要大量時(shí)間搜索和點(diǎn)擊,受到時(shí)間和注意力的限制。而AI不會(huì)累,一次可以瀏覽許多網(wǎng)站,并擁有幾乎無限的世界知識(shí)。將來,手動(dòng)瀏覽互聯(lián)網(wǎng)可能會(huì)像手動(dòng)計(jì)算數(shù)字而不使用計(jì)算器一樣過時(shí)。
OpenAI toG業(yè)務(wù)負(fù)責(zé)人Felipe Millon分享了一個(gè)個(gè)人故事。10月底,他的妻子被診斷出患有雙側(cè)乳腺癌,病情嚴(yán)重,在12月初進(jìn)行了雙乳房切除手術(shù),并隨后開始化療。他們面臨是否接受放療的問題,不同專家給出了不同的建議。Millon嘗試使用Deep Research上傳了手術(shù)報(bào)告并詢問ChatGPT的建議。ChatGPT不僅證實(shí)了人類專家提到的內(nèi)容,還找到了新的參考研究。Millon認(rèn)為這是一個(gè)改變世界的工具。
還有一些第三方團(tuán)隊(duì)提前獲得了Deep Research的測試資格,并分享了測試結(jié)果。Every團(tuán)隊(duì)介紹,某些問題需要花費(fèi)30分鐘才能得到結(jié)果,答案可能超過1萬個(gè)單詞。他們做的測試包括撰寫從2020年到今天每一天的歷史、閱讀《戰(zhàn)爭與和平》第一章并分析托爾斯泰的人物描寫,以及仔細(xì)查閱近期的10-K報(bào)告以發(fā)現(xiàn)未報(bào)告的財(cái)務(wù)違規(guī)行為等。測試中發(fā)現(xiàn)的局限性包括有時(shí)信息缺失引用來源,沒有“停止”按鈕,如果搜索偏離方向只能重新開始。
在第八日的技術(shù)分享直播中,OpenAI宣布向全球用戶免費(fèi)開放ChatGPT搜索功能,并展示了該功能在移動(dòng)設(shè)備上的更新版本
2024-12-18 08:29:53ChatGPT搜索迎來重大更新