阿里巴巴通義實(shí)驗(yàn)室向全球開(kāi)源了Tongyi DeepResearch模型。這是全球首個(gè)在性能上能與行業(yè)標(biāo)桿OpenAI DeepResearch相媲美,并且完全開(kāi)源的Web Agent。在多個(gè)權(quán)威基準(zhǔn)測(cè)試中,Tongyi DeepResearch不僅表現(xiàn)出色,還在不少單項(xiàng)上名列前茅,刷新了整個(gè)AI行業(yè)的技術(shù)標(biāo)準(zhǔn)。
過(guò)去六個(gè)月里,通義團(tuán)隊(duì)每月發(fā)布一篇技術(shù)報(bào)告。隨著Tongyi DeepResearch的正式亮相,他們又發(fā)布了六篇新的技術(shù)報(bào)告,內(nèi)容涵蓋數(shù)據(jù)合成、長(zhǎng)期推理等多個(gè)方面,幾乎涵蓋了智能體技術(shù)的所有關(guān)鍵領(lǐng)域。
Tongyi DeepResearch采用了先進(jìn)的MoE架構(gòu),在性能與同等規(guī)模的傳統(tǒng)稠密模型相當(dāng)?shù)耐瑫r(shí),推理效率提升了近10倍。這意味著高性能AI智能體的部署和使用門(mén)檻大大降低。
該模型擁有高達(dá)128K的超長(zhǎng)上下文窗口,可以一次性處理和記憶大量信息,適用于需要進(jìn)行長(zhǎng)周期、多輪次深度挖掘的研究任務(wù)。實(shí)際應(yīng)用中,它能夠同時(shí)“閱讀”并理解數(shù)十篇學(xué)術(shù)論文或?yàn)g覽數(shù)百個(gè)網(wǎng)頁(yè),還能發(fā)現(xiàn)不同文檔之間的內(nèi)在聯(lián)系,進(jìn)行綜合歸納。
通義團(tuán)隊(duì)為這個(gè)“大腦”設(shè)計(jì)了兩種不同的推理范式:ReAct模式和IterResearch模式。ReAct模式遵循“思考-行動(dòng)-觀(guān)察”的閉環(huán),模型先對(duì)問(wèn)題進(jìn)行推理,再?zèng)Q定下一步行動(dòng),最后觀(guān)察結(jié)果,進(jìn)入下一輪循環(huán)。這種模式受到AI領(lǐng)域“慘痛教訓(xùn)”的影響,強(qiáng)調(diào)利用海量計(jì)算能力的通用方法。
IterResearch模式則針對(duì)極端復(fù)雜的深度研究任務(wù)。它將任務(wù)分解成一系列結(jié)構(gòu)清晰的“研究回合”,每個(gè)回合只攜帶上一回合的核心結(jié)論,構(gòu)建精簡(jiǎn)的工作空間。這種方法使Agent在執(zhí)行長(zhǎng)期任務(wù)時(shí)保持清晰的認(rèn)知焦點(diǎn)和高質(zhì)量的推理能力。