2月14日,字節(jié)跳動正式推出豆包大模型2.0(Doubao-Seed-2.0)。自2023年初始測試版上線以來,豆包大模型經(jīng)歷了近一年半的持續(xù)更新,在文本基礎(chǔ)、多模態(tài)強(qiáng)化、深度思考和智能體執(zhí)行等方面不斷升級。此次發(fā)布的2.0版本具備全棧模型矩陣、多模態(tài)理解、企業(yè)級智能體和成本優(yōu)勢,已躋身全球第一梯隊(duì)。
豆包2.0系列包括Pro、Lite、Mini三款不同尺寸的通用智能體模型,提供全面升級的多模態(tài)理解和強(qiáng)化的長鏈路任務(wù)執(zhí)行能力。豆包2.0 Pro在多項(xiàng)公開測試集上表現(xiàn)突出,接近Google Gemini 3,并且具有更高的性價(jià)比。該版本面向深度推理與長鏈路任務(wù)執(zhí)行場景,對標(biāo)GPT 5.2與Gemini 3 Pro。
豆包2.0 Pro在IMO、CMO數(shù)學(xué)競賽和ICPC編程競賽中取得金牌成績,展示了其頂尖的數(shù)學(xué)和推理能力。此外,豆包2.0加強(qiáng)了對長尾領(lǐng)域知識的覆蓋,在SuperGPQA等多項(xiàng)公開測試集中表現(xiàn)出色,科學(xué)領(lǐng)域知識測試成績與Gemini 3 Pro和GPT 5.2相當(dāng)。在教育、娛樂、辦公等場景中,豆包2.0提升了對圖表、復(fù)雜文檔、視頻等內(nèi)容的理解能力,并在視覺推理、空間感知、長上下文理解等權(quán)威測試中取得最佳表現(xiàn)。
豆包2.0還增強(qiáng)了對時(shí)間序列與運(yùn)動感知的理解能力,例如在健身場景中,可以實(shí)時(shí)分析用戶動作并進(jìn)行語音糾正。這一能力已擴(kuò)展到穿搭建議、老人看護(hù)等領(lǐng)域。豆包2.0 Pro在指令遵循、工具調(diào)用和搜索智能體等評測中達(dá)到頂尖水平,在HLE-Text評測中獲得最高分。
目前,豆包2.0 Pro已在豆包App、電腦客戶端和網(wǎng)頁版上線,用戶選擇專家模式即可體驗(yàn)?;鹕揭嬉蔡峁┝硕拱?.0系列模型API服務(wù)。價(jià)格方面,豆包2.0 Pro按輸入長度區(qū)間定價(jià),相比Gemini 3 Pro和GPT 5.2有較大的成本優(yōu)勢。豆包2.0 Lite則更具性價(jià)比,綜合性能超越上一代主力模型豆包1.8。
此次豆包2.0的核心升級在于提升真實(shí)世界復(fù)雜任務(wù)的執(zhí)行力。通過突破多模態(tài)理解層,豆包2.0能夠更好地理解物理世界的動態(tài)與邏輯,從而從“答題者”進(jìn)化為“執(zhí)行者”。豆包2.0進(jìn)一步降低了推理成本,使得大規(guī)模推理與長鏈路生成的成本優(yōu)勢更為明顯。在多模態(tài)理解能力方面,豆包2.0 Pro在視覺推理、空間感知、運(yùn)動理解、長視頻理解等維度取得了最高分。這些能力使豆包2.0能夠在現(xiàn)實(shí)世界中可靠地執(zhí)行任務(wù)。
11月19日,谷歌發(fā)布了其最新、最先進(jìn)的基礎(chǔ)模型Gemini 3,用戶現(xiàn)在可以通過Gemini應(yīng)用和AI搜索界面立即使用
2025-11-19 08:11:05谷歌發(fā)布Gemini3