從Gemini到豆包：全球兩大AI巨頭為何走上同一條路？邁向通用人工智能共識

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2026-02-15 08:29:20 鳳凰網(wǎng)

2月14日，字節(jié)跳動正式推出豆包大模型2.0（Doubao-Seed-2.0）。自2023年初始測試版上線以來，豆包大模型經(jīng)歷了近一年半的持續(xù)更新，在文本基礎(chǔ)、多模態(tài)強(qiáng)化、深度思考和智能體執(zhí)行等方面不斷升級。此次發(fā)布的2.0版本具備全棧模型矩陣、多模態(tài)理解、企業(yè)級智能體和成本優(yōu)勢，已躋身全球第一梯隊(duì)。

豆包2.0系列包括Pro、Lite、Mini三款不同尺寸的通用智能體模型，提供全面升級的多模態(tài)理解和強(qiáng)化的長鏈路任務(wù)執(zhí)行能力。豆包2.0 Pro在多項(xiàng)公開測試集上表現(xiàn)突出，接近Google Gemini 3，并且具有更高的性價(jià)比。該版本面向深度推理與長鏈路任務(wù)執(zhí)行場景，對標(biāo)GPT 5.2與Gemini 3 Pro。

豆包2.0 Pro在IMO、CMO數(shù)學(xué)競賽和ICPC編程競賽中取得金牌成績，展示了其頂尖的數(shù)學(xué)和推理能力。此外，豆包2.0加強(qiáng)了對長尾領(lǐng)域知識的覆蓋，在SuperGPQA等多項(xiàng)公開測試集中表現(xiàn)出色，科學(xué)領(lǐng)域知識測試成績與Gemini 3 Pro和GPT 5.2相當(dāng)。在教育、娛樂、辦公等場景中，豆包2.0提升了對圖表、復(fù)雜文檔、視頻等內(nèi)容的理解能力，并在視覺推理、空間感知、長上下文理解等權(quán)威測試中取得最佳表現(xiàn)。

豆包2.0還增強(qiáng)了對時(shí)間序列與運(yùn)動感知的理解能力，例如在健身場景中，可以實(shí)時(shí)分析用戶動作并進(jìn)行語音糾正。這一能力已擴(kuò)展到穿搭建議、老人看護(hù)等領(lǐng)域。豆包2.0 Pro在指令遵循、工具調(diào)用和搜索智能體等評測中達(dá)到頂尖水平，在HLE-Text評測中獲得最高分。

目前，豆包2.0 Pro已在豆包App、電腦客戶端和網(wǎng)頁版上線，用戶選擇專家模式即可體驗(yàn)?；鹕揭嬉蔡峁┝硕拱?.0系列模型API服務(wù)。價(jià)格方面，豆包2.0 Pro按輸入長度區(qū)間定價(jià)，相比Gemini 3 Pro和GPT 5.2有較大的成本優(yōu)勢。豆包2.0 Lite則更具性價(jià)比，綜合性能超越上一代主力模型豆包1.8。

此次豆包2.0的核心升級在于提升真實(shí)世界復(fù)雜任務(wù)的執(zhí)行力。通過突破多模態(tài)理解層，豆包2.0能夠更好地理解物理世界的動態(tài)與邏輯，從而從“答題者”進(jìn)化為“執(zhí)行者”。豆包2.0進(jìn)一步降低了推理成本，使得大規(guī)模推理與長鏈路生成的成本優(yōu)勢更為明顯。在多模態(tài)理解能力方面，豆包2.0 Pro在視覺推理、空間感知、運(yùn)動理解、長視頻理解等維度取得了最高分。這些能力使豆包2.0能夠在現(xiàn)實(shí)世界中可靠地執(zhí)行任務(wù)。

(責(zé)任編輯：zx0176)

關(guān)閉

從Gemini到豆包：全球兩大AI巨頭為何走上同一條路？邁向通用人工智能共識

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)