字節(jié)豆包大模型重磅升級躋身全球第一梯隊

小大

用微信掃描二維碼
分享至好友和朋友圈

關鍵詞：

2025-12-18 17:13:17 智東西

火山引擎在FORCE原動力大會上正式發(fā)布了豆包大模型1.8及音視頻創(chuàng)作模型Seedance 1.5 pro。評測數據顯示，豆包大模型在多模態(tài)理解、生成能力及Agent能力上已躋身全球第一梯隊。

火山引擎總裁譚待表示，截至今年12月，豆包大模型日均token使用量突破50萬億，較去年同期增長超過10倍。目前已有超過100家企業(yè)客戶累計token使用量超過1萬億。

Seedance 1.5 pro音視頻創(chuàng)作模型實現(xiàn)了毫秒級的音畫同步輸出，支持多人多語言對話，口型對齊精準，生成的視頻展現(xiàn)出影視級敘事張力。譚待在接受媒體采訪時進一步分享了Seedance 1.5 pro的優(yōu)勢，強調音畫同步不僅包括聲音和畫面同步，還需要與語義同步。他透露，Seedance系列很快將上線“Draft樣片”功能，讓預覽視頻更快且成本更低。

豆包大模型1.8面向多模態(tài)Agent場景進行了定向優(yōu)化，工具調用能力、復雜指令遵循能力及OS Agent能力均得到增強。在視覺理解方面，豆包1.8的單次視頻理解幀數從640幀增加到1280幀，支持低幀率理解超長視頻，并能調用工具對關鍵片段進行高幀率理解。該模型支持256K上下文，擁有更靈活的上下文管理，擅長處理復雜多步任務。

在多項公開評測中，豆包1.8在視覺推理、通用視覺問答、空間理解及視頻理解等任務中均獲得最佳或接近最佳成績，在通用智能體測評集BrowserComp上表現(xiàn)全球領先。在數學與推理等基礎能力維度上，整體水平已接近全球頂尖的通用模型。豆包1.8還在教育輔導、客服問答、信息處理、意圖識別、信息抽取以及多步驟復雜工作流等應用場景中驗證了其適用性。

此外，豆包1.8在GUI Agent能力、搜索任務、Agentic Coding相關基準測試以及金融商業(yè)相關任務中表現(xiàn)出色。在多模態(tài)推理任務中，豆包1.8超越了前代模型Seed1.5-VL，在大部分任務中接近目前最先進的Gemini-3-Pro。在被認為難度極高的視覺推理測試ZeroBench中，豆包1.8獲得最高得分。在通用視覺問答任務中，該模型也大幅領先其他模型。

12 全文共 2 頁下一頁

關閉

字節(jié)豆包大模型重磅升級 躋身全球第一梯隊

相關新聞

今日熱點

頻道熱點

字節(jié)豆包大模型重磅升級躋身全球第一梯隊