火山引擎在FORCE原動力大會上正式發(fā)布了豆包大模型1.8及音視頻創(chuàng)作模型Seedance 1.5 pro。評測數據顯示,豆包大模型在多模態(tài)理解、生成能力及Agent能力上已躋身全球第一梯隊。
火山引擎總裁譚待表示,截至今年12月,豆包大模型日均token使用量突破50萬億,較去年同期增長超過10倍。目前已有超過100家企業(yè)客戶累計token使用量超過1萬億。
Seedance 1.5 pro音視頻創(chuàng)作模型實現(xiàn)了毫秒級的音畫同步輸出,支持多人多語言對話,口型對齊精準,生成的視頻展現(xiàn)出影視級敘事張力。譚待在接受媒體采訪時進一步分享了Seedance 1.5 pro的優(yōu)勢,強調音畫同步不僅包括聲音和畫面同步,還需要與語義同步。他透露,Seedance系列很快將上線“Draft樣片”功能,讓預覽視頻更快且成本更低。
豆包大模型1.8面向多模態(tài)Agent場景進行了定向優(yōu)化,工具調用能力、復雜指令遵循能力及OS Agent能力均得到增強。在視覺理解方面,豆包1.8的單次視頻理解幀數從640幀增加到1280幀,支持低幀率理解超長視頻,并能調用工具對關鍵片段進行高幀率理解。該模型支持256K上下文,擁有更靈活的上下文管理,擅長處理復雜多步任務。
在多項公開評測中,豆包1.8在視覺推理、通用視覺問答、空間理解及視頻理解等任務中均獲得最佳或接近最佳成績,在通用智能體測評集BrowserComp上表現(xiàn)全球領先。在數學與推理等基礎能力維度上,整體水平已接近全球頂尖的通用模型。豆包1.8還在教育輔導、客服問答、信息處理、意圖識別、信息抽取以及多步驟復雜工作流等應用場景中驗證了其適用性。
此外,豆包1.8在GUI Agent能力、搜索任務、Agentic Coding相關基準測試以及金融商業(yè)相關任務中表現(xiàn)出色。在多模態(tài)推理任務中,豆包1.8超越了前代模型Seed1.5-VL,在大部分任務中接近目前最先進的Gemini-3-Pro。在被認為難度極高的視覺推理測試ZeroBench中,豆包1.8獲得最高得分。在通用視覺問答任務中,該模型也大幅領先其他模型。
小米正式開源了全球首個具備少樣本泛化能力的音頻大模型MiMo-Audio-7B-Base
2025-12-17 11:00:45小米MiMo稱與豆包各有千秋特斯拉與火山引擎近日達成合作,火山引擎將為特斯拉提供大模型服務,以提升特斯拉智能座艙的交互體驗
2025-08-22 21:08:22特斯拉接入豆包DeepSeek10月23日,夸克App上線了AI對話助手。AI對話助手和AI搜索均為獨立頁面,用戶可在App首頁頂部切換使用。此前有傳聞稱,阿里內部由夸克核心團隊牽頭研發(fā)“C計劃”,重點方向是AI對話助手
2025-10-24 11:12:39豆包和夸克吵起來了