火山引擎在FORCE原動(dòng)力大會(huì)上正式發(fā)布了豆包大模型1.8及音視頻創(chuàng)作模型Seedance 1.5 pro。評(píng)測(cè)數(shù)據(jù)顯示,豆包大模型在多模態(tài)理解、生成能力及Agent能力上已躋身全球第一梯隊(duì)。
火山引擎總裁譚待表示,截至今年12月,豆包大模型日均token使用量突破50萬(wàn)億,較去年同期增長(zhǎng)超過(guò)10倍。目前已有超過(guò)100家企業(yè)客戶(hù)累計(jì)token使用量超過(guò)1萬(wàn)億。
Seedance 1.5 pro音視頻創(chuàng)作模型實(shí)現(xiàn)了毫秒級(jí)的音畫(huà)同步輸出,支持多人多語(yǔ)言對(duì)話(huà),口型對(duì)齊精準(zhǔn),生成的視頻展現(xiàn)出影視級(jí)敘事張力。譚待在接受媒體采訪(fǎng)時(shí)進(jìn)一步分享了Seedance 1.5 pro的優(yōu)勢(shì),強(qiáng)調(diào)音畫(huà)同步不僅包括聲音和畫(huà)面同步,還需要與語(yǔ)義同步。他透露,Seedance系列很快將上線(xiàn)“Draft樣片”功能,讓預(yù)覽視頻更快且成本更低。
豆包大模型1.8面向多模態(tài)Agent場(chǎng)景進(jìn)行了定向優(yōu)化,工具調(diào)用能力、復(fù)雜指令遵循能力及OS Agent能力均得到增強(qiáng)。在視覺(jué)理解方面,豆包1.8的單次視頻理解幀數(shù)從640幀增加到1280幀,支持低幀率理解超長(zhǎng)視頻,并能調(diào)用工具對(duì)關(guān)鍵片段進(jìn)行高幀率理解。該模型支持256K上下文,擁有更靈活的上下文管理,擅長(zhǎng)處理復(fù)雜多步任務(wù)。
在多項(xiàng)公開(kāi)評(píng)測(cè)中,豆包1.8在視覺(jué)推理、通用視覺(jué)問(wèn)答、空間理解及視頻理解等任務(wù)中均獲得最佳或接近最佳成績(jī),在通用智能體測(cè)評(píng)集BrowserComp上表現(xiàn)全球領(lǐng)先。在數(shù)學(xué)與推理等基礎(chǔ)能力維度上,整體水平已接近全球頂尖的通用模型。豆包1.8還在教育輔導(dǎo)、客服問(wèn)答、信息處理、意圖識(shí)別、信息抽取以及多步驟復(fù)雜工作流等應(yīng)用場(chǎng)景中驗(yàn)證了其適用性。
此外,豆包1.8在GUI Agent能力、搜索任務(wù)、Agentic Coding相關(guān)基準(zhǔn)測(cè)試以及金融商業(yè)相關(guān)任務(wù)中表現(xiàn)出色。在多模態(tài)推理任務(wù)中,豆包1.8超越了前代模型Seed1.5-VL,在大部分任務(wù)中接近目前最先進(jìn)的Gemini-3-Pro。在被認(rèn)為難度極高的視覺(jué)推理測(cè)試ZeroBench中,豆包1.8獲得最高得分。在通用視覺(jué)問(wèn)答任務(wù)中,該模型也大幅領(lǐng)先其他模型。
針對(duì)日益增長(zhǎng)的視頻創(chuàng)作需求,火山引擎推出了Seedance 1.5 pro音視頻創(chuàng)作模型。該模型采用創(chuàng)新的原生音視頻聯(lián)合生成架構(gòu),支持環(huán)境音、背景音樂(lè)、人聲等多種元素,實(shí)現(xiàn)了毫秒級(jí)的音畫(huà)同步輸出。在對(duì)白處理上,模型支持多人多語(yǔ)言對(duì)話(huà),口型對(duì)齊精準(zhǔn),覆蓋中文方言、英文及小語(yǔ)種,提升了視頻內(nèi)容的真實(shí)感與全球化創(chuàng)作潛力。即將上線(xiàn)的“Draft樣片”功能可幫助創(chuàng)作者提升65%的整體效率,并減少60%的無(wú)效創(chuàng)作成本。
個(gè)人用戶(hù)已可在豆包、即夢(mèng)AI等平臺(tái)體驗(yàn)該模型,企業(yè)用戶(hù)則可從12月23日起通過(guò)火山引擎API接入Seedance 1.5 pro模型服務(wù)。
火山引擎全面升級(jí)了企業(yè)級(jí)AI Agent平臺(tái)——AgentKit,覆蓋了Agent從開(kāi)發(fā)、部署到管控的全生命周期。同時(shí),火山引擎推出了HiAgent智能體工作站,通過(guò)構(gòu)建統(tǒng)一的企業(yè)AI任務(wù)調(diào)度中心,提供一系列開(kāi)箱即用的通用智能體,幫助企業(yè)實(shí)現(xiàn)Agent的規(guī)模化管理與應(yīng)用。為降低企業(yè)使用門(mén)檻,火山引擎還推出了業(yè)內(nèi)首個(gè)“AI節(jié)省計(jì)劃”,通過(guò)階梯式折扣,幫助企業(yè)最高節(jié)省47%的成本。
火山引擎的AI云原生基礎(chǔ)設(shè)施持續(xù)進(jìn)化,推動(dòng)AI應(yīng)用從單一的模型調(diào)用向復(fù)雜的Agent智能體生態(tài)演進(jìn),加速AI能力在各行各業(yè)的深度落地。
小米正式開(kāi)源了全球首個(gè)具備少樣本泛化能力的音頻大模型MiMo-Audio-7B-Base
2025-12-17 11:00:45小米MiMo稱(chēng)與豆包各有千秋特斯拉與火山引擎近日達(dá)成合作,火山引擎將為特斯拉提供大模型服務(wù),以提升特斯拉智能座艙的交互體驗(yàn)
2025-08-22 21:08:22特斯拉接入豆包DeepSeek