字節(jié)跳動Seedance2.0爆火改變視頻行業(yè)的AI(2)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2026-02-10 11:42:52 百家號

Tim發(fā)布的Seedance 2.0實測視頻迅速引發(fā)全網(wǎng)熱議。視頻中，Tim對Seedance 2.0的技術(shù)表現(xiàn)給予高度認(rèn)可，稱贊其在視頻精細(xì)度、攝像機(jī)運(yùn)動流暢度、分鏡連續(xù)性及音畫匹配度上實現(xiàn)了行業(yè)突破性進(jìn)展，直言其為“改變視頻行業(yè)的AI”。實測顯示，該模型的分鏡設(shè)計具備“明顯的角度切換”能力，能夠“像真人導(dǎo)演一樣不斷改變攝影機(jī)的位置”，獨有的多鏡頭敘事功能可根據(jù)單個提示自動生成關(guān)聯(lián)場景，并保持角色、視覺風(fēng)格的一致性，無需手動編輯。

然而，一個意外發(fā)現(xiàn)讓Tim感到震驚：僅上傳自己的人臉照片，未提供任何聲音文件或相關(guān)提示，Seedance 2.0便自動生成了與他本人高度相似的聲音，且精準(zhǔn)匹配其語氣特質(zhì)。更讓他驚訝的是，上傳僅含樓棟正面的照片后，模型生成的運(yùn)鏡竟能轉(zhuǎn)到樓棟背面，仿佛“知曉未被展示的場景細(xì)節(jié)”。Tim據(jù)此推斷，影視颶風(fēng)團(tuán)隊過往發(fā)布的大量高清視頻素材已被字節(jié)跳動納入Seedance 2.0的訓(xùn)練數(shù)據(jù)集。但測試其他博主的素材后發(fā)現(xiàn)，模型生成的視頻和聲音完全不像。

這一問題反映了當(dāng)前AI行業(yè)的一大難題——大模型訓(xùn)練數(shù)據(jù)的來源與授權(quán)問題。事實上，Seedance 2.0引發(fā)的爭議，本質(zhì)是技術(shù)發(fā)展速度與法律規(guī)則完善進(jìn)度不匹配的典型體現(xiàn)。北京航空航天大學(xué)人工智能研究院教授沙磊表示，目前國內(nèi)外AI大模型都在使用公開數(shù)據(jù)進(jìn)行訓(xùn)練。谷歌的Gemini多模態(tài)模型和Veo3視頻生成模型，就使用了超過200億個YouTube視頻片段；OpenAI的Sora模型、StabilityAI的StableDiffusion等，其訓(xùn)練也依賴于海量公開及許可視頻數(shù)據(jù)。

中國科學(xué)院軟件研究所研究員張立波則從數(shù)據(jù)特性角度進(jìn)行了解讀。他表示，基于公開數(shù)據(jù)進(jìn)行大模型訓(xùn)練與調(diào)優(yōu)的實踐，在大語言模型時期就已存在，模型訓(xùn)練使用了海量書籍、博客、論壇等文本數(shù)據(jù)。但與文字內(nèi)容相比，聲音和視頻具有更強(qiáng)的個人與場景特定性，這使得當(dāng)前階段數(shù)據(jù)使用的責(zé)任與邊界問題更加凸顯。

面對合規(guī)爭議，字節(jié)跳動在Seedance 2.0已采取了相關(guān)風(fēng)險防控措施。沙磊透露，Seedance 2.0還在小范圍內(nèi)測階段，字節(jié)也限制了一部分模型功能，例如只有在進(jìn)行活體認(rèn)證的情況下可以生成真人視頻，不支持輸入真人圖片/視頻做主體參考等，防止AI技術(shù)被濫用。他認(rèn)為，這種功能限制是企業(yè)在技術(shù)狂奔時要守住的責(zé)任底線。

AI技術(shù)的進(jìn)步不會因爭議停下腳步，如何在創(chuàng)新與數(shù)據(jù)合規(guī)、版權(quán)保護(hù)之間找到平衡，讓技術(shù)突破的紅利真正惠及行業(yè)與用戶，不僅是字節(jié)或某家公司需要持續(xù)探索的問題，更是全球AI產(chǎn)業(yè)共同的命題。字節(jié)跳動Seedance2.0爆火改變視頻行業(yè)的AI！

首頁上一頁 12共 2 頁

(責(zé)任編輯：0882)

關(guān)閉

字節(jié)跳動Seedance2.0爆火 改變視頻行業(yè)的AI(2)

相關(guān)新聞

今日熱點

頻道熱點

字節(jié)跳動Seedance2.0爆火改變視頻行業(yè)的AI(2)