Tim發(fā)布的Seedance 2.0實測視頻迅速引發(fā)全網(wǎng)熱議。視頻中,Tim對Seedance 2.0的技術(shù)表現(xiàn)給予高度認(rèn)可,稱贊其在視頻精細(xì)度、攝像機(jī)運(yùn)動流暢度、分鏡連續(xù)性及音畫匹配度上實現(xiàn)了行業(yè)突破性進(jìn)展,直言其為“改變視頻行業(yè)的AI”。實測顯示,該模型的分鏡設(shè)計具備“明顯的角度切換”能力,能夠“像真人導(dǎo)演一樣不斷改變攝影機(jī)的位置”,獨有的多鏡頭敘事功能可根據(jù)單個提示自動生成關(guān)聯(lián)場景,并保持角色、視覺風(fēng)格的一致性,無需手動編輯。
然而,一個意外發(fā)現(xiàn)讓Tim感到震驚:僅上傳自己的人臉照片,未提供任何聲音文件或相關(guān)提示,Seedance 2.0便自動生成了與他本人高度相似的聲音,且精準(zhǔn)匹配其語氣特質(zhì)。更讓他驚訝的是,上傳僅含樓棟正面的照片后,模型生成的運(yùn)鏡竟能轉(zhuǎn)到樓棟背面,仿佛“知曉未被展示的場景細(xì)節(jié)”。Tim據(jù)此推斷,影視颶風(fēng)團(tuán)隊過往發(fā)布的大量高清視頻素材已被字節(jié)跳動納入Seedance 2.0的訓(xùn)練數(shù)據(jù)集。但測試其他博主的素材后發(fā)現(xiàn),模型生成的視頻和聲音完全不像。
這一問題反映了當(dāng)前AI行業(yè)的一大難題——大模型訓(xùn)練數(shù)據(jù)的來源與授權(quán)問題。事實上,Seedance 2.0引發(fā)的爭議,本質(zhì)是技術(shù)發(fā)展速度與法律規(guī)則完善進(jìn)度不匹配的典型體現(xiàn)。北京航空航天大學(xué)人工智能研究院教授沙磊表示,目前國內(nèi)外AI大模型都在使用公開數(shù)據(jù)進(jìn)行訓(xùn)練。谷歌的Gemini多模態(tài)模型和Veo3視頻生成模型,就使用了超過200億個YouTube視頻片段;OpenAI的Sora模型、StabilityAI的StableDiffusion等,其訓(xùn)練也依賴于海量公開及許可視頻數(shù)據(jù)。
中國科學(xué)院軟件研究所研究員張立波則從數(shù)據(jù)特性角度進(jìn)行了解讀。他表示,基于公開數(shù)據(jù)進(jìn)行大模型訓(xùn)練與調(diào)優(yōu)的實踐,在大語言模型時期就已存在,模型訓(xùn)練使用了海量書籍、博客、論壇等文本數(shù)據(jù)。但與文字內(nèi)容相比,聲音和視頻具有更強(qiáng)的個人與場景特定性,這使得當(dāng)前階段數(shù)據(jù)使用的責(zé)任與邊界問題更加凸顯。
面對合規(guī)爭議,字節(jié)跳動在Seedance 2.0已采取了相關(guān)風(fēng)險防控措施。沙磊透露,Seedance 2.0還在小范圍內(nèi)測階段,字節(jié)也限制了一部分模型功能,例如只有在進(jìn)行活體認(rèn)證的情況下可以生成真人視頻,不支持輸入真人圖片/視頻做主體參考等,防止AI技術(shù)被濫用。他認(rèn)為,這種功能限制是企業(yè)在技術(shù)狂奔時要守住的責(zé)任底線。
AI技術(shù)的進(jìn)步不會因爭議停下腳步,如何在創(chuàng)新與數(shù)據(jù)合規(guī)、版權(quán)保護(hù)之間找到平衡,讓技術(shù)突破的紅利真正惠及行業(yè)與用戶,不僅是字節(jié)或某家公司需要持續(xù)探索的問題,更是全球AI產(chǎn)業(yè)共同的命題。字節(jié)跳動Seedance2.0爆火 改變視頻行業(yè)的AI!
今天凌晨,字節(jié)跳動發(fā)布公告表示將按照中國法律要求推進(jìn)相關(guān)工作,確保TikTok美國公司能夠繼續(xù)為美國用戶提供服務(wù)
2025-09-20 09:12:05字節(jié)跳動深夜公告