新模型Vidu直逼Sora，生數(shù)科技：還說(shuō)“中國(guó)sora”就太沒想象力了國(guó)產(chǎn)AI視頻新飛躍

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2024-04-28 18:58:48 手機(jī)鳳凰網(wǎng)

4月27日，中關(guān)村論壇未來(lái)人工智能先鋒論壇舉行期間，生數(shù)科技攜手清華大學(xué)宣布了一個(gè)重要成果：中國(guó)首個(gè)長(zhǎng)時(shí)長(zhǎng)、高一致性、高動(dòng)態(tài)性視頻大模型Vidu正式面世。該模型依托團(tuán)隊(duì)獨(dú)創(chuàng)的U-ViT架構(gòu)，結(jié)合Diffusion與Transformer技術(shù)，能夠輕松生成16秒長(zhǎng)度、1080P高清的視頻內(nèi)容，操作簡(jiǎn)便。

Vidu模型不僅在模擬現(xiàn)實(shí)世界的精準(zhǔn)度上有所建樹，還展現(xiàn)了強(qiáng)大的創(chuàng)意生成能力，比如創(chuàng)造虛擬場(chǎng)景和處理多鏡頭切換，同時(shí)確保視頻的時(shí)空連貫性，達(dá)到國(guó)際先進(jìn)水平，并持續(xù)優(yōu)化升級(jí)。它與國(guó)際知名的Sora模型相比，在視頻生成時(shí)長(zhǎng)及質(zhì)量上均有顯著提升，特別是在細(xì)節(jié)還原、虛構(gòu)場(chǎng)景構(gòu)造、動(dòng)態(tài)鏡頭運(yùn)用及對(duì)中國(guó)文化元素的融入上，表現(xiàn)出色。Vidu通過(guò)“一鏡到底”的技術(shù)手段，實(shí)現(xiàn)視頻內(nèi)容的無(wú)縫生成，凸顯了其算法的高效與連貫性。

技術(shù)背后，是團(tuán)隊(duì)在貝葉斯機(jī)器學(xué)習(xí)和多模態(tài)大模型領(lǐng)域的深厚積累。他們提出的U-ViT架構(gòu)，作為全球首個(gè)將Diffusion與Transformer融合的創(chuàng)新設(shè)計(jì)，早于同類技術(shù)，展示了團(tuán)隊(duì)的前瞻性和自主研發(fā)實(shí)力。今年3月，團(tuán)隊(duì)進(jìn)一步開源了基于U-ViT的多模態(tài)擴(kuò)散大模型UniDiffuser，完成了融合架構(gòu)大規(guī)模應(yīng)用的可行性驗(yàn)證，模型參數(shù)接近10億，實(shí)現(xiàn)了圖文模態(tài)間的自由轉(zhuǎn)換。

基于U-ViT的深入探索和實(shí)踐，生數(shù)科技僅用兩個(gè)月便在長(zhǎng)視頻處理技術(shù)上取得突破，推出了Vidu。這一模型不僅提升了視頻生成的連貫性和動(dòng)態(tài)范圍，還預(yù)示著向更廣泛模態(tài)應(yīng)用的邁進(jìn)，展現(xiàn)出通用視覺模型的潛力。

Vidu的發(fā)布，不僅是對(duì)U-ViT架構(gòu)應(yīng)用能力的有力證明，也是生數(shù)科技在多模態(tài)大模型領(lǐng)域創(chuàng)新能力的展現(xiàn)。公司強(qiáng)調(diào)，大模型的發(fā)展離不開技術(shù)和產(chǎn)業(yè)的緊密結(jié)合，為此，同步啟動(dòng)了“Vidu大模型合作伙伴計(jì)劃”，旨在匯聚產(chǎn)業(yè)鏈伙伴，共同推動(dòng)大模型技術(shù)的應(yīng)用生態(tài)建設(shè)。

(責(zé)任編輯：張蕾)

關(guān)閉

新模型Vidu直逼Sora，生數(shù)科技：還說(shuō)“中國(guó)sora”就太沒想象力了 國(guó)產(chǎn)AI視頻新飛躍

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

新模型Vidu直逼Sora，生數(shù)科技：還說(shuō)“中國(guó)sora”就太沒想象力了國(guó)產(chǎn)AI視頻新飛躍