回顧中國(guó)的AI視頻生成之路 從Sora驚恐到即夢(mèng)反殺。馬年春晚,《賀花神》美輪美奐的畫面刷屏全網(wǎng)。緊隨其后,支撐這場(chǎng)視覺(jué)奇觀的Seedance 2.0模型開(kāi)放API調(diào)用,價(jià)格一秒一塊錢。
時(shí)間倒回兩年前,AI視頻生成被認(rèn)為是中國(guó)完全做不出來(lái)的賽道。2024年初,OpenAI的Sora橫空出世,一支“女生走在東京街頭”的60秒視頻,畫面逼真程度堪比實(shí)拍。而當(dāng)時(shí)的國(guó)產(chǎn)視頻模型大多只能生成5—12秒的畫面,表情僵硬、手指穿模、物理穿幫等問(wèn)題頻現(xiàn),效果一眼假。
Sora的出現(xiàn)如同一記耳光,把中國(guó)AI行業(yè)抽懵了。面對(duì)技術(shù)威懾,中國(guó)AI產(chǎn)業(yè)不能坐以待斃,開(kāi)始像小說(shuō)《三體》中人類面對(duì)智子的技術(shù)封鎖一樣,進(jìn)入各顯神通的“面壁計(jì)劃”,最終完成了從Sora驚恐到即夢(mèng)反殺的逆襲,把畫面質(zhì)量卷上天際,生成價(jià)格卷到地板。這段歷史值得在當(dāng)下AI視頻生成全面爆發(fā)的時(shí)間節(jié)點(diǎn)回顧一下。
2024年初Sora的出現(xiàn)讓中國(guó)AI行業(yè)陷入了至暗時(shí)刻。那段時(shí)間,朋友圈里滿是對(duì)中國(guó)視頻生成技術(shù)技不如人的吐槽。大家的恨鐵不成鋼既來(lái)自肉眼可見(jiàn)的技術(shù)鴻溝,也有腦補(bǔ)的災(zāi)難想象。視頻生成比文本生成復(fù)雜得多,需要同時(shí)解決空間維度的物體形態(tài)一致性、時(shí)間維度的運(yùn)動(dòng)連貫性、物理規(guī)律的準(zhǔn)確模擬,還有音畫同步等一系列難題。與Sora一對(duì)比,國(guó)產(chǎn)模型輸?shù)煤翢o(wú)還手之力。
比落后更可怕的是這一技術(shù)壁壘看似無(wú)法逾越。彼時(shí)全球主流的視頻生成模型是MidJourney、Runway、DALL·E這些海外產(chǎn)品。國(guó)內(nèi)既沒(méi)有Sora的DiT架構(gòu)那樣的核心技術(shù)壁壘,也沒(méi)有充足的英偉達(dá)頂級(jí)顯卡。行業(yè)悲觀地推演:中國(guó)與海外的技術(shù)代差根本無(wú)法追趕,中國(guó)做不出自己的視頻大模型。
近期,接網(wǎng)民舉報(bào),各類珠峰安裝電梯等AI生成式的虛假信息在網(wǎng)上頻繁出現(xiàn)。
2025-11-27 10:55:00珠峰裝電梯