AI視頻不僅重塑人類的感官體驗,也將重新定義內(nèi)容制作流程和影響消費市場;而智能體編程則將重塑軟件產(chǎn)業(yè)的生產(chǎn)方式——從“AI輔助寫代碼”進化到“AI獨立完成系統(tǒng)工程”。在這兩條賽道上,中國AI都已經(jīng)實現(xiàn)了新的突破。
視覺航道上,Seedance 2.0給出的答卷已經(jīng)不需要太多論證——全網(wǎng)的刷屏就是最好的背書。這款被字節(jié)跳動定位為“可導(dǎo)演的電影級全流程生成引擎”的模型,采用雙分支擴散變換器架構(gòu),可以同步生成視頻與音頻。只需要輸入提示詞或上傳一張參考圖,它就能產(chǎn)出帶完整原生音軌的多鏡頭視頻。
在海外社交平臺,AI影視創(chuàng)作領(lǐng)域最活躍的創(chuàng)作者之一el.cine坦言:“學(xué)了7年數(shù)字電影制作,現(xiàn)在感覺90%都白學(xué)了。”他用Seedance 2.0制作的第一條短片就引爆了關(guān)注——畫面中一名男子在人群中狂奔、撞翻水果攤、被警察追逐,運鏡、光影、表情、鏡頭語言近乎無可挑剔。網(wǎng)友的反應(yīng)很直接:“我甚至不確定這是真的還是假的?!?/p>
而在國內(nèi),游戲科學(xué)CEO馮驥給出了“當(dāng)前地表最強的視頻生成模型”的評價。他在微博上寫道:“AI理解多模態(tài)信息并整合的能力完成了一次飛躍,令人驚嘆?!?/p>
GLM-5要回答的是另一個更硬核的問題:中國AI能不能造系統(tǒng)?真實的軟件工程需要持續(xù)數(shù)天的架構(gòu)設(shè)計,需要在幾萬行代碼之間維護邏輯一致性,需要在編譯報錯時自己去讀日志、定位問題、改了再試,反復(fù)迭代直到系統(tǒng)跑通。簡單說,它需要的不是一個能接話的“副駕駛”,而是一個能獨立扛活的工程師。
實際上,硅谷已經(jīng)在押注這個方向。Anthropic的Claude Opus 4.6和OpenAI的GPT-5.3 Codex都在最新版本中重點強調(diào)同一個詞——“Agentic”,也就是讓AI以智能體的方式長時間自主運行,處理過去需要資深工程師花好幾天才能搞定的系統(tǒng)級任務(wù)。