測試顯示,Sora 2輸出的結(jié)果已經(jīng)基本能滿足C端用戶的娛樂需求,鏡頭語言豐富,對話有想象力,音頻輸出時口型與發(fā)音一致。但目前一個10秒的視頻需等待數(shù)分鐘才能生成,速度不快且分辨率不高。例如,輸入提示詞讓奧爾特曼敲代碼時被一只銀漸層貓關(guān)掉電腦電源并開始吵架,Sora精準(zhǔn)特寫了貓爪關(guān)電源的畫面,伴隨準(zhǔn)確的關(guān)機(jī)音效,展現(xiàn)了奧爾特曼生氣的表情和姿態(tài),細(xì)節(jié)和環(huán)境都很真實(shí)。然而,錄入人臉輸出的視頻并不完全像本人,中文支持也存在問題,如外賣服上出現(xiàn)憑空生造的文字。
尾鰭Vicky認(rèn)為,Sora的優(yōu)點(diǎn)在于用戶數(shù)字人的物理效果和唇型驅(qū)動效果很好,且在APP的使用交互上下了一些功夫。但缺點(diǎn)同樣明顯,多元素物體交互時會出現(xiàn)手腳和臉糊等丟失細(xì)節(jié),動作不符合物理邏輯等問題。
OpenAI將2024年2月的初代Sora比作“視頻的GPT-1時刻”,而Sora 2則被定義為“可能直接跳到了GPT-3.5的時刻”。盡管如此,AI視頻的“GPT-3.5時刻”是否真正到來仍有爭議。至少對于創(chuàng)作者來說,Sora 2仍無法徹底解決一致性和物理問題。對普通用戶來說,AI視頻的門檻已大幅降低,變得更加簡單有趣。
相較于模型技術(shù),Sora 2更值得關(guān)注的是產(chǎn)品玩法。OpenAI將其打造成類似于短視頻的消費(fèi)者App,要求用戶上傳自己的臉部數(shù)據(jù)和聲音信息做AI二創(chuàng)。這樣既容易獲取寶貴的面部數(shù)據(jù),又能吸引親朋好友鏈?zhǔn)絺鞑ァ8唢w認(rèn)為,OpenAI在打造互聯(lián)網(wǎng)產(chǎn)品方面領(lǐng)先于其他公司。
海外市場對Sora 2和Sora應(yīng)用的評價褒貶不一。有用戶認(rèn)為技術(shù)驚艷、創(chuàng)造力會大爆發(fā),也有人認(rèn)為這些視頻毫無意義,與宏大的AGI愿景相悖。奧爾特曼回應(yīng)稱,向人們展示新技術(shù)讓他們開心并借此賺取一些錢是一件好事。他認(rèn)為重要的是讓人類從這些模型的開發(fā)中受益。未來,隨著視頻模型持續(xù)進(jìn)化,通用世界模擬器與機(jī)器人Agent將重塑社會,Sora 2朝這一目標(biāo)邁出了重要的一步。
2025年4月14日至18日,中共中央總書記、國家主席習(xí)近平對越南、馬來西亞、柬埔寨等東南亞國家進(jìn)行國事訪問,此次訪問是習(xí)近平主席今年首次出訪
2025-04-21 09:21:25AI創(chuàng)意短視頻|中國經(jīng)濟(jì)的廣闊“舞臺”