這個(gè)國(guó)慶期間,OpenAI CEO奧爾特曼成了各類AI生成視頻中的主角。他出現(xiàn)在東北大炕上吃飯、在阿里和字節(jié)的會(huì)議室里說(shuō)著“互聯(lián)網(wǎng)黑話”,甚至成為街頭外賣騎手。這一切源于10月1日OpenAI推出的新一代視頻生成模型Sora 2及其配套的AI視頻社交App Sora。用戶通過(guò)邀請(qǐng)碼可以免費(fèi)下載使用,一次生成10秒的AI視頻。
相比去年發(fā)布的初代Sora,Sora 2在物理邏輯、畫面一致性和真實(shí)感方面都有顯著提升。只需一張照片加一句提示詞,AI就能創(chuàng)作出有劇情和文案的短片。盡管如此,Sora 2尚未完全跨越“真實(shí)”這道門檻。
至頂科技總編輯高飛認(rèn)為,Sora 2在很多場(chǎng)景都達(dá)到了以假亂真的程度,但技術(shù)并沒(méi)有代差領(lǐng)先。更值得關(guān)注的是其產(chǎn)品玩法,在打造互聯(lián)網(wǎng)產(chǎn)品方面,OpenAI暫時(shí)領(lǐng)先于其他公司。OpenAI在官方博客中表示,Sora 2是“邁向GPT-3.5時(shí)刻的一步”。不過(guò),AIGC創(chuàng)作領(lǐng)域的KOL尾鰭Vicky認(rèn)為,對(duì)于創(chuàng)作者來(lái)說(shuō),這一時(shí)刻還未到來(lái),因?yàn)楫a(chǎn)品仍無(wú)法徹底解決一致性和物理問(wèn)題。但對(duì)于大多數(shù)普通受眾而言,玩AI視頻變得非常接近且有趣。
過(guò)去兩天,OpenAI成功進(jìn)行了產(chǎn)品發(fā)布營(yíng)銷,Sora App在美國(guó)iOS免費(fèi)應(yīng)用排行榜上已升至第三位。由于Sora采用邀請(qǐng)制免費(fèi)使用,國(guó)內(nèi)閑魚上出現(xiàn)了29.9元買邀請(qǐng)碼的情況,但單價(jià)6.88元的邀請(qǐng)碼更受歡迎。用戶需要邀請(qǐng)碼注冊(cè)后才能使用,并可裂變出4個(gè)新的邀請(qǐng)碼分享給朋友。這種機(jī)制逐漸形成好友網(wǎng)絡(luò),使Sora從一開始就具備了強(qiáng)社交基因。
有人將Sora稱為“AI版抖音”,應(yīng)用主頁(yè)是垂直視頻流,用戶可以上下滑動(dòng)瀏覽不同用戶發(fā)布的視頻。所有內(nèi)容都是AI生成的。用戶可以選擇上傳圖片并結(jié)合文字提示,也可以用“Cameo”功能基于自己或朋友形象進(jìn)行提示詞生成。Sora 2比之前的系統(tǒng)在物理上更加精準(zhǔn)、逼真,并且在可控性方面有了巨大飛躍,還配備了同步音頻。
測(cè)試顯示,Sora 2輸出的結(jié)果已經(jīng)基本能滿足C端用戶的娛樂(lè)需求,鏡頭語(yǔ)言豐富,對(duì)話有想象力,音頻輸出時(shí)口型與發(fā)音一致。但目前一個(gè)10秒的視頻需等待數(shù)分鐘才能生成,速度不快且分辨率不高。例如,輸入提示詞讓奧爾特曼敲代碼時(shí)被一只銀漸層貓關(guān)掉電腦電源并開始吵架,Sora精準(zhǔn)特寫了貓爪關(guān)電源的畫面,伴隨準(zhǔn)確的關(guān)機(jī)音效,展現(xiàn)了奧爾特曼生氣的表情和姿態(tài),細(xì)節(jié)和環(huán)境都很真實(shí)。然而,錄入人臉輸出的視頻并不完全像本人,中文支持也存在問(wèn)題,如外賣服上出現(xiàn)憑空生造的文字。
尾鰭Vicky認(rèn)為,Sora的優(yōu)點(diǎn)在于用戶數(shù)字人的物理效果和唇型驅(qū)動(dòng)效果很好,且在APP的使用交互上下了一些功夫。但缺點(diǎn)同樣明顯,多元素物體交互時(shí)會(huì)出現(xiàn)手腳和臉糊等丟失細(xì)節(jié),動(dòng)作不符合物理邏輯等問(wèn)題。
OpenAI將2024年2月的初代Sora比作“視頻的GPT-1時(shí)刻”,而Sora 2則被定義為“可能直接跳到了GPT-3.5的時(shí)刻”。盡管如此,AI視頻的“GPT-3.5時(shí)刻”是否真正到來(lái)仍有爭(zhēng)議。至少對(duì)于創(chuàng)作者來(lái)說(shuō),Sora 2仍無(wú)法徹底解決一致性和物理問(wèn)題。對(duì)普通用戶來(lái)說(shuō),AI視頻的門檻已大幅降低,變得更加簡(jiǎn)單有趣。
相較于模型技術(shù),Sora 2更值得關(guān)注的是產(chǎn)品玩法。OpenAI將其打造成類似于短視頻的消費(fèi)者App,要求用戶上傳自己的臉部數(shù)據(jù)和聲音信息做AI二創(chuàng)。這樣既容易獲取寶貴的面部數(shù)據(jù),又能吸引親朋好友鏈?zhǔn)絺鞑?。高飛認(rèn)為,OpenAI在打造互聯(lián)網(wǎng)產(chǎn)品方面領(lǐng)先于其他公司。
海外市場(chǎng)對(duì)Sora 2和Sora應(yīng)用的評(píng)價(jià)褒貶不一。有用戶認(rèn)為技術(shù)驚艷、創(chuàng)造力會(huì)大爆發(fā),也有人認(rèn)為這些視頻毫無(wú)意義,與宏大的AGI愿景相悖。奧爾特曼回應(yīng)稱,向人們展示新技術(shù)讓他們開心并借此賺取一些錢是一件好事。他認(rèn)為重要的是讓人類從這些模型的開發(fā)中受益。未來(lái),隨著視頻模型持續(xù)進(jìn)化,通用世界模擬器與機(jī)器人Agent將重塑社會(huì),Sora 2朝這一目標(biāo)邁出了重要的一步。