Sora是基于過去對DALL·E和GPT的研究基礎(chǔ)構(gòu)建,利用DALL·E 3的重述提示詞技術(shù),為視覺模型訓練數(shù)據(jù)生成高描述性的標注,因此模型能更好的遵循文本指令。
一位YouTube博主Paddy Galloway發(fā)表了對Sora的感想,他表示內(nèi)容創(chuàng)作行業(yè)已經(jīng)永遠的改變了,并且毫不夸張?!拔疫M入YouTube世界已經(jīng)15年時間,但OpenAI剛剛的展示讓我無言…動畫師/3D藝術(shù)家們有麻煩了,素材網(wǎng)站將變得無關(guān)緊要,任何人都可以無壁壘獲得難以置信的產(chǎn)品,內(nèi)容背后的‘想法’和故事將變得更加重要?!?/p>
但Sora模型當前也存在弱點。OpenAI稱它可能難以準確模擬復(fù)雜場景的物理原理,并且可能無法理解因果關(guān)系。例如,一個人可能咬了一口餅干后,餅干會沒有咬痕,玻璃破碎的物理過程可能也無法被準確呈現(xiàn)。
4月27日,中關(guān)村論壇未來人工智能先鋒論壇舉行期間,生數(shù)科技攜手清華大學宣布了一個重要成果:中國首個長時長、高一致性、高動態(tài)性視頻大模型Vidu正式面世
2024-04-28 18:58:48新模型Vidu直逼Sora5月14日,OpenAI在春季發(fā)布會上揭曉了其最新的旗艦AI模型——GPT-4o,這一模型以“全知全能”為目標,實現(xiàn)了實時的語音、文本、圖像交互功能
2024-05-15 09:10:07OpenAI發(fā)布全新生成式AI模型GPT-4o在周二凌晨1點的春季發(fā)布會上,OpenAI繼“文生視頻模型”Sora后再次為市場帶來新驚喜
2024-05-14 09:07:05OpenAI新模型:圖文音頻全搞定5月14日深夜,美國OpenAI公司舉辦線上“春季更新”活動,揭曉兩大核心內(nèi)容:發(fā)布最新旗艦?zāi)P虶PT-4o及在ChatGPT服務(wù)中增添多項免費功能
2024-05-14 07:49:16OpenAI新模型:絲滑如真人