在今年的I/O開(kāi)發(fā)者大會(huì)上,谷歌發(fā)布了新一代視頻生成模型Veo3,這是其首個(gè)可以生成視頻背景音效的模型。該模型不僅能合成畫(huà)面,還能為鳥(niǎo)鳴或街頭交通等場(chǎng)景配上相應(yīng)的音效,甚至能夠生成人物對(duì)話。據(jù)稱,Veo 3在物理模擬與口型同步方面表現(xiàn)出色。
目前,這一新模型僅面向美國(guó)地區(qū)的Gemini Ultra用戶以及Vertex AI的企業(yè)用戶開(kāi)放,并已被集成到谷歌的AI影視制作工具Flow中。通過(guò)Flow,用戶依然可以上傳人物、風(fēng)格、場(chǎng)景或物體的圖像作為參考,并利用鏡頭控制功能進(jìn)行旋轉(zhuǎn)、縮放,甚至調(diào)整畫(huà)面從豎屏到橫屏,或者在視頻中添加、刪除元素。
面對(duì)越來(lái)越難以辨別的人工智能生成內(nèi)容,谷歌推出了SynthID Detector工具。用戶可以通過(guò)上傳媒體文件來(lái)檢測(cè)其中是否包含由谷歌用于標(biāo)記AI作品的SynthID水印。不過(guò),值得注意的是,目前并非所有的圖像生成模型都支持這種水印技術(shù)。
AI技術(shù)正在重塑科技巨頭之間的競(jìng)爭(zhēng)格局。谷歌近期頻繁動(dòng)作,試圖重新確立其在行業(yè)中的領(lǐng)導(dǎo)地位
2025-05-30 22:24:56谷歌大變天