?谷歌I/O開(kāi)發(fā)者大會(huì):正式發(fā)布視頻生成模型Veo3,AI音畫(huà)同步突破

?谷歌I/O開(kāi)發(fā)者大會(huì):正式發(fā)布視頻生成模型Veo3,AI音畫(huà)同步突破

在2025年谷歌I/O開(kāi)發(fā)者大會(huì)上,新一代視頻生成模型Veo3正式亮相,首次實(shí)現(xiàn)背景音效與畫(huà)面的AI同步生成。該模型不僅能根據(jù)文本提示合成動(dòng)態(tài)場(chǎng)景,還能為鳥(niǎo)鳴、交通等環(huán)境音效匹配畫(huà)面,甚至生成人物對(duì)話時(shí)的精準(zhǔn)口型動(dòng)作。相較于前代產(chǎn)品,Veo3在物理模擬和口型同步技術(shù)上取得顯著突破,其生成的1080P高清視頻時(shí)長(zhǎng)可達(dá)60秒以上,并能理解“航拍”“延時(shí)攝影”等專業(yè)影視術(shù)語(yǔ)。

目前,Veo3已面向美國(guó)地區(qū)的Gemini Ultra訂閱用戶及Vertex AI企業(yè)客戶開(kāi)放,并集成至谷歌影視制作平臺(tái)Flow中。借助Flow工具,創(chuàng)作者可上傳人物、場(chǎng)景圖片作為參考,通過(guò)鏡頭控制功能實(shí)現(xiàn)畫(huà)面旋轉(zhuǎn)、縮放及橫豎屏切換,甚至動(dòng)態(tài)增減視頻元素。與此同時(shí),前代Veo2的基礎(chǔ)功能仍向所有用戶開(kāi)放,保留了圖像參考和鏡頭調(diào)整等創(chuàng)作自由。

針對(duì)日益嚴(yán)峻的AI內(nèi)容識(shí)別難題,谷歌同步推出了SynthID Detector檢測(cè)工具。用戶上傳文件即可識(shí)別是否包含加密水印,該技術(shù)已應(yīng)用于部分生成模型,但尚未實(shí)現(xiàn)全平臺(tái)覆蓋。隨著Veo3的推出,谷歌在AI視頻生成領(lǐng)域的技術(shù)優(yōu)勢(shì)進(jìn)一步擴(kuò)大,其與Runway、OpenAI等企業(yè)的競(jìng)爭(zhēng)也步入新階段。

原創(chuàng)文章,作者:Google,如若轉(zhuǎn)載,請(qǐng)注明出處:http://www.2079x.cn/article/719958.html

Google的頭像Google認(rèn)證作者

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評(píng)論