?谷歌Imagen 4文生圖模型亮相Google I/O大會:速度提升10倍,支持海報級排版設計

?谷歌Imagen 4文生圖模型亮相Google I/O大會:速度提升10倍,支持海報級排版設計

谷歌在2025年I/O開發(fā)者大會上正式推出全新文生圖AI模型Imagen 4,其生成速度較前代提升10倍,并顯著優(yōu)化了圖像細節(jié)與文字渲染能力。官方演示顯示,新模型生成的圖像在毛發(fā)、金屬光澤等材質表現(xiàn)上更為逼真,AI合成痕跡大幅減少,例如一張“2025谷歌I/O大會”主題海報中,文字與背景元素的融合自然流暢,展現(xiàn)了多圖層排版的設計能力。

此次升級的核心亮點在于對文本嵌入圖像的精準控制。Imagen 4不僅能將文字作為獨立元素插入場景,還可根據(jù)語義調整字體風格與光影適配,如沙漠場景中的立體標語、霓虹燈牌上的漸變字符等復雜效果均能實現(xiàn)。這標志著AI文生圖技術從“可讀性呈現(xiàn)”邁向“設計級應用”,為廣告、影視等行業(yè)提供高效工具。

與此同時,谷歌同步發(fā)布了視頻生成模型Vevo 3,該模型首次集成環(huán)境音效合成功能,可根據(jù)畫面內容自動生成鳥鳴、車流聲乃至人物對話,打造沉浸式視聽體驗。目前Vevo 3已面向美國地區(qū)的Gemini Ultra用戶及Vertex AI企業(yè)客戶開放測試。

值得注意的是,Imagen 4的性能提升并非依賴硬件堆砌,而是通過算法架構優(yōu)化實現(xiàn)。其分布式推理引擎將單次生成耗時壓縮至秒級,配合動態(tài)分辨率調節(jié)功能,用戶可在1024×1024像素的高清輸出與實時預覽模式間靈活切換。隨著多模態(tài)生成技術進入商業(yè)化深水區(qū),谷歌正通過軟硬協(xié)同的策略鞏固其AI生態(tài)優(yōu)勢。

原創(chuàng)文章,作者:Google,如若轉載,請注明出處:http://www.2079x.cn/article/720034.html

Google的頭像Google認證作者

相關推薦

發(fā)表回復

登錄后才能評論