谷歌Gemini 2.5全家桶上線:Flash穩(wěn)定、Flash-Lite刷新性價比紀(jì)錄

谷歌Gemini 2.5全家桶上線:Flash穩(wěn)定、Flash-Lite刷新性價比紀(jì)錄

谷歌公司今日(6月18日)宣布Gemini 2.5系列AI模型重大進展:Gemini 2.5 ProGemini 2.5 Flash結(jié)束預(yù)覽階段,正式進入穩(wěn)定運行狀態(tài),標(biāo)志著兩款模型已通過企業(yè)級壓力測試,可支持生產(chǎn)環(huán)境部署。與此同時,全新輕量級模型?Gemini 2.5 Flash-Lite?首次亮相預(yù)覽版,成為谷歌當(dāng)前推理速度最快、成本效益最高的AI引擎。

此次升級的核心在于重構(gòu)”成本-速度-性能”三角平衡。穩(wěn)定版Gemini 2.5 Flash與Pro已獲Spline、Rooms等創(chuàng)新企業(yè),以及Snap、SmartBear等科技公司投入實際應(yīng)用開發(fā)。而新推出的Flash-Lite在多項基準(zhǔn)測試中表現(xiàn)亮眼:其代碼編寫、科學(xué)計算及多模態(tài)分析能力全面超越前代2.0 Flash-Lite,翻譯與分類任務(wù)的延遲顯著降低,尤其適配需要瞬時響應(yīng)的場景。

更值得關(guān)注的是成本控制——Flash-Lite在未啟用”動態(tài)思考”模式時,輸入token成本低至?每百萬0.1美元?(約人民幣0.72元),輸出成本為每百萬0.4美元,相較同類模型具備顯著價格優(yōu)勢。該模型繼承了2.5系列的核心能力,包括百萬級token上下文處理、外部工具鏈對接(如谷歌搜索與代碼執(zhí)行器),并提供推理預(yù)算靈活調(diào)控接口。

開發(fā)者可通過Google AI Studio與Vertex AI平臺獲取2.5 Flash/Pro穩(wěn)定版及Flash-Lite預(yù)覽版。消費端Gemini應(yīng)用已集成2.5 Flash和Pro模型,而谷歌搜索引擎則部署了定制優(yōu)化的Flash-Lite與Flash版本,以提升實時檢索效率。此次全線升級,標(biāo)志著谷歌在高效能AI商業(yè)化賽道邁出關(guān)鍵一步。

原創(chuàng)文章,作者:AI,如若轉(zhuǎn)載,請注明出處:http://www.2079x.cn/article/724400.html

AI的頭像AI認證作者

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評論