?OpenAI推出“全能助手”o3和o4-mini:自動(dòng)調(diào)用工具解題,編程競(jìng)賽進(jìn)全球前200

?OpenAI推出“全能助手”o3和o4-mini:自動(dòng)調(diào)用工具解題,編程競(jìng)賽進(jìn)全球前200

今日,OpenAI正式發(fā)布新一代多模態(tài)推理模型o3和o4-mini,首次實(shí)現(xiàn)智能調(diào)用并組合ChatGPT全功能工具鏈,包括網(wǎng)頁(yè)搜索、Python數(shù)據(jù)分析、圖像深度推理及文生圖等能力。兩款模型可自主判斷工具使用場(chǎng)景,通過結(jié)構(gòu)化輸出解決復(fù)雜問題,被開發(fā)者稱為“AI工具組合大師”。

技術(shù)細(xì)節(jié)顯示,o4-mini在多領(lǐng)域測(cè)試中表現(xiàn)亮眼:其數(shù)學(xué)推理能力在AIME 2024/2025測(cè)試中分別達(dá)到93.4%和92.7%準(zhǔn)確率,編程競(jìng)賽得分2700分(Codeforces全球前200名水平),科學(xué)推理準(zhǔn)確率較前代提升35%。該模型采用創(chuàng)新訓(xùn)練方法,不僅學(xué)習(xí)文本生成,更掌握調(diào)用計(jì)算器、圖像處理工具等外部程序完成特定任務(wù)的能力。例如面對(duì)復(fù)雜數(shù)學(xué)題時(shí),可自動(dòng)調(diào)用計(jì)算模塊;處理圖像數(shù)據(jù)時(shí),能啟動(dòng)裁剪、旋轉(zhuǎn)等預(yù)處理程序。

安全管控方面,OpenAI同步推出“安全導(dǎo)向推理監(jiān)控系統(tǒng)”,重點(diǎn)防范模型在生物、化學(xué)等敏感領(lǐng)域提供風(fēng)險(xiǎn)建議。該系統(tǒng)通過1000小時(shí)紅隊(duì)測(cè)試,可識(shí)別并攔截涉及生物威脅的提問。

此次發(fā)布的兩款模型突破傳統(tǒng)文本交互局限,實(shí)現(xiàn)多模態(tài)深度協(xié)同。用戶上傳旅行照片時(shí),模型可調(diào)用視覺分析模塊識(shí)別地貌特征,結(jié)合地理數(shù)據(jù)庫(kù)生成圖文報(bào)告;處理企業(yè)流程圖時(shí),能聯(lián)動(dòng)圖表生成工具自動(dòng)優(yōu)化排版。開發(fā)者強(qiáng)調(diào),o4-mini激活成本較同類模型降低50%,API響應(yīng)速度達(dá)20毫秒級(jí)。

目前,o3和o4-mini已集成至ChatGPT的“深度研究”功能,支持實(shí)時(shí)網(wǎng)絡(luò)檢索與研究報(bào)告編譯。OpenAI CEO奧爾特曼透露,該系列模型是通向GPT-5的關(guān)鍵過渡產(chǎn)品,未來數(shù)月將推出更強(qiáng)大的迭代版本。

即日起,企業(yè)用戶可通過OpenAI平臺(tái)申請(qǐng)接入新模型API,個(gè)人用戶可在ChatGPT工具集中體驗(yàn)部分功能。隨著工具調(diào)用能力的開放,AI助手正從“信息提供者”轉(zhuǎn)型為“問題終結(jié)者”,開啟智能體應(yīng)用新紀(jì)元。

原創(chuàng)文章,作者:聆聽,如若轉(zhuǎn)載,請(qǐng)注明出處:http://www.2079x.cn/article/715303.html

聆聽的頭像聆聽認(rèn)證作者

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評(píng)論