OpenAI官宣最強模型o3-pro!號稱寫作、編程更準

6月11日,OpenAI發(fā)布了o3-pro,這一AI模型被公司稱為迄今為止最強大的產(chǎn)品。o3-pro是OpenAI今年早些時候推出的推理模型o3的一個版本。與傳統(tǒng)AI模型不同,推理模型能夠逐步推理解決問題,因此在物理、數(shù)學和編程等領域表現(xiàn)更為可靠。

OpenAI官宣最強模型o3-pro!號稱寫作、編程更準

自本周二起,o3-pro已面向ChatGPT Pro和Team用戶開放,取代原有的o1-pro模型。OpenAI表示,企業(yè)版與教育版用戶將在下周獲得訪問權限。o3-pro也已于今日上線OpenAI的開發(fā)者API。

在API中,o3-pro的定價為每百萬輸入tokens 20美元,每百萬輸出tokens 80美元。輸入tokens指輸入到模型中的內容,輸出tokens則是模型基于輸入生成的內容。

OpenAI在更新日志中寫道:“在專家評測中,評審人員在所有測試類別中均更傾向于o3-pro,尤其是在科學、教育、編程、商務和寫作輔助等關鍵領域。評審人員還一致認為,o3-pro在表達清晰度、內容全面性、指令遵循度和準確性等方面表現(xiàn)更優(yōu)。”

根據(jù)OpenAI介紹,o3-pro具備多項工具調用能力,可實現(xiàn)網(wǎng)頁搜索、文件分析、圖像內容推理、使用Python、借助記憶進行個性化響應等。不過,OpenAI也指出,相較于o1-pro,o3-pro生成回復所需時間通常更長。

o3-pro還存在其他限制。目前,ChatGPT中的臨時對話功能暫時關閉,OpenAI正在解決相關技術問題。o3-pro不支持圖像生成,也無法用于“畫布”(Canvas)這一AI智能工作區(qū)功能。

值得一提的是,OpenAI內部測試顯示,o3-pro在多項主流AI基準測試中取得了優(yōu)異成績。在AIME 2024數(shù)學能力評測中,o3-pro得分高于谷歌的旗艦AI模型Gemini 2.5 Pro。在GPQA Diamond(博士級科學知識測試)中,o3-pro也超越了Anthropic近期發(fā)布的Claude 4 Opus。

原創(chuàng)文章,作者:AI,如若轉載,請注明出處:http://www.2079x.cn/article/723322.html

AI的頭像AI認證作者

相關推薦

發(fā)表回復

登錄后才能評論