訊飛星火高考數(shù)學成績穩(wěn)居國內(nèi)大模型第一梯隊，深度推理大模型引領教育創(chuàng)新

陳晨 ? 2025年6月12日 14:03:31 ? 產(chǎn)經(jīng)

2025年高考數(shù)學結(jié)束后，關于數(shù)學考試難度的話題迅速引爆了熱搜。

訊飛星火高考數(shù)學成績穩(wěn)居國內(nèi)大模型第一梯隊，深度推理大模型引領教育創(chuàng)新

于此同時，一場人類考生與AI的數(shù)學較量也引發(fā)廣泛關注。DeepSeek R1 0528、訊飛星火 X1-0420、GPT o3 等國內(nèi)外主流深度推理大模型化身 “AI 考生”，在高考數(shù)學卷上展開激烈角逐。其中，訊飛星火X1以141分的優(yōu)異成績脫穎而出，穩(wěn)居國內(nèi)大模型第一梯隊。

本次評測由IT之家發(fā)起，采用了多版本交叉驗證結(jié)合老師解題驗證的方式，總分設定為150分，并特別邀請了具有十年高中數(shù)學一線教研經(jīng)驗的專家輔助評分。參與評測的深度推理大模型共有七家，包括訊飛星火X1-0420、DeepSeek R1 0528、通義千問Qwen3-235B-A22B、豆包 Seed-Thingking-v1.5、文心X1 Turbo、騰訊混元Hunyuan T1 latest以及GPT o3。

在考試開始時，面對較為基礎的選擇題，各家大模型均有不錯的表現(xiàn)。

然而，隨著題目難度的不斷上升，模型間的差異開始顯現(xiàn)。比如在面對一道對數(shù)函數(shù)題時，DeepSeek都出現(xiàn)了錯誤。而到了解答題環(huán)節(jié)，各家比分開始進一步拉開差距。

根據(jù)測評的最終結(jié)果，本次參與測評的大模型大多達到了人類優(yōu)秀考生的水準，相較去年有較大提升。其中，DeepSeek和訊飛星火X1表現(xiàn)突出，是唯二突破140分的大模型；豆包、通義千問、元寶等國產(chǎn)大模型分數(shù)則緊跟第三名GPT o3，接近國際頂尖的模型水平。

據(jù)悉，訊飛星火X1作為第一梯隊的深度推理大模型，其版本相較于其他模型較早，同時模型量級也相對較小（70B）。但是在測評中，訊飛星火X1卻展現(xiàn)出強大的推理能力。特別在解答題環(huán)節(jié)，訊飛星火都能夠給出正確的答案和清晰明了的解題過程，并多次獲得滿分，其表現(xiàn)令人印象深刻。

值得一提的是，基于在教育領域深耕20多年的經(jīng)驗，訊飛星火X1在其他學科的測試中表現(xiàn)同樣亮眼。比如在微博#AI高考作文盲評挑戰(zhàn)#中，訊飛星火X1成功拔得頭籌；在英語作文方面，訊飛星火X1同樣在新京報的測評中奪得第一，展現(xiàn)出強大的語言能力。

隨著AI技術的不斷發(fā)展，深度推理大模型在教育領域的應用前景越來越廣闊。訊飛星火作為其中的佼佼者，不僅為學生提供了有力的學習支持，更為教育行業(yè)的創(chuàng)新升級注入了新的活力。未來，我們有理由相信，訊飛星火將繼續(xù)引領教育創(chuàng)新，為培養(yǎng)更多優(yōu)秀人才貢獻力量。

本文轉(zhuǎn)載自：，不代表科技訊之立場。原文鏈接：http://news.cnmtpt.com/?Sid=12177468_BJ130W644462775

陳晨管理團隊

0 0

產(chǎn)經(jīng)

2025花粉夏令營：一場科技與熱愛的盛夏之約

2025年6月20日-22日，華為開發(fā)者大會2025（以下簡稱“HDC 2025”）期間，華為花粉俱樂部同期舉辦“2025花粉夏令營”，來自全國數(shù)百位花粉齊聚東莞松山湖。在這場為期…

陳晨
11小時前
產(chǎn)經(jīng)

HDC2025華為閱讀開放技術能力，全面賦能生態(tài)伙伴和開發(fā)者提升效率

2025年華為開發(fā)者大會（HDC）上，鴻蒙系統(tǒng)級AI能力全面賦能華為閱讀，帶來了用戶閱讀體驗和合作伙伴開發(fā)工具的雙重升級。對于用戶，華為閱讀一站式全流程的AI輔助閱讀能力幫助用戶提…

陳晨
12小時前
產(chǎn)經(jīng)

當夢想站上C位：一群“鴻蒙合伙人”點燃HDC，定義屬于年輕開發(fā)者的時代！

HDC 2025現(xiàn)場，首次為一個特別群體點亮——“鴻蒙時代合伙人”街區(qū)。一群來自天南地北、規(guī)模不大卻“有點意思”的年輕開發(fā)者，用一行行滾燙的代碼，向世界宣告：在鴻蒙的花園里，每一顆…

陳晨
12小時前
產(chǎn)經(jīng)

鴻蒙賦能進一步深化！華為攜手政企學研共育百萬創(chuàng)新人才

6月22日，HDC 2025 “攜手共育共拓HarmonyOS創(chuàng)新人才”分論壇在東莞松山湖圓滿收官。本次論壇深度聚焦鴻蒙生態(tài)中“人才供需關系、產(chǎn)教…

陳晨
14小時前
產(chǎn)經(jīng)

HDC 2025華為云專業(yè)服務高峰論壇召開，全棧AI使能企業(yè)釋放澎湃生產(chǎn)力

2025年6月21日，HDC 2025華為云專業(yè)服務高峰論壇召開，本次論壇匯聚了近300位專家、客戶、合作伙伴及開發(fā)者，圍繞“全棧AI使能服務，釋放企業(yè)澎湃生產(chǎn)力”主題展開探討。會…

陳晨
16小時前
產(chǎn)經(jīng)

成本低、耗時少，華為鴻蒙智家后裝解決方案破解老房改造難題

2025年6月20日-2025年6月22日，華為開發(fā)者大會2025（HDC 2025）在東莞松山湖舉辦。HDC主題演講上華為終端BG董事長余承東宣布鴻蒙智能硬件生態(tài)品牌煥新為“鴻蒙…

陳晨
1天前
產(chǎn)經(jīng)

華為云重磅發(fā)布DataArts數(shù)據(jù)工程平臺，10倍提效大模型訓練！

2025年6月21日，華為開發(fā)者大會2025期間，在“以數(shù)賦智，智能躍遷：構建AI時代企業(yè)的最佳數(shù)據(jù)底座”專題論壇上，華為云重磅發(fā)布AI時代的多模態(tài)數(shù)據(jù)加工生產(chǎn)線——DataArt…

陳晨
1天前
產(chǎn)經(jīng)

HDC 2025耀星·領航出海高峰論壇：以全域生態(tài)協(xié)同重構出海增長曲線

6月21日，HDC 2025耀星·領航出海高峰論壇在東莞三丫坡舉辦，吸引了全球開發(fā)者、企業(yè)及生態(tài)出海專家共同參與。論壇聚焦2025年重點區(qū)域行業(yè)生態(tài)趨勢，通過歐洲、歐亞、中東、亞太…

陳晨
1天前
產(chǎn)經(jīng)

持續(xù)深耕，華為云Stack做智能時代更懂政企的云

6月21日，以“華為云Stack，做智能時代更懂政企的云”為主題的高峰論壇在華為開發(fā)者大會2025上成功舉辦。本次峰會匯聚來自政府、金融、央國企等領域的政企行業(yè)用戶、伙伴及專家學者…

陳晨
1天前
產(chǎn)經(jīng)

華為云肖霏：持續(xù)深耕，做智能時代更懂政企的云

6月21日，以“華為云Stack，做智能時代更懂政企的云”為主題的高峰論壇在華為開發(fā)者大會2025上成功舉辦。華為混合云總裁肖霏發(fā)表主題演講，分享面向智能時代，華為云Stack如何…

陳晨
1天前
產(chǎn)經(jīng)

2025第七屆貴州汽車交易會6月21-22日開幕

由貴陽市孟關經(jīng)貿(mào)促進商會、武漢尚格會展股份有限公司聯(lián)合主辦，貴陽尚格會展服務有限公司執(zhí)行承辦的2025第七屆貴州汽車交易會(以下簡稱：貴州車交會)于6月21-22日在貴陽國際會議展…

陳晨
1天前
產(chǎn)經(jīng)

新一代小游戲圖形渲染技術WebGE首發(fā)！助力小游戲開發(fā)更高效

6月21日，華為開發(fā)者大會2025（HDC 2025）游戲服務分論壇在廣東東莞松山湖成功舉辦。眾多游戲開發(fā)者、行業(yè)領軍人物及生態(tài)合作伙伴齊聚一堂，聚焦“新機遇、新體驗、新服務，鴻蒙…

陳晨
1天前
產(chǎn)經(jīng)

打破“買即貶值”！問界M9 OTA重磅升級，詮釋智能汽車持續(xù)進化力

六月，暑意漸濃，出行需求攀升之際，問界M9迎來了新一輪OTA升級。此次升級以30余項功能迭代與優(yōu)化，再次刷新了智能汽車的體驗天花板。這不僅是HUAWEIADS智能輔助駕駛系統(tǒng)從“好…

陳晨
1天前
抖音拼多多小紅書淘寶等多平臺電商 erp 系統(tǒng)前十名

電商市場繁榮，多平臺電商 ERP 系統(tǒng)眾多，快麥 ERP 憑借卓越性能穩(wěn)居前十。抖音小店運營中，快麥 ERP 能實現(xiàn)短視頻和直播帶貨功能的完美對接，實時同步訂單數(shù)據(jù)，提高銷售效率…

陳晨
產(chǎn)經(jīng) 1天前
產(chǎn)經(jīng)

百勝中國發(fā)布首個面向餐廳營運的智能體，開啟智能化餐廳新篇章

今天,百勝中國首屆人工智能日活動在上海舉行。活動開幕式上,公司發(fā)布了首個面向餐廳營運的智能體——Q睿(Q-Smart Agent)。百勝中國首席執(zhí)行官屈翠容發(fā)表了開幕致辭,并宣布將…

陳晨
1天前
產(chǎn)經(jīng)

華為云發(fā)布盤古大模型5.5，宣布新一代昇騰AI云服務上線，成就行業(yè)AI先鋒

【中國，東莞，2025年6月20日】今天，華為開發(fā)者大會2025（HDC 2025）在東莞籃球中心隆重揭幕。本次大會包含主題演講、峰會、專題論壇、互動體驗以及數(shù)百場面向開發(fā)者的特色…

陳晨
1天前
產(chǎn)經(jīng)

華為云發(fā)布全流程智能化CodeArts Doer，讓開發(fā)更快更準更穩(wěn)

在6月20日召開的華為開發(fā)者大會（HDC 2025）上，華為云發(fā)布的CodeArts Doer，通過全流程、多Agent協(xié)同，突破傳統(tǒng)企業(yè)研發(fā)三大瓶頸，賦能企業(yè)實現(xiàn)更快更準更穩(wěn)的研…

陳晨
1天前
HDC2025丨華為推出小藝智能體開放平臺，全面賦能鴻蒙智能體開發(fā)

6月20日，華為開發(fā)者大會2025（HDC2025）在東莞松山湖舉行，會上發(fā)布了全新鴻蒙智能體框架（Harmony Agent Framework, HMAF）與《Agent時代，…

陳晨
產(chǎn)經(jīng) 1天前
產(chǎn)經(jīng)

CloudRobo具身智能平臺，以三大核心模型加速具身智能創(chuàng)新

2025年被譽為“具身智能元年”。在6月20日的華為開發(fā)者大會2025（HDC 2025）上，華為常務董事、華為云計算CEO張平安發(fā)布了CloudRobo具身智能平臺。他強調(diào)，華為…

陳晨
1天前
產(chǎn)經(jīng)

華為云發(fā)布盤古世界模型可生成火星的數(shù)字物理空間

6月20日，在華為開發(fā)者大會2025（HDC 2025）上，全新發(fā)布基于盤古多模態(tài)大模型的世界模型，可以為智能駕駛、具身智能機器人的訓練，構建所需要的數(shù)字物理空間，實現(xiàn)持續(xù)優(yōu)化迭代…

陳晨
1天前