當前位置：新聞>滾動>

北京中考試卷出爐，來看九章大模型對決GPT-4o

發佈時間：2024-07-01 13:07:49 | 來源：新浪科技 | 作者： | 責任編輯：科學頻道

繼高考之後,各地中考也陸續落下帷幕。之前,多家機構和媒體用高考題評測大模型們的“高考成績”,吸引了不少眼球。那面對中考題,尤其是大模型不太擅長的數學科目,又會有怎樣的結果呢?

讓我們以今年北京中考數學試卷為例,再測一下大模型們的答題實力吧!

今天的測試“選手”分別是國産九章大模型和GPT-4o大模型。九章大模型(MathGPT),是學而思自主研發,面向全球數學愛好者和科研機構,以解題和講題演算法為核心的大模型。此前在Matheval排行榜多個維度的評測中都排名第一。GPT-4o是由OpenAI公司研發,是國際上備受關注的大語言模型之一,除了自然語言處理,GPT-4o還具備一定的推理能力,能夠處理需要邏輯分析和判斷的問題。

究竟誰在這場“數學比拼”中更勝一籌,讓我們一起看看。

一、先説結論

本次測試選擇了2024年北京中考數學試卷中的17道題,分別是8道選擇題、8道填空題以及1道解答題。

在測試題目的比拼中,九章大模型的正確率為85%,GPT-4o的正確率為75%。

【九章大模型(MathGPT)】

選擇題8題,做對5題。

填空題8題,做對6題。

九章大模型總分 = 5 * 2分 + 6* 2分+1分 = 23分 (滿分30分)

【GPT-4o】

選擇題8題,正確5題。

填空題8題,正確5題。

GPT-4o總分 = 5* 2分 + 5* 2分 = 20分 (滿分30分)