测评高考试卷（高考模拟试卷排行榜）

测评高考试卷（高考模拟试卷排行榜）

首页技巧更新时间：2024-08-25 12:08:59

转自：FudanNLP

又到一年一度的高考季，这是青春的试金石，也是智慧的盛宴。一批青年学子将在高考的舞台上诠释自己的青春，实现自己的梦想，在此我们预祝广大考生都能金榜题名！

与此同时，全新出炉的高考试题具备高度的 独创性 和 保密性 ，是用来评测大模型的 绝好评测集合 。为此，我们连夜挑选了六个在各项评测中脱颖而出的大模型，让他们与广大考生一起，来进行一场 真刀真枪，不能作弊 的实战。

我们选取了网络上流出的2024高考新I卷数学题目，选择了前14个客观题作为我们的评测集合，并根据高考的评分规则，对模型的结果进行了打分。

评分标注：

单选题共 8 题，每小题 5 分，共 40 分。

多选题共 3 题，每小题 6 分，共 18 分。全部正确选项选对得6分，部分选对的得部分分，有选错的得0分。

填空题共 3 题，每小题 5 分，共 15 分。

1

客观题分数

注：大模型多次测试结果可能不同，我们均选取第一次测试结果为准

评测结果显示，在这次评测中，表现的最好的模型是gpt4o，其正确率达到了百分之70。对于简单的题目，如选择题前3题，大部分模型都能给出正确的答案与解答过程，而对于少数困难题目，如填空、选择最后一题，则是全军覆没。在多选题方面，大多数模型也表现不佳，在面临复杂选项的时候模型的准确率会降低不少。

2

测试prompt

1、单选题：请完成下面一道选择题，每个小题四个选项中，只有一项是符合题目要求的。

2、多选题：请完成下面一道选择题，在每小题给出的选项中，有一项或多项符合题目要求，请选出所有你认为正确的选项。

3、填空题：不提供prompt

3

测试结果

Qwen2-72b

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

11.

12.

13.

14.

GPT-4o

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

11.

12.

13.

14.

ChatGLM4

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

11.

12.

13.

14.

九章大模型

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

11.

12.

13.

14.

Gemini 1.5

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

11.

12.

13.

14.

Baichuan4

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

11.

12.

13.

14.

联系方式：cs_nlp@fudan.edu.cn

地址：复旦大学江湾校区交叉二号楼

,

高考模拟演练卷子（高考模拟演练九省试卷题目）全国名校高二学期第三次月考试卷（全国名校高二下学期第二次月考）

大家还看了

七年级第1单元测试卷（七年级上册第一单元测试卷人教版）
附带下载链接https://chaoren.lanzoue....
第六单元综合测试卷答案（第一单元综合测试卷b全部答案）
,...
第二单元综合测试卷(a)（第二单元综合达标测试卷答案）
,...
第7单元综合测试卷b答案（第一单元综合测试卷b全部答案）
下载链接https://pan.quark.cn/s/54e...
四年级上册一到八单元试卷青岛版黄冈（四年级上册黄冈试卷一套答案）
,...
四年级上册一单元到四单元的试卷（四年级上册第一单元的试卷人教版）
,...

也许喜欢

辽宁2023高考化学试卷答案解析（辽宁高考化学2023试卷及答案）
,...
大同市2024年一年级期末考试卷（山西大同2024年八年级期末考试卷）
2024年1月晋中一模/大同高三期末,...
有附加题的试卷有哪些（有附加题的试卷是多少分）
,...
黑龙江高考试卷难度（辽宁黑龙江高考试卷难度对比）
2023黑龙江本地大学录取难易度2023黑龙江本地大学高考录...
淮阴区期末试卷数学（江苏省淮安市数学期末试卷）
,...
试卷里的拼音a怎么转换成e（文档中拼音a怎么变成标准拼音）
上课：同学们好都说学好普通话，走遍天下也不怕，今天我们开始学...
电子版可打印四年级试卷下册的软件（四年级试卷打印电子版冀教版下册）
,...
2024广东中考化学试卷真题及答案（2024广东中考化学题试卷及答案）
2024广东中考全科真题及答案（化学）,...

更多栏目

© 1998-2024 shitiku.com.cn,All Rights Reserved.