复旦测评家大模型高考数学成绩字节豆包卷超夺冠

复旦测评家大模型高考数学成绩，字节豆包卷超夺冠

来源/采访对象提供新民晚报讯（记者金志刚）近日，复旦大学自然语言处理（NLP）实验室LLMEVAL团队公布了2024年高考数学大模型评测结果。数据显示，字节豆包在2024高考数学新II卷客观题正确率达到74.66%，在13家大模型中排名首位，阿里千问和GPT-4o分列二三位。而在高考数学新I卷评测排名中，字节豆包也排在前列。据悉，LLMEval是由复旦大学NLP实验室推出的大模型评测基准，专注于评估专业领域的知识能力。评测团队表示，全新出炉的高考试题具备高度的独创性和保密性，是用来评测大模型的“绝好评测集合”。因此...

心理健康 2024-09-17 624 0 复旦测评家大模型高考数学成绩字节豆包卷超夺冠

1