C-Eval

1个月前发布 17 0 0

C-Eval是一个多层次、多学科的中文评估工具,专为基础模型设计。-AI工具库

收录时间:
2025-12-08

C-Eval产品介绍

C-Eval是一款全面的中文评估套件,专为基础模型设计,涵盖了多达13948道多项选择题,涉及52个不同学科和四个难度等级。以下是C-Eval的主要特点:

多学科覆盖:C-Eval的题库包含多个学科,适用于不同领域的评估需求,确保用户能够在多样化的知识背景下进行测试。多难度级别:题目分为四个难度等级,用户可以根据自身需求选择适合的难度进行评估,帮助更好地了解模型的能力。数据下载:用户可以直接在Huggingface datasets上下载数据,方便进行本地使用和研究。

由AI导航()整理,仅供参考。

使用指导:在GitHub上提供详细的使用说明,帮助用户快速上手,了解如何读取和使用数据。研究论文:C-Eval的相关研究论文已在《神经信息处理系统进展》上发表,用户可以通过阅读论文获取更深入的理解。

C-Eval不仅适合研究人员和开发者使用,也为教育工作者提供了一个评估工具,帮助他们在教学中应用基础模型的评估。若有任何疑问或需要进一步的信息,用户可以通过电子邮件或在GitHub上创建问题进行联系。

数据统计

数据评估

C-Eval浏览人数已经达到17,如你需要查询该站的相关权重信息,可以点击"5118数据""爱站数据""Chinaz数据"进入;以目前的网站数据参考,建议大家请以爱站数据为准,更多网站价值评估因素如:C-Eval的访问速度、搜索引擎收录以及索引量、用户体验等;当然要评估一个站的价值,最主要还是需要根据您自身的需求以及需要,一些确切的数据则需要找C-Eval的站长进行洽谈提供。如该站的IP、PV、跳出率等!

关于C-Eval特别声明

本站飞侠导航提供的C-Eval都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由飞侠导航实际控制,在2025年12月8日 下午12:52收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,飞侠导航不承担任何责任。

相关导航

暂无评论

none
暂无评论...