AGI

2个月前发布 449 0 245

AGI-Eval评测社区

所在地:
中国
语言:
zh
收录时间:
2025-03-25
AGIAGI
AGI

主要功能:
大模型榜单:基于通用评测方案,提供业内大语言模型的能力得分排名榜单。榜单涵盖综合评测和各能力项评测。数据透明、权威,帮助您深入了解每个模型的优缺点,定期更新榜单,确保您掌握最新信息,找到最适合的模型解决方案。
AGI-Eval人机评测比赛:深入模型评测的世界,与大模型协作助力技术发展构建人机协同评测方案
评测集:

公开学术:行业公开学术评测集,支持用户下载使用。
官方评测集:官方自建评测集,涉及多领域的模型评测。
用户自建评测集:平台支持用户上传个人评测集,共建开源社区。完美实现自动与人工评测相结合;并且还有高校大牛私有数据集托管

Data Studio:

用户活跃度高:3W+众包用户平台,实现更多高质量真实数据回收。
数据类型多样:具备多维度,多领域的专业数据。
数据收集多元化:如单条数据,扩写数据,Arena数据等方式,满足不同评测需求。
完备的审核机制:机审+人审,多重审核机制,保证数据质量。

数据统计

相关导航

暂无评论

none
暂无评论...