AGI

3个月前发布 496 0 245

AGI-Eval评测社区

所在地：

中国

语言：

收录时间：

2025-03-25

打开网站手机查看

AI模型测评 # AI大模型测评

AGI

主要功能：
大模型榜单：基于通用评测方案，提供业内大语言模型的能力得分排名榜单。榜单涵盖综合评测和各能力项评测。数据透明、权威，帮助您深入了解每个模型的优缺点，定期更新榜单，确保您掌握最新信息，找到最适合的模型解决方案。
AGI-Eval人机评测比赛：深入模型评测的世界，与大模型协作助力技术发展构建人机协同评测方案
评测集：

公开学术：行业公开学术评测集，支持用户下载使用。
官方评测集：官方自建评测集，涉及多领域的模型评测。
用户自建评测集：平台支持用户上传个人评测集，共建开源社区。完美实现自动与人工评测相结合；并且还有高校大牛私有数据集托管

Data Studio：

用户活跃度高：3W+众包用户平台，实现更多高质量真实数据回收。
数据类型多样：具备多维度，多领域的专业数据。
数据收集多元化：如单条数据，扩写数据，Arena数据等方式，满足不同评测需求。
完备的审核机制：机审+人审，多重审核机制，保证数据质量。

数据统计

CLUE中文语言理解基准测评

暂无评论

暂无评论...

AGI

数据统计

相关导航

Open LLM Leaderboard

H2O.ai

MMBench

CLUE中文语言理解基准测评

暂无评论