与“模型评测”相关的标签

AI Ping

【AI Ping】AI 大模型性能评测平台!吞吐量 / 延迟关键指标,客观对比 DeepSeek/G...

FlagEval

【FlagEval(天秤)】BAAI 大模型评测体系!三维框架 + 22 + 数据集,多模态兼容助力...

C-Eval

【C-Eval】中文大模型评估套件!52 学科 + 4 难度级别,零 / 少样本测试度量泛化能力!

Hugging Face

【Hugging Face】AI 开发者开源社区平台!提供 NLP + 机器学习模型 / 数据集,协...

MagicArena

【MagicArena】字节跳动视觉生成大模型对战平台!调用 Midjourney/FLUX,文字生...