LOADING
通过用户投票评估AI模型表现并生成排行榜的平台
复旦大学NLP实验室推出的聚焦专业知识评测的大模型基准
综合性评估中文大模型多维度性能的测评基准
上海人工智能实验室推出支持多模型一站式评测并公布榜单的开放体系
北京智源研究院推出的覆盖超800模型的大模型评测开放平台