斯坦福大学打造的可多维度评测语言模型的体系
复旦大学NLP实验室推出的聚焦专业知识评测的大模型基准
高校与机构合作的大模型通用能力评测平台
上海人工智能实验室推出支持多模型一站式评测并公布榜单的开放体系
北京智源研究院推出的覆盖超800模型的大模型评测开放平台