MMLU简介
MMLU是大规模多任务语言理解基准,用于测评大模型语言理解能力。
基本信息
MMLU全称为Massive Multitask Language Understanding,由UC Berkeley大学研究人员在2020年9月推出,是著名的大模型语义理解测评之一。
测试范围
该测试具有广泛的知识覆盖范围,涵盖57项任务,具体如下:
- 初等数学
- 美国历史
- 计算机科学
- 法律等领域
语言与用途
测试采用英文进行,主要用于评测大模型基本的知识覆盖范围和理解能力,为评估大模型的性能提供重要参考。
官方链接
如果你想了解更多关于MMLU的详细信息, 点击前往官网 点击前往官网。