Loading...
AI模型评测

MMLU

UC Berkeley 2020年推出的多领域英文大模型语言理解测评

标签:

MMLU简介

MMLU是大规模多任务语言理解基准,用于测评大模型语言理解能力。

 

基本信息

MMLU全称为Massive Multitask Language Understanding,由UC Berkeley大学研究人员在2020年9月推出,是著名的大模型语义理解测评之一。

 

测试范围

该测试具有广泛的知识覆盖范围,涵盖57项任务,具体如下:

  • 初等数学
  • 美国历史
  • 计算机科学
  • 法律等领域

 

语言与用途

测试采用英文进行,主要用于评测大模型基本的知识覆盖范围和理解能力,为评估大模型的性能提供重要参考。

 

官方链接

如果你想了解更多关于MMLU的详细信息, 点击前往官网 点击前往官网

相关导航