LOADING

AI工具精选 AI工具精选 AI工具精选 AI工具精选
  • AI作图设计
  • AI写作工具
  • AI图片压缩
  • AI图片背景移除
  • AI学习平台
  • AI学术研究
  • AI对话聊天
  • AI搜索引擎
  • AI生成PPT
  • AI生成论文
  • AI绘画创作
  • AI编程工具
  • AI视频工具
  • AI论文工具
  • AI语言翻译
  • AI 3D模型生成
  • AI表格数据处理
  • AI法律助手
  • AI幻灯片和演示
  • AI会议工具
  • AI开发平台
  • AI模型评测
  • AI内容检测
  • AI商品图生成
  • AI设计工具
  • AI思维导图
  • AI提示指令
  • AI图片生成
  • AI图片无损放大
  • AI图片优化修复
AI工具精选 AI工具精选
  • 首页
  • 文章博客

    AI模型评测

    PubMedQA
    PubMedQA

    用于生物医学问答研究、模型评估及技术发展的数据集与排行榜平台

    HELM
    HELM

    斯坦福大学打造的可多维度评测语言模型的体系

    LMArena
    LMArena

    通过用户投票评估AI模型表现并生成排行榜的平台

    LLMEval3
    LLMEval3

    复旦大学NLP实验室推出的聚焦专业知识评测的大模型基准

    H2O EvalGPT
    H2O EvalGPT

    H2O.ai推出的可评估比较大模型性能并提供排行榜的开放工具

    OpenCompass
    OpenCompass

    上海人工智能实验室推出支持多模型一站式评测并公布榜单的开放体系

    CMMLU
    CMMLU

    用于评估中文语境下语言模型知识与推理能力的多主题基准

    MMBench
    MMBench

    多维度细粒度评估多模态大模型能力的评测体系

    SuperCLUE
    SuperCLUE

    综合性评估中文大模型多维度性能的测评基准

    AGI-Eval
    AGI-Eval

    高校与机构合作的大模型通用能力评测平台

    MMLU
    MMLU

    UC Berkeley 2020年推出的多领域英文大模型语言理解测评

    Open LLM Leaderboard
    Open LLM Leaderboard

    Hugging Face打造的多维度开源大模型排名榜单

    C-Eval
    C-Eval

    用于评测大模型中文理解能力的多学科多层次中文评估套件

    FlagEval
    FlagEval

    北京智源研究院推出的覆盖超800模型的大模型评测开放平台

    AI工具精选 AI工具精选
    “AI工具精选” 是一个专注于收集国内外各种实用AI工具的导航网站,致力于为大家提供便捷高效的服务,让用户快速找到自己需要的AI工具。

    友情链接免责声明广告合作关于我们

    扫码关注微信公众号AI工具精选

    扫码关注微信公众号
    Copyright © 2025 AI工具精选 粤ICP备19154149号-3