用于生物医学问答研究、模型评估及技术发展的数据集与排行榜平台
通过用户投票评估AI模型表现并生成排行榜的平台
用于评测大模型中文理解能力的多学科多层次中文评估套件
Stability AI新推可免费测试模型的聊天对话网站