five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

马里兰大学发布Auto-ClawEval数据集,应用在爪类智能体、评估基准领域

五号数据雷达开源数据市场2026-04-22 09:076
Auto-ClawEval是马里兰大学发布的数据集,于2026-04-21首发在arXiv应用于爪类智能体、评估基准领域

马里兰大学本次发布的数据集Auto-ClawEval,Auto-ClawEval是由ClawEnvKit框架自动生成的第一个大规模爪类智能体评估基准,包含24个语义类别的1040个任务环境。该数据集通过自然语言描述生成结构化任务参数,整合了模拟服务接口和自动化评分配置,其数据来源于框架的流程化合成而非人工标注。创建过程采用三阶段模块化流水线:解析器提取任务要素、生成器构建沙盒环境、验证器确保逻辑一致性,单任务生成成本仅为人工的1/13800。该数据集主要应用于爪类智能体的跨工具链评估和持续学习训练,旨在解决传统人工构建环境存在的多样性不足、迭代滞后等 scalability 瓶颈问题。

查看Auto-ClawEval

Dataset card内容:

 

Files and versions内容:

 

README内容:

 

关于马里兰大学,马里兰大学(University of Maryland)是美国马里兰州的一所公立研究型大学,成立于1856年,是马里兰大学系统的旗舰院校。该校在计算机科学、工程、物理学等领域具有较强研究实力。

关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们