five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

IBM Research - Israel 发布 ABBench (agent Analytics Behavioral Benchmark) 数据集, 应用在 代理系统评估、行为分析 领域

五号数据雷达开源数据市场2025-03-12 08:3423
ABBench (agent Analytics Behavioral Benchmark) 是 IBM Research - Israel 发布的数据集,于 2025-03-10 首发在 arXiv 应用于 代理系统评估、行为分析 领域

IBM Research - Israel 本次发布的数据集 ABBench (agent Analytics Behavioral Benchmark), ABBench数据集是由IBM Research - Israel团队创建的,旨在为了更深入地评估和分析代理系统的行为,特别是在处理具有非确定性行为和动态环境的代理系统时。该数据集包含了50个示例,每个示例经过多次处理以记录执行结果,用于评估代理系统在执行流程、决策质量和行为一致性等方面的表现。

查看ABBench (agent Analytics Behavioral Benchmark)

关于 IBM Research - Israel , IBM Research - Israel 是IBM公司设在海外的多个研究机构之一,专注于计算机科学、人工智能、大数据分析等领域的研究与开发,致力于推动科技创新,并将研究成果应用于IBM的产品和服务中。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们