five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

上海交通大学发布Workspace-Bench数据集,应用在工作空间智能体评估、异构文件理解领域

五号数据雷达开源数据市场2026-05-08 05:3213
Workspace-Bench是上海交通大学发布的数据集,于2026-05-05首发在arXiv应用于工作空间智能体评估、异构文件理解领域

上海交通大学本次发布的数据集Workspace-Bench,Workspace-Bench是由上海交通大学与字节跳动联合构建的大规模工作空间智能体评估基准,包含5种职业角色的真实数字工作环境,涵盖74种文件类型、20,476个文件(总容量达20GB)及其复杂的依赖关系。该数据集通过388个依赖驱动型任务(含7,399项评估细则)系统检验智能体在跨文件检索、上下文推理和自适应决策等方面的能力,并推出100任务的精简版本降低70%评估成本。其创新性体现在首次模拟真实办公场景中的文件谱系关系和语义关联,为突破当前智能体在异构文件理解与版本追踪等瓶颈问题提供标准化测试平台。

查看Workspace-Bench

详情页内容:

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们