five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

德国波鸿鲁尔大学发布ReproBreak基准数据集 破解Web自动化测试定位器中断痛点

五号数据雷达开源数据市场2026-05-15 07:4816
2026年5月12日,德国波鸿鲁尔大学研究团队在预印本平台arXiv首发ReproBreak定位器中断专用数据集,为Web自动化测试、定位器脆弱性修复领域提供标准化实验基准,助力提升测试框架稳定性与研发交付效率。

随着Web应用迭代节奏不断加快,前后端版本更新频率普遍提升至周级甚至日级,DOM结构动态调整导致的自动化测试定位器中断问题,已经成为制约DevOps流水线交付效率的核心痛点之一。长期以来,Web自动化测试领域缺乏统一公开的、经过全流程验证的定位器失效基准数据集,不同企业、研究团队的定位器鲁棒性优化、失效修复技术研发成果难以横向对标,大量资源被消耗在重复的数据集构建工作中,直接拖慢了测试智能化的落地进度。

2026年5月12日,德国波鸿鲁尔大学研究团队正式在预印本平台arXiv首发ReproBreak数据集,为这一行业痛点的解决提供了标准化的基础资源支撑。据介绍,ReproBreak是全球首个聚焦Web应用GUI测试中可复现定位器中断的专用基准数据集,研究团队通过对359个主流开源Web仓库中的9572次定位器变更进行系统性筛选、验证,最终沉淀了449条经过全流程复现校验的定位器中断案例,覆盖了电商、工具类、内容平台等多类Web应用的典型失效场景。为了降低使用门槛,数据集采用SQLite关系型数据库形式存储所有案例信息,同时配套了全自动化的案例复现脚本,并且通过Docker环境封装了对应Web应用版本、测试执行环境的完整镜像,使用者无需手动搭建复杂的依赖环境,即可快速开展相关实验,最大程度保障了不同主体实验结果的可重复性与一致性。

从应用方向来看,ReproBreak数据集的落地场景覆盖产业界与学术界多个维度:在企业测试团队侧,可基于该数据集开展内部定位器选择策略的鲁棒性评估,提前识别高风险失效场景,降低生产环境测试中断概率;在测试技术研发侧,算法团队可将其作为训练与验证集,研发AI驱动的定位器自动修复技术,实现DOM结构变动后的定位器自动适配,减少人工维护测试脚本的成本;在测试工具厂商侧,Cypress、Playwright等主流自动化测试框架的研发团队,可将该数据集纳入版本迭代的基准测试集,提升框架本身对DOM变动的容错能力;在学术研究侧,该数据集可为定位器脆弱性评估、测试鲁棒性优化等方向的研究提供统一的对标基准,推动相关技术的快速迭代。

业内分析指出,随着数字经济的快速发展,软件研发效能已经成为企业数字化竞争力的核心组成部分,ReproBreak数据集的发布,填补了Web自动化测试领域公开基准资源的空白,为数据要素在软件研发效能提升场景的落地提供了典型样本,将有力推动Web自动化测试技术的智能化升级,进一步降低企业的研发测试成本,提升DevOps全流程的交付效率。

查看ReproBreak

详情页内容:

ReproBreak数据集详情

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们