five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

IBM研究院发布ELT-Bench-Verified数据集,应用在数据工程自动化、AI代理评估领域

五号数据雷达开源数据市场2026-04-05 05:2627
ELT-Bench-Verified是IBM研究院发布的数据集,于2026-04-03首发在arXiv应用于数据工程自动化、AI代理评估领域

IBM研究院本次发布的数据集ELT-Bench-Verified,ELT-Bench-Verified是由IBM研究院、苏黎世联邦理工学院等机构联合构建的基准数据集,旨在评估AI代理在端到端ELT(提取-加载-转换)管道构建中的能力。该数据集包含100项任务,涵盖异构数据源连接、云数据仓库加载及SQL转换逻辑生成,数据规模涉及203个目标数据模型的660列级比对。其构建过程通过审计-校正框架(Fleiss’ κ=0.85人工验证)对原始ELT-Bench的标注错误进行系统性修正,解决了32%的基准归因错误。该数据集主要应用于数据工程自动化领域,为AI驱动的工作流优化提供可靠性验证基准。

查看ELT-Bench-Verified

关于IBM研究院,IBM研究院是IBM公司的研究部门,成立于1945年,是全球领先的企业研究机构之一,专注于计算机科学、人工智能、量子计算等领域的创新研究。

关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们