UIUC Kang Lab 本次发布的数据集 ELT-Bench, 该数据集名为ELT-Bench,是一个端到端的基准测试,旨在评估人工智能代理构建ELT(提取、转换、加载)管道的能力。该数据集包含100个管道,涵盖了包括835个源表和203个数据模型,这些数据模型覆盖了多个领域。此外,该基准测试还评估人工智能代理在处理复杂的数据工程工作流程方面的能力,这些工作流程涉及与数据库的交互、编写代码和SQL查询,以及协调每个管道阶段的工作。具体规模包括100个管道、835个源表和203个数据模型,任务则是评估人工智能代理在构建ELT管道方面的能力。
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)