MIT CSAIL 本次发布的数据集 KRAMABENCH, KRAMABENCH是一个由104个手动整理的真实世界数据科学管道组成的基准,涵盖了来自24个数据源的1700个数据文件,涉及6个不同领域。这些管道测试了AI系统在数据处理方面的端到端能力,包括数据发现、数据清洗和准备、高效处理、统计推理以及根据高级任务编排数据处理步骤。数据集用于评估AI模型在设计和执行复杂数据科学管道方面的能力,旨在推动自主数据科学代理在现实世界应用中的发展。
README 内容:
关于 MIT CSAIL , 麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)是麻省理工学院下属的一个世界领先的研究机构,专注于计算机科学与人工智能的研究。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)