中国科学院自动化研究所 本次发布的数据集 DA-Code, DA-Code是由中国科学院自动化研究所复杂系统认知与决策重点实验室和中国科学院大学人工智能学院联合创建的数据科学代码生成基准。该数据集包含500个复杂的任务示例,涵盖数据整理、机器学习和探索性数据分析三大类别,旨在模拟真实世界的数据分析场景。数据集的创建过程经过精心设计,确保任务的高质量和复杂性,适用于评估大型语言模型在数据科学任务中的表现,旨在解决复杂数据处理和分析中的实际问题。
关于 中国科学院自动化研究所 , 中国科学院自动化研究所是中国科学院下属的研究机构,主要从事自动化科学与技术的研究与应用,涵盖了智能控制、模式识别、机器人技术等多个领域。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)