麻省理工学院计算机科学与人工智能实验室 (MIT CSAIL) 本次发布的数据集 PENCIL CODE编程推理轨迹数据集, PENCIL CODE编程推理轨迹数据集是一个包含超过380万个编程推理轨迹的数据集,来源于PENCIL CODE在线教育平台的学生用户。该数据集记录了学生编写程序时的编辑和重试过程,揭示了他们如何处理编程任务以及他们的技能发展水平。数据集涵盖了超过100万个学生9年的使用数据,包括解决从简单图形任务到复杂搜索算法实现的广泛任务。每个轨迹包含学生ID、标题和按时间顺序排列的程序状态序列,捕捉学生的编辑过程。该数据集旨在帮助研究编程学习过程,并开发能够更准确地模拟学生行为的代码生成模型。
README 内容:
关于 麻省理工学院计算机科学与人工智能实验室 (MIT CSAIL) , 麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)是麻省理工学院下属的一个研究机构,专注于计算机科学与人工智能领域的研究,其研究成果在国际上具有重要影响力。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)