本次发布的数据集 ODEX, 该数据集名为ODEX,是首个开放领域基于执行的自然语言到Python代码生成数据集,包含了来自Stack Overflow的945个自然语言与代码对,同时配备了1,707个人工编写的测试用例以供执行。ODEX支持四种自然语言:英语、西班牙语、日语和俄语。其规模包括945个自然语言与代码对以及1,707个测试用例,旨在支持开放领域的代码生成与执行评估任务。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)