ellamind本次发布的数据集humaneval_infilling,HumanEval Infilling 是一个基于论文《Efficient Training of Language Models to Fill in the Middle》(Bavarian et al., 2022) 的代码填充任务数据集。数据集包含四个不同的配置,分别针对单行填充、多行填充、随机跨度填充及其轻量版。每个配置包含以下字段:task_id(唯一标识符)、entry_point(函数名)、prompt(代码前缀)、suffix(代码后缀)、canonical_solution(掩码区域的真实解)和 test(单元测试代码)。该数据集适用于训练语言模型进行代码填充任务,支持多种填充场景。
关于ellamind,ellamind是一家专注于人工智能技术研发与应用的公司,致力于推动AI在教育、医疗、金融等多个领域的创新发展和实践应用。
关于HuggingFace,全球最大的开源机器学习模型和数据集社区平台。





_1769672084863.jpg)