five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

ellamind发布humaneval_infilling数据集,应用在代码填充、语言模型领域

五号数据雷达开源数据市场2026-03-11 03:0619
humaneval_infilling是ellamind发布的数据集,于2026-03-10首发在HuggingFace应用于代码填充、语言模型领域

ellamind本次发布的数据集humaneval_infilling,HumanEval Infilling 是一个基于论文《Efficient Training of Language Models to Fill in the Middle》(Bavarian et al., 2022) 的代码填充任务数据集。数据集包含四个不同的配置,分别针对单行填充、多行填充、随机跨度填充及其轻量版。每个配置包含以下字段:task_id(唯一标识符)、entry_point(函数名)、prompt(代码前缀)、suffix(代码后缀)、canonical_solution(掩码区域的真实解)和 test(单元测试代码)。该数据集适用于训练语言模型进行代码填充任务,支持多种填充场景。

查看humaneval_infilling

关于ellamind,ellamind是一家专注于人工智能技术研发与应用的公司,致力于推动AI在教育、医疗、金融等多个领域的创新发展和实践应用。

关于HuggingFace,全球最大的开源机器学习模型和数据集社区平台。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们