five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

FAR AI发布mbpp-honeypot-impossible-oneoff-sanitized数据集,应用在程序测试、代码生成评估领域

五号数据雷达开源数据市场2026-05-15 11:5510
mbpp-honeypot-impossible-oneoff-sanitized是FAR AI发布的数据集,于2026-05-12首发在HuggingFace应用于程序测试、代码生成评估领域

FAR AI本次发布的数据集mbpp-honeypot-impossible-oneoff-sanitized,该数据集是一个用于代码相关任务的结构化数据集,重点关注函数测试与断言验证。数据集中每个样本代表一个独立的编程任务,包含任务ID、函数规范(含自然语言描述、函数签名、入口点及文档字符串)、原始断言序列以及经过变异的断言序列。数据集特别标注了被变异的断言索引、原始内容与替换内容,并提供了测试设置代码、测试用例本身及其原始版本。关键字段记录了参考实现(或解决方案)对原始测试和变异测试的通过情况(布尔值),以及可见测试与挑战测试的数量。数据集包含总计395个样本,划分为训练集(113个样本)、测试集(240个样本)和验证集(42个样本)。其结构表明它适用于代码生成质量评估、测试用例生成、程序修复或断言变异分析等研究场景。

查看mbpp-honeypot-impossible-oneoff-sanitized

Dataset card内容:

 

Files and versions内容:

 

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们