随着大模型技术向垂直场景落地,具备自然语言理解、自主任务执行能力的AI智能体成为产业研发热点,其中日程统筹、预约调度等日历相关场景,是个人助理、办公自动化、企业服务等领域的高频需求,但长期以来,该领域强化学习训练缺乏统一格式、统一验证标准的公开数据集,导致不同团队训练的智能体泛化能力不足、效果难以横向对比。作为全球最具影响力的开源AI数据集机构之一,LAION eV此前曾推出支撑Stable Diffusion等跨时代生成式AI产品的大规模训练数据集,在AI训练数据的标准化、开源化领域拥有丰富的行业积累。
本次LAION eV发布的nemotron-gym-instruction-following-calendar数据集,是NVIDIA Nemotron-RL-Instruction-Following-Calendar-v2数据集的Harbor格式转换版本,属于NeMo-Gym集合的一部分,专门设计用于强化学习任务,特别是指令跟随日历相关场景。
数据集中每个样本包含两个核心字段:path字段为确定性短ID(格式为
值得关注的是,该数据集的转换过程全程遵循安全构建原则,所有内容不会直接插入到shell、Python或Dockerfile源代码中,全部参数值通过JSON文件在运行时解析,从源头上避免了数据集投毒、恶意代码注入等AI训练安全风险,适配学术研究与产业级应用的安全要求。
目前该数据集规模处于1K 查看nemotron-gym-instruction-following-calendarDataset card内容:
Files and versions内容:





_1769672084863.jpg)