密歇根大学本次发布的数据集SafetyALFRED,SafetyALFRED是由密歇根大学团队基于ALFRED基准扩展的多模态安全评估数据集,聚焦厨房场景下的六类现实危害(如设备误用、火灾隐患等)。该数据集包含1001条轨迹数据,通过AI2-THOR环境生成,整合了视觉帧序列、物体元数据及PDDL定义的安全修复动作。其创新性在于首次将静态危害识别与动态具身规划相结合,用于评估大语言模型在完成家务任务时识别和主动消除安全隐患的能力,填补了现有安全基准仅支持问答式评估的空白。


密歇根大学本次发布的数据集SafetyALFRED,SafetyALFRED是由密歇根大学团队基于ALFRED基准扩展的多模态安全评估数据集,聚焦厨房场景下的六类现实危害(如设备误用、火灾隐患等)。该数据集包含1001条轨迹数据,通过AI2-THOR环境生成,整合了视觉帧序列、物体元数据及PDDL定义的安全修复动作。其创新性在于首次将静态危害识别与动态具身规划相结合,用于评估大语言模型在完成家务任务时识别和主动消除安全隐患的能力,填补了现有安全基准仅支持问答式评估的空白。
