EgoExoLearn是由上海人工智能实验室、中科院深圳先进技术研究院和南京大学联合构建的一个大规模跨视角技能学习视频数据集。该数据集包含747个视频序列,总时长达到120小时,涵盖日常生活场景(例如烹饪)和专业实验室中(例如固相肽合成)捕获的第一人称和第三人称视角视频数据,以及参与者在观看示范视频后执行相同任务时记录的眼动数据和详细的多模态注释。EgoExoLearn旨在帮助AI更好地理解和模拟人类学习新技能的方式,为开发能够从真实世界人类示范中学习并将其映射到以机器人为中心视角的AI代理提供了宝贵的资源。
详情请参见五号雷达:https://www.5radar.com/result?key=EgoExoLearn





_1769672084863.jpg)