在具身智能、元宇宙等数字科技赛道加速落地的当下,三维手-物交互姿态估计已成为跨越虚拟与现实边界、支撑机器感知真实环境的核心技术之一。但长期以来,相关算法训练依赖的数据集多采集于实验室受控环境,普遍存在场景单一、标注精度不足、与真实使用场景偏差大等问题,复杂场景下的手部遮挡、接触状态模糊更是成为算法落地的核心瓶颈。
当地时间2026年6月30日,布里斯托大学联合马克斯·普朗克智能系统研究所于预印本平台arXiv正式发布EPIC-Contact数据集,这也是目前业内为数不多的面向野外真实场景的第一人称视角三维手-物交互姿态估计专用数据集,核心目标正是解决真实复杂场景下因严重遮挡和接触模糊导致的姿态估计精度不足难题。据官方披露,该数据集共包含2300个真实场景采集的视频片段,总帧数达62300帧,覆盖9类高频使用的日常物体,依托行业首创的双向接触标注方法,为数据提供了密集的三维手-物接触对应关系和精确的网格姿态。其数据集构建过程采用基于视频上下文的顶点绘制和接触轴转移标注流程,搭配EC-fit优化管道,最终生成的标注数据自带物理约束属性,大幅降低了算法训练过程中的不合理姿态干扰。
从应用价值来看,该数据集的落地场景覆盖当下多个高潜力数字科技赛道:在AR/VR领域,依托该数据集训练的手势交互算法可实现无外设的自然手势操作,用户可直接在虚拟空间实现抓取、移动、捏合等操作,大幅提升虚拟交互的真实感与流畅度;在具身机器人领域,基于该数据集训练的感知模型可适配家庭、办公等非受控场景,实现服务机器人对餐具、办公用品等日常物品的精准抓取、操作,降低抓取失误率;在工业人机协作场景中,相关算法可精准识别工人手部姿态与动作意图,既可以辅助机器人调整作业节奏,也可提前预判碰撞风险,提升作业安全性;此外该数据集还可应用于康复医疗、无障碍设备研发等领域,为手部动作捕捉、智能辅具适配提供数据支撑。
作为垂直领域的高质量标注数据集,EPIC-Contact为训练和评估在复杂真实场景中鲁棒的三维手-物联合姿态估计模型提供了关键监督数据,也填补了业内野外第一人称视角手-物交互数据集的供给空白,将进一步推动相关感知技术从实验室验证走向规模化落地。





_1769672084863.jpg)