随着智能制造数字化转型进程加速,工业视觉异常检测已成为生产端降本增效、提升产品合格率的核心技术路径,但长期以来,行业内缺乏适配真实产线连续检测场景的高质量标注数据集:现有公开数据集多为静态单帧或稀疏视角采样数据,既无法模拟缺陷证据随视角变化、时间推移逐步显现的真实生产场景,也难以支撑多摄像头联动质检、动态异常定位等前沿技术的研发与验证,成为制约工业视觉技术规模化落地的重要瓶颈。
2026年5月12日,上海科技大学联合清华大学、美团、北京大学共同研发的MMVIAD(Multi-view Multi-task Video Industrial Anomaly Detection)数据集正式在arXiv首发,这也是国内首个聚焦连续多视角场景的工业异常检测视频数据集,核心目标是模拟真实工业场景中的连续检测过程,为相关算法训练、验证提供标准化数据底座。
据官方公开信息显示,MMVIAD数据集共包含4023个以物体为中心的2秒检测视频片段,覆盖48个常见工业零部件及消费品类别、14种不同产线环境、6类典型结构异常类型。不同于传统人工标注数据集存在的标注误差大、对齐难度高的问题,该数据集通过可控渲染技术生成对齐的异常标记与未标记视频对,同时提供了精确到帧的异常可见时间标注,可有效降低算法训练的标注成本,提升模型验证的准确度与可对比性。
从技术价值来看,MMVIAD可同时支撑异常检测、缺陷分类、物体分类及异常可见时间定位四项耦合任务,彻底解决了现有静态或稀疏视角数据无法评估视角依赖性缺陷证据随时间连续显现的行业痛点。基于该数据集,研发团队可针对3C电子产线外观缺陷检测、汽车零部件装配瑕疵排查、食品包装异物识别、厂区机器人巡检动态异常识别等场景开展算法研发,推动工业质检系统从“单帧静态识别”向“多视角动态感知”升级,进一步降低工业生产的质检人力成本、提升缺陷检出率。
作为工业AI领域的核心数据要素,高质量标注数据集是相关技术落地的核心前提,本次MMVIAD数据集的发布,不仅填补了国内连续多视角工业异常检测视频数据集的空白,也为工业视觉领域的产学研协作提供了标准化数据载体,对推动智能制造数字化升级、加快数据要素在工业场景的落地应用具有重要意义。
查看MMVIAD (Multi-view Multi-task Video Industrial Anomaly Detection)





_1769672084863.jpg)