印度理工学院孟买分校 本次发布的数据集 FANVID, FANVID是一个包含近1463个低分辨率视频片段的数据集,这些视频片段具有63个身份和49个车牌,来自三个英语国家。每个视频都包括干扰人脸和车牌,增加了任务难度和真实性。数据集包含31,096个手动验证的边界框和标签。FANVID定义了两个任务:(1)人脸匹配——检测低分辨率人脸并将它们与高分辨率免冠照片进行匹配;(2)车牌识别——从低分辨率车牌中提取文本,无需预定义数据库。视频是从高分辨率源下采样的,以确保人脸和文本在任何单个帧中都无法识别,从而要求模型利用时间信息。
Dataset card 内容:
Files and versions 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)