DeepMind 本次发布的数据集 TAP-Vid, TAP-Vid数据集由DeepMind创建,专注于视频中任意点的跟踪任务。该数据集包含1219个真实视频,总计31,951个跟踪点,涵盖了从Kinetics和DAVIS等来源的视频。数据集的构建核心是一个创新的半自动众包流程,利用光学流估计来辅助标注,使得标注者能够专注于视频中较难的部分。此外,数据集还包括合成视频,提供完美的地面实况点跟踪。TAP-Vid数据集不仅用于训练和评估跟踪模型,还探索了多种基准算法,并与现有的点跟踪数据集JHMDB进行比较,展示了其优越性。
README 内容:
关于 DeepMind , DeepMind是一家位于英国伦敦的尖端人工智能研究实验室。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)