德克萨斯大学休斯顿分校 本次发布的数据集 Lecture Video Visual Objects (LVVO) Dataset, LVVO数据集是一个为教育视频内容中的视觉目标检测而设计的新基准。数据集由来自245个讲座视频的4000帧组成,涵盖了生物学、计算机科学和地球科学等领域。其中,1000帧(LVVO 1k)已被手动标注,用于四个视觉类别:表格、图表、照片图像和视觉插图。每个帧由两位标注者独立标注,并通过第三位专家的审查和冲突解决过程确保了高质量的一致性标注。为了扩展数据集,采用半监督方法自动标注了剩余的3000帧,形成了LVVO 3k。完整的LVVO数据集为开发和评估教育视频中视觉内容检测的监督和半监督方法提供了一个宝贵的资源。
查看Lecture Video Visual Objects (LVVO) Dataset
README 内容:
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)