five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

抖音 发布 HLV-1K 数据集, 应用在 视频理解、长期依赖 领域

五号数据雷达开源数据市场2025-01-07 19:1650
HLV-1K 是 抖音 发布的数据集,于 2025-01-03 首发在 arXiv 应用于 视频理解、长期依赖 领域

抖音 本次发布的数据集 HLV-1K, HLV-1K是由抖音、南洋理工大学等机构联合创建的大规模长时间视频理解基准数据集,旨在评估模型在长时间视频内容上的理解能力。该数据集包含1009个时长超过一小时的视频,总计14,847个高质量的问题回答对,涵盖了帧级、事件内级、跨事件级和长期推理任务。数据集的创建过程包括视频收集、关键帧提取、事件标注以及问题生成等多个步骤,确保了数据的多样性和高质量。HLV-1K的应用领域主要集中在长时间视频理解任务,如直播视频、会议记录和电影等,旨在解决长时间视频内容中的复杂时空关系理解和长期依赖性问题。

查看HLV-1K

关于 抖音 , 抖音是一款由中国公司字节跳动开发的短视频社交平台,自2016年推出以来,迅速成为全球最受欢迎的社交媒体应用之一。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们