抖音 本次发布的数据集 HLV-1K, HLV-1K是由抖音、南洋理工大学等机构联合创建的大规模长时间视频理解基准数据集,旨在评估模型在长时间视频内容上的理解能力。该数据集包含1009个时长超过一小时的视频,总计14,847个高质量的问题回答对,涵盖了帧级、事件内级、跨事件级和长期推理任务。数据集的创建过程包括视频收集、关键帧提取、事件标注以及问题生成等多个步骤,确保了数据的多样性和高质量。HLV-1K的应用领域主要集中在长时间视频理解任务,如直播视频、会议记录和电影等,旨在解决长时间视频内容中的复杂时空关系理解和长期依赖性问题。
关于 抖音 , 抖音是一款由中国公司字节跳动开发的短视频社交平台,自2016年推出以来,迅速成为全球最受欢迎的社交媒体应用之一。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)