five
五号数据雷达
产品上架
产权登记
知识产权
公共数据
首页 / 开源数据市场 / 正文

北京大学 发布 LongViTU 数据集, 应用在 视频理解、视频问答 领域

五号数据雷达开源数据市场2025-01-14 17:0176
LongViTU 是 北京大学 发布的数据集,于 2025-01-09 首发在 arXiv 应用于 视频理解、视频问答 领域

北京大学 本次发布的数据集 LongViTU, LongViTU是一个用于长视频理解的大规模数据集,由北京大学、BIGAI和新加坡国立大学的研究团队共同创建。该数据集包含约121k个高质量的问答对,覆盖约900小时的视频内容,平均每个视频的问答对时长为4.6分钟。数据集通过自动生成的层次化树结构构建,确保了问答对的高质量和时间戳的精确标注。数据集的内容涵盖了多样化的真实世界场景,适用于长视频和流媒体视频的理解任务,旨在解决现有数据集在时间标注、场景多样性和问答精确性方面的不足。LongViTU的应用领域包括视频问答、长视频理解以及流媒体视频分析等。

查看LongViTU

关于 北京大学 , 北京大学,简称北大,是中国最早成立的国立综合性大学之一,位于北京市。北大以其在人文、社会科学、自然科学和工程技术等领域的卓越教育和研究而闻名,是中国乃至亚洲最顶尖的高等学府之一。

关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。

数据合作广告位

社区讨论

近期热门
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

二维码
关注我们