印度理工学院孟买分校 本次发布的数据集 VISIOCITY, VISIOCITY是一个包含67个长视频的数据集,涵盖六个不同类别,如电视节目、体育、教育和个人视频等。这些视频平均时长约55分钟,具有密集的概念注释,支持多种视频摘要技术和计算机视觉任务,如字幕生成和动作识别。数据集旨在解决现有数据集视频时长短、类别单一的问题,适用于深入研究特定领域的视频摘要技术。
关于 印度理工学院孟买分校 , 印度理工学院孟买分校(IIT Bombay)是印度最顶尖的工程技术与科学研究机构之一,位于印度马哈拉施特拉邦的孟买市。该校提供广泛的本科、研究生和博士课程,尤其在工程、科学和技术领域享有盛誉。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)