香港科技大学本次发布的数据集LongTVQA, LongTVQA+,LongTVQA和LongTVQA+是由香港科技大学研究团队构建的长视频问答数据集,基于TVQA/TVQA+扩展而来,旨在评估模型在剧集级长视频中的理解和推理能力。该数据集包含从电视剧中提取的长视频片段,涉及多模态信息(如视觉帧、字幕和对话线索),数据量未明确提及但覆盖小时级视频内容。其构建过程通过聚合现有数据集并扩展时间维度实现,专注于解决长视频中稀疏分布信息的细粒度时序推理问题,为多智能体框架提供严格的测试基准。
关于香港科技大学,香港科技大学(HKUST)是一所位于中国香港的国际化研究型大学,以其在科学研究和创新教育领域的卓越表现而闻名。
关于arXiv,arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)