北京大学 本次发布的数据集 ProactiveBench, ProactiveBench是一个全面的基准测试平台,用于评估视频大型语言模型在进行主动交互时的能力。该数据集涵盖了各种视频主题,包括网络视频、第一人称记录、电视剧和监控录像,并整合了多种输入模态,如文本、视频和语音。ProactiveBench旨在促进主动交互研究,其设计考虑到了视频播放过程中模型响应的时间动态性。此外,还提出了PAUC(Proactive Area Under Curve)这一新的评估指标,用于更好地捕捉主动交互系统的性能。
关于 北京大学 , 北京大学是中国著名的高等学府,成立于1898年,是中国最早成立的现代大学之一。它位于中国首都北京,是一所综合性、研究型大学,拥有多个学科领域的研究所和实验室。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)