香港中文大学MMLab 本次发布的数据集 Dense Instruction Dataset, Dense Instruction Dataset是由香港中文大学MMLab和英伟达等机构创建的一个密集指令数据集,旨在支持流式视频交互模型的训练。该数据集包含51,000条指令-答案对,每对都带有时间戳,模拟了流式视频交互的动态变化。数据集的创建过程结合了现有的密集字幕数据集,并通过启发式方法为每个词分配时间戳,确保模型在训练时能够模拟真实的流式交互场景。该数据集主要应用于流式视频交互领域,旨在提升大模态模型在动态视频环境中的交互能力和响应准确性。
关于 香港中文大学MMLab , 香港中文大学MMLab是香港中文大学下属的一个研究实验室,专注于计算机视觉和机器学习领域的研究。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)