中国人民大学 本次发布的数据集 Audio-Visual Unified Instruction-tuning dataset with Explicit reasoning process (AV-UIE), AV-UIE数据集是由中国人民大学高灵人工智能学院构建的一个音视频统一指令微调数据集,通过明确的推理过程来澄清任务间的合作关系。该数据集是对现有音视频任务数据集的增强,将简单的标签转化为包含丰富时空信息的明确推理过程,便于模型建立任务间的联系。数据集涵盖了多种任务,如音频事件定位、视频解析、音频参照图像定位、音频视觉问题回答、音频视觉分割等,以促进音视频场景理解的统一模型训练。
查看Audio-Visual Unified Instruction-tuning dataset with Explicit reasoning process (AV-UIE)
README 内容:
关于 中国人民大学 , 中国人民大学是中国一所综合性研究型大学,成立于1937年,前身是陕北公学,后经过多次变迁和合并,形成了今天的规模。该校是一所以人文社会科学为主,兼有部分理工学科的著名高校,其高灵人工智能学院专注于人工智能领域的研究与教育。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)