新加坡国立大学本次发布的数据集RefVIE,RefVIE是由新加坡国立大学Show Lab团队构建的大规模指令-参考视频编辑数据集,包含47.7万条高质量四元组样本。该数据集通过自动化流水线从370万原始样本中筛选生成,涵盖局部对象修改和背景替换两大任务类型,视频时长集中在80-110帧以保持时序连贯性。数据生成过程分为四阶段:源数据聚合过滤、目标区域定位分割、参考图像合成(基于Qwen-VL和SAM3模型)以及质量控制去重。作为首个开源的参考引导视频编辑数据集,RefVIE旨在解决现有方法因视觉参考数据稀缺导致的精确控制难题,推动可控视频生成技术的发展。
关于新加坡国立大学,新加坡国立大学(National University of Singapore,简称NUS)是新加坡首屈一指的世界级顶尖大学,在国际上享有盛誉。该校成立于1905年,是亚洲排名最高的大学之一,提供广泛的学科教育和研究机会。
关于arXiv,arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)