北京师范大学 本次发布的数据集 OmniDiff, OmniDiff是一个包含324个复杂现实世界和3D合成场景的高质量数据集,涵盖了12种不同的变化类型,每种变化都伴有精细的人类注释,平均描述长度为60个词。数据集通过现场摄影、网络爬虫和3D渲染相结合的方式收集,既包括室内外各种日常环境的变化对,也利用Blender模拟真实世界的变化。数据集的构建分为两个主要阶段:变化对收集和差异描述收集,以确保数据集的全面性和准确性。该数据集旨在用于图像差异描述任务,以解决环境监测和监控系统中精确描述视觉差异的需求。
关于 北京师范大学 , 北京师范大学是中国的一所著名综合性大学,位于北京市,始建于1902年,是中国历史上第一所师范大学。学校以教育学、心理学、中国语言文学等学科见长,培养了大批教育人才和社会科学研究人才。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)