香港大学本次发布的数据集SpatialEdit-500k,SpatialEdit-500k是由香港大学、JD Explore Academy等机构联合构建的大规模合成数据集,专为细粒度图像空间编辑任务设计。该数据集通过可控的Blender管线生成,包含多样化的背景和系统化相机轨迹渲染的物体图像,提供物体旋转、平移、缩放及相机视角变换的精确标注数据。数据生成过程融合了GLB资产渲染、VLM验证、SAM3分割及背景生成技术,覆盖室内外场景和八种标准物体视角。其核心应用是解决生成模型在几何驱动编辑(如相机控制、物体位姿调整)中的精度不足问题,为3D感知的图像编辑提供训练与评估基础。
关于香港大学,香港大学是香港历史最悠久的高等教育机构,成立于1911年,是一所位于香港的公立研究型大学,以其卓越的学术研究和教学质量在国际上享有盛誉。
关于arXiv,全球最大的预印本学术论文数据库,涵盖物理、数学、计算机科学等多个学科领域。





_1769672084863.jpg)