随着AIGC技术向三维领域延伸,3D内容生成、三维语义编辑正在成为元宇宙、数字孪生、游戏文创、工业设计等多个产业的核心技术支撑,但长期以来,该领域始终面临高质量配对监督数据稀缺的痛点:现有公开3D数据集普遍存在语义标注颗粒度粗、编辑前后数据一致性差、覆盖编辑场景有限等问题,极大限制了前馈式三维编辑模型的训练效果与落地速度。
2026年5月27日,南洋理工大学联合清华大学研究团队在arXiv平台首发Pxform大规模三维编辑数据集,面向语义部件变换的监督学习场景打造,为行业提供了标注精度更高、覆盖场景更全的训练数据底座。
据介绍,Pxform数据集共包含102,007个训练对和1,497个测试对,所有数据均源自11,273个经过严格筛选的高质量源网格,覆盖七大主流三维编辑类型:添加、删除、局部替换、局部缩放、局部颜色变化、局部材质变化和全局风格转换,基本覆盖了民用、工业级3D编辑的绝大多数高频需求。区别于传统人工标注的3D数据集,Pxform采用智能体辅助的部件语义数据引擎构建,所有编辑操作直接锚定在源网格的语义部件上,既可以实现编辑位置的精确定位,也能严格保留未修改区域的原始结构与属性,解决了传统数据集编辑前后语义对齐度低、未修改区域易出现偏差的通病。该数据集研发的核心目标正是破解三维编辑领域高质量配对监督数据缺乏的行业共性问题,为训练前馈式三维编辑模型提供结构一致、语义连贯的基础数据,推动可扩展三维内容创作技术的发展。
从应用价值来看,Pxform数据集可直接用于三维语义编辑、三维内容生成领域的模型训练,基于该数据集训练的前馈式三维编辑模型,可支撑多场景的3D内容高效生产:在游戏文创领域,可实现3D角色、场景资产的快速局部修改,大幅降低美术团队的重复劳动量,提升定制化内容生产效率;在元宇宙场景中,可支撑普通用户对虚拟形象、数字空间的自主编辑需求,降低3D内容创作的技术门槛;在数字孪生与工业设计领域,可实现建筑外立面、工业设备零部件、消费电子产品外观的快速迭代,无需重新构建完整三维模型即可完成多版本方案的快速生成与对比。
作为当前3D内容生成领域少有的高颗粒度语义编辑配对数据集,Pxform的发布填补了行业细分领域的供给空白,对推动三维AIGC技术的商业化落地、完善垂直领域AI训练数据集供给体系、助力数字内容产业高质量发展均具有重要意义。





_1769672084863.jpg)