北京人工智能研究院本次发布的数据集TransPhy3D,TransPhy3D是由北京人工智能研究院等机构联合创建的首个透明物体合成视频数据集,包含1.1万段高质量渲染视频(总计132万帧)。该数据集通过Blender/Cycles物理引擎渲染生成,整合了574个静态资产和参数化生成的3D模型,搭配玻璃/塑料/金属等材质库,采用基于物理的光线追踪和OptiX降噪技术生成RGB+深度+法线多模态数据。数据集通过程序化场景构建和动态相机轨迹采样,模拟了复杂的光学现象(折射/反射/透射)。主要应用于透明物体深度估计、机器人抓取等计算机视觉任务,旨在解决透明物体在传统深度感知中的物理歧义问题。
关于arXiv,arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。





_1769672084863.jpg)